Thursday, July 1, 2010

تحليل قوقل للنصوص العربية

بسم الله الرحمن الرحيم
اثناء استخدامي لخدمة الترجمة لقوقل من اللغة الانجليزية الى اللغة العربية لاحظت ان نتائج الترجمة مكونة من قسمين قسم النتيجة العامة وهي نص الترجمة باللغة العربية والنتيجة الثانية وهي ايضا نص الترجمة ولكن بحروف لاتنينة.
في الحقيقة كان الامر غريب لماذا هناك نتيجة اخرى للترجمة وهل هي بلغة مختلفة. الحروف كانت غريبة وليست انجليزية وحاولت ان اعرفها او قراءتها ووجدتها انها اقرب للعربية من ناحية النطق ولكنها ليست عربية واقرب للنجليزية
المهم قررت ان استخدم احدى خدمات قوقل لمعرفة نوع الحروف وكان ذلك سهل باستخدام نفس الخدمة خدمة الترجمة حيث بها خدمة معرفة اللغة دون تحديدها الى اللغة التي تريدها وكانت النتيجة ان الحروف كانت حروف لاتينية.
هذا الخطاء البرمجي ليس بسبب قوقل بل برنامج
No Script
في النهاية توصلت ان السبب يمكن من اجل تحليل النص العربي خاصة بطريقة استبدال الحرف العربي + حركة تشكيل الحرف بحرف لاتيني واحد فيسهل لهم تشكيل الحروف العربية وفهم النص لقواعد البرمجة
حيث اني قد استخدمت في مشروع تخرجي للثانوية العامة بدل الحروف الاتينية مصفوفة لمدى ثلاثة اعمدة لحرف والتشكيل الاول والتشكيل الثانية في حالة وجود تنوين
وقاعدة خاصة للحروف المشدودة لتكوين حرفين احدهما ساكن من اجل نقط الكلمة العربية بلفظ عربي صحيح.

اتمنى من المبرمجين العرب الاستفادة من هذه المعلومة لتطوير برنامج تشكيل مفتوح المصدر وليست حكر لشركة غرير عربية وخاصة اننا نعتز كثير بهذه اللغة المقدسة لغة القرآن.

منتظر تعليقاتكم