استعمال الزوائد المتوسطة والمزدوجة في المدققات الإملائية
بقلم : طه زروقي
تعتمد معظم المدققات الإملائية والمحللات الصرفية للغات الطبيعية على استخراج السوابق واللواحق، لكن بعض اللغات تعتمد على أنواع أخرى من التغيرات التي تطرأ على الكلمة تسمى الزوائد المتوسطة infixes و الزوائد المزدوجة circumfix.
هذا الموضوع يهم اللغة العربية، لاعتمادها على التغيرات التي تطرأ على وسط الكلمة أي ما يسمى الإعلال والإبدال. كما تعتمد على الزوائد المزدوجة أي لزوم سابقة معينة للاحقة بعينها. هذه الخاصيتان توجد في بعض اللغات الأخرى.
و سنتناول في هذه الورقة عرضا عن محاولة دعم خاصية الزائدة المتوسطة و الزائدة المزدوجة وإغفال التشكيل والتطويل في برنامجي التدقيق الإملائي aspell و Hunspell مفتوحي المصدر.

الكلمات الأساسية: التدقيق الإملائي، المصدر المفتوح، اللغة العربية، البرمجة، الزوائد المتوسطة والمزدوجة، إغفال التشكيل.
الهدف من المشروع
إنشاء قاموس في اللغة العربية يعمل مع المدققات الإملائية
برمجة دعم عربي في المدقق الإملائي ; Aspell و hunspell
تعاريف
تعريف Aspell
GNU aspell أسبل غنو، مدقق إملائي وريث لبرنامج Ispell، يمكن استعماله كبرنامج مستقل أو مكتبة حيوية لبرامج أخرى، ويتميز بكونه برنامجا متعدد اللغات، ويعمل على الكثير من الأنظمة، ويدعم الاتصال بالعديد من البرامج .
•ومن بين مزاياه :
- كونه مفتوح المصدر
- سهولة صياغة ملف الزوائد.
- يدعم العديد من اللغات والتطبيقات.
- يمكنه التعلم من أخطاء المستخدمين.
- يمكن استعماله كمكتبة برمجية حيوية لتطبيقات أخرى.
- يمكنه استعمال عدة قواميس في الوقت نفسه.
- يدعم الكلمات المركبة.
- استخدام الترميز العالمي الموحد اليونيكود.
- إمكانية ضغط القواميس الضخمة.
- يدعم تدقيق العديد من أنواع الملفات HTML, TeX, txt.
- يدعم تركيب العديد من السوابق واللواحق .
تعريف هانسبال Hunspell
•المدقق الإملائي هانسبال هو البرنامج المطور الذي يلي برنامج Myspell،
•تم تحسينه من أجل دعم مزايا إضافية من أجل اللغات الأوربية،
• لا سيما اللغة المجرية hungarian التي طور من أجلها بصفتها لغة المبرمج الأصلي،
•وكذلك لغات أخرى كالألمانية والتركية
• كما قمت شخصيا بتطوير مزايا جديدة من أجل العربية، فقد تم إدماج خاصية إغفال الحركات في البرنامج في الإصدار 1.1.5.
•يتميز هانسبال بـ:
- كونه مفتوح المصدر
- استخدام الترميز العالمي الموحد اليونيكود.
- سهولة صياغة ملف الزوائد و ثرائها.
- كونه المدقق الإملائي الافتراضي لطقم الأوبن أوفيس المكتبي مفتوح المصدر .
- يمكن استعماله كمدقق افتراضي لعدة برامج .
- يدعم خاصية التلازم الشرطي للسوابق باللواحق.
- كونه يعمل حاليا على وضع أسس للتحليل الصرفي
تابعوا العرض التقديمي من هنا.
|
|
|
التعليقات
جهد طيب لللأخ
جهد طيب لللأخ طه و بالفعل فإن للغة العربية خصائص كثيرة تميزها عن باقي اللغات لذلك يتطلب الأمر جهداً مضاعفا لبناء قواميسهاو تحليلها رقمياً فمن أهم خواص اللغة العربية كونها اشتقاقية مما يمكن من وضع قواعد لتوليد الكلمات بشكل تلقائي و هناك مشروع الترميز للغة العربية و ذلك بإضافتها إلى سلاسل الترميز و هو مشروع غض ما زال ضمن البحث و يشرف عليه الأخ حامد السحلي و يمكن بمراسلته تبادل الكثير من الأفكار و هو قد التقى العديد من أساتذة اللغة و المبرمجين و أظن أن لديه ما يمكن الإستفادة منه.
موقع مشروع ترميز http://sourceforge.net/projects/tarmeez/
Senior Application Developer