برامج حرة للتحليل الصرفي في اللغة العربية

نشره زايد في

إن القدرة على التحليل الصرفي في اللغة العربية من الخطوات الأساسية التي ستجعل معالجة اللغة أمر ممكنا لذا تبرز الحاجة لمثل هذه المشاريع ، ومن المهم أنها تكون مفتوحة المصدر حتى لا تضيع مع الوقت ، أم الأهم هي أن تكون مشاريع حرة مفتوحة للجميع للمشاركة بدون تعقيدات قانونية أو تقنية أو مؤسساتية.

برنامج الخليل الصرفي

وكما يقال ما حك جلدك مثل ظفرك، لذا نجد أن هناك محاولات جادة لبناء محلل صرفي عربي حر ، أول المشاريع هي برنامج الخليل الصرفي الذي طُوِّر بواسطة مدينة الملك عبدالعزيز للعلوم والتقنية بالتعاون مع المنظمة العربية للتربية والثقافة والعلوم وجامعة محمد الأول بالمغرب.

وقد أطلقت الإصدارة الثانية من هذا المحلل ، وقد جاء في الإعلان " "برنامج الخليل الصرفي" (الإصدار الثاني) وهو نظام حاسوبي مفتوح المصدر يقوم بتحليل الكلمات العربية إلى مكوناتها الأساسية كالجذر والساق والسوابق واللواحق وتعريف كل منها بطريقة خوارزمية.
 
النظام يعد الأول من نوعه من حيث كونه مفتوح المصدر بعد النظام الشهير "Buckwalter" الواسع الاستخدام في المراكز البحثية لكونه مفتوح المصدر إلا أن النظام الحالي يزيد عليه في كونه قادر على إضافة مستوى أعمق من التحليل وذلك باستخراج الجذر والوزن من ساق الكلمة."

البرنامج مكتوب بلغة جافا بحيث يعمل على عدة منصات بسهولة. يمكنكم تنزيله من هنا.

المحلل الصرفي

المشروع الثاني هو المحلل الصرفي المعتمد على مكتبة تاشفين للتجذيع الخفيف.

مكتبة تاشفين للتجذيع الخفيف مكتوبة بلغة بايثون البرمجية ، و هي تقوم بالتالي:
- تجذيع الكلمة العربية.
- استخراج الجذر .
- تقطيع الكلمة إلى جميع الحالات الممكنة.
- تنميط الكلمة.
- قائمة مسبقة للزوائد وحروف الزيادة.
- إمكانية تعديل قوائم الزوائد.

ويمكن تجربة المحلل الصرفي الذي أطلقه الأستاذ طه زروقي من هنا. ، هذا المحلل يعتمد على أدوات عدة وهي:

 - قطرب لتصريف الأفعال.
 - تاشفين المحلل الصرفي الخفيف.
 -مكتبة بايثون العربية pyarabic .
 - قائمة الكلمات المستبعدة.
 - مشروع أدوات.