لوغارتميات ذكية تخرج المخطوطات العربية من مجاهل النسيان

تطبيق تونسي يسمح بواسطة الذكاء الاصناعي بالتعرف بدقة عالية على الحروف في المخطوطات القديمة، ثم تحويلها إلى نص قابل للتعديل.

تونس -  "لا حاجة لنسخ المخطوطات يدويا. استخدم زنكي وحوّل مخطوطاتك إلى نص مرقون قابل للتعديل والبحث في بعض الخطوات"، هكذا يقدم مهندسون تونسيون تطبيقهم الذي يعمل بالذكاء الاصطناعي على التعرف بدقة عالية على الحروف في المخطوطات العربية القديمة، ثم تحويلها إلى نص قابل للتعديل.

والتطبيق الذي تتيح ايضا القيام بالبحث داخل الوثائق العربية المخطوطة، وأرشيف المطبوعات العربية القديمة التي لا تتعرف عليها وسائل المعالجة الأخرى، تم اطلاقه مؤخرا بصفة تجريبية تحت اسم "زنكي" على شكل منصة وهو الأول من نوعه التي يمكن استعماله ذاتيا من المستخدمين.

ويعول على هذا الانجاز في إخراج ثروة من ملايين المخطوطات العربية القديمة إلى النور، بعد أن ظلّت حبيسة المكتبات المتخصصة لقرون عدة حكرًا على الباحثين

وتمثّل المخطوطات التاريخية التي أنتجتها الحضارة العربية الإسلامية طوال قرون ازدهارها ثروة لا تقدّر بثمن. وتشير بعض التقديرات إلى وجود ما لا يقل عن 3 ملايين مخطوط عربي في المكتبات المتخصصة المنتشرة في مختلف مناطق العالم. وقد ظلّ الوصول إليها مقصورًا على الباحثين والمتخصصين في مجال المخطوطات، لذلك لم تشمل جهود تحقيقها وطباعتها سوى بضعة آلاف منها

وبدأت فكرة التطبيق عام 2018 بهدف "البحث عن كيفية خدمة اللغة العربية باستخدام الذكاء الصناعي"، كما يقول المهندس الدكتور فراس بن عبيد المدير التنفيذي للشركة الناشئة "ريفمبر" (Revampr)، التي قامت بتطوير التطبيق، مضيفًا أن "الفكرة تبلورت فيما بعد في مشروع استخدام تقنيات التعرف البصري على الأحرف، لتحويل المخطوطات إلى نصوص قابلة للمعالجة والتعديل".

البحث عن كيفية خدمة اللغة العربية باستخدام الذكاء الصناعي

والمشروع عبارة عن منصة أُطلق عليها اسم "زنكي دوت إيه إي" وتحتوي على محرك بحث في المخطوطات العربية والمستندات المصورة.

ويقوم المحرك بإنجاز جميع مراحل معالجة المخطوطات باستخدام الذكاء الصناعي.

وتبدأ العملية بمرحلة المعالجة الأولية للمستند لتحسين جودة الصورة، تليها مرحلة المعالجة التي تشمل تجزئة الوثيقة، وكشف التخطيط وتقسيم الأسطر وتحديد الكلمات، ثم التعرف الضوئي على الحروف.

وفي المرحلة الأخيرة يعالج "زنكي" اللغة ويحلل النص ويضبطه ضبطًا دقيقا، ثم يقوم محرك البحث باكتشاف موضوع الوثيقة واستخلاص المعلومات المفيدة منها وتصنيفها. كما يقوم بالتعرف على الأعلام والتصحيح الآلي للنص، ووضع الفهرسة إلى جانب التخريج الآلي للآيات والأحاديث والأشعار.

ويكفي المستخدم تحميل المخطوط أو الوثيقة على الموقع ليتم معالجتها بدقة عالية والحصول على نص قابل للتعديل. وعند تعديل النص، تقوم المنصة بدورها بإعادة استخدام البيانات الجديدة في تحسين جودة المعالجة وزيادة دقة التحويل، فيما يُعرف بالتعلم العميق.

وبدعمها لجميع الخطوط الشرقية والمغربية القديمة منها والحديثة، توفر المنصة حلولًا فعّالة للمؤسسات والباحثين تمكّنهم من التحويل الآلي للوثائق العربية بشكل دقيق وسريع، وبأقل وقت وجهد ممكن.

كما تتميز المنصة -أيضًا- بقدرتها على التعرف على الأحرف العربية في الوثائق القديمة المطبوعة بالطريقة الحجرية، وتحويلها إلى نص قابل للتعديل. هذا إلى جانب التعرف على الأحرف المطبوعة المكتوبة ببعض الخطوط العربية؛ مثل: الخط الفاسي، والتي عجزت الوسائل المتوفرة حاليًا على معالجتها.