
التعرّف الذكي على الكتابة العربية المخطوطة هو امتداد متطوّر لتقنية التعرّف الضوئي على الحروف (OCR)، لكنه امتداد يواجه مستوى أعلى من التعقيد بسبب خصوصيات المخطوط العربي وطبيعته التاريخية والبصرية.
فالكتابة المخطوطة تشترك مع الكتابة العربية المطبوعة في اتصال الأحرف وتغيّر شكل الحرف بحسب موقعه من الكلمة، غير أنّها تمتاز بدرجة كبيرة من الفرادة؛ إذ تتبدّل أنماطها باختلاف العصور، وتتنوّع بحسب البيئات الجغرافية، وتظهر فيها الفروق الفردية بين النسّاخ بوضوح، إلى جانب اختلاف أنواع الأحبار والورق وأساليب النسخ.
وتزداد هذه الخصوصية تعقيدًا مع تشابك الكلمات والأسطر، وعدم انتظام المسافات، ووجود تداخلات بين الكتل النصية مثل الهوامش والتعليقات والحواشي، وهي سمات تجعل المخطوط بنية بصرية مركّبة لا يمكن التعامل معها بمنطق النص المطبوع.
لكن، هل يمكن تحويل هذا التعقيد من عائق إلى مفتاح؟
الجزء القادم نتابع الرحلة من الورق إلى الخوارزميات.
