القاهرية
العالم بين يديك

الذكاء الاصطناعي مدخل للقضاء على اللغة العربية

493

القاهرية
إن لم تنهض اللغة العربية الآن كي تواجه التحدي الذي يفرضه عليها الذكاء الاصطناعي التوليدي، فالأرجح أن تسقط في ظلام الخروج من الزمن، خصوصاً أنها الآن تقارب العيش خارج التاريخ المعاصر للعلوم اللغوية الحديثة في الغرب.
ولتستكمل الصدمة بأن اللغة العربية تحتاج إلى فتح أبواب الاشتغال عليها كي يدخل منها علماء الرياضيات من المتخصصين في المعلوماتية، بغية إحداث ثورة، أبسط الأمثلة عليها أن تصنع كتب حديثة عن قواعد اللغة العربية، فتكون سطورها محملة بمعادلات الرياضيات الحديثة، مما يسهل أمام خبراء المعلوماتية صوغها في خوارزميات متخصصة بألسنيات الكمبيوتر.
ولعله مؤلم القول إن شيئاً يشبه لذلك الفريق المتخيل، كان ليظهر لو أن المشتغلين على اللغة العربية تابعوا ما بدأه نحاة من قماشة عبدالقاهر الجرجاني في مؤلفه المعروف “العوامل المئة”، وكذلك نظريته عن نظم الكلام، والخليل بن أحمد الفراهيدي الذي كاد يسبق الزمن في كتابه “معجم العين”. وعاش الجرجاني في القرن الـ11 والفراهيدي في القرن الثامن. ولعلها محطة أخرى من الانطباع السلبي (إذ لا يخلو من عنصرية مضمرة أو معلنة) المعروف بأن شيئاً ما قد توقف في التطور الأساس للحضارة العربية الإسلامية منذ القرن الـ14.
لماذا الجرجاني والفراهيدي؟ لعل من تابع الظهور الانفجاري لظاهرة الذكاء الاصطناعي التوليدي، لا يسعه سوى التأمل في اللغة، من ثم محاولة تلمس السبيل، للمقارنة بين ذكاء الآلات التوليدي وبين أحوال لسان الضاد.
ومثلاً، حينما انعقدت “القمة العالمية عن الذكاء الاصطناعي للصالح العام” Global Summit on AI for Common Good التي استضافتها جنيف في يوليو (تموز) 2023، ظهرت مقالة علمية كتبها المتخصص في المعلوماتية في صحيفة “نيويورك بوست” الأميركية تضمنت خلاصة مكثفة تفيد بأن الذكاء الاصطناعي التوليدي يمثل أقصى ما توصل إليه ذكاء الكمبيوتر [خصوصاً ثلاثية الشبكات العصبية الإلكترونية ورصد الأنماط وملاحظة الارتباطات]، مع العلوم اللغوية الحديثة، أي علم الـ”سيميولوجيا” (علم العلامات) Semiology وفروعه في علوم الدلالية “سيمانتكس” Semantics والتداولية “براغماتيكس” Pragmatics و”سينتاكس” Syntax، إضافة إلى مراجع نظرية عن كيفية وضع ملخصات للنصوص من نوع كتاب “إعادة الصياغة” Paraphrase من تأليف العالم دزيدريوس إراسيموس في عام 1548. واستطرداً، لا يوجد في علوم لسان الضاد ما يوازي كتاب إراسيموس، ولكن هناك كتباً تعليمية ومدرسية كثيرة تقدم وسائل لصنع ملخصات، مع غياب تنظيم نظري منهاجي لغوي لذلك الأمر.
أبعد من ذلك، لم تلتقط علوم اللغة العربية الخط التطوري الذي أوصل علوم اللغة والألسنيات في الغرب إلى صيغة علم الـ”سيميولوجيا”، بمعنى دراسة اللغة بوصفها بنيات منسوجة في معادلات رياضية تتناول الإشارات والرموز وارتباطاتها مع النصوص، وما تتضمنه من معان وسياقات وخطابات ومضامين. وتدرس الدلالية (سيمانتكس) معنى الكلمات في الجمل استناداً إلى معادلات رياضية تمكنها من ربط التشيكلات اللغوية المختلفة مع مدلولاتها ومحمولاتها من التمثلات العقلية.
واستناداً إلى علم الدلالية، تتعامل التداولية (براغماتيكس) بمساندة من معادلات رياضية، مع طريقة استخدام اللغة في المجتمعات وكيفية تطور معاني الكلمات مع الزمن، وكذلك كيف تكتسب الجمل معانيها من خلال الاستخدام الاجتماعي والزماني. من ثم تمكن العلوم الدلالية ومعادلاتها الرياضية من إدراك كيفية فهم العبارات بالنسبة إلى أصحاب لغة معينة، وتطور ذلك عبر الزمن. وقد أضاف نعوم تشومسكي إلى ذلك نظرية علم القواعد التوليدي Generative Grammar المتعلق بقدرة البشر كلهم، وعبر الأزمنة، على توليد اللغات المختلفة واستعمالها، على رغم التفاوتات الواسعة بينها.
ويتناول علم الـ”سينتاكس” اللغة بوصفها منظومة إشارات صرفة، تتبع تنظيماً خاصاً بها في صناعة الكلمات والجمل، وكذلك ينظم منطق تراكيبها في معادلات رياضية. ومن البين أن ال”سينتاكس” يمثل مرحلة التطور الرياضية الصرفة في علوم القواعد والنحو والصرف وغيرها من علوم اللغة المعروفة لدى اللغويين العرب.
واستناداً إلى تلك التقنيات والعلوم اللغوية، إضافة إلى أدوات أخرى على غرار إعادة الصياغة، درب العلماء الآلات أيضاً على صنع قوالب أو هياكل أو تمثيلات أولية، كي تتمكن من صنع نصوصها الخاصة، بالأحرى إعادة صياغة واختزال وتكثيف للنصوص الموجودة في مليارات الكتب والمطبوعات والمنشورات، كي تولد قوالب تستند إليها حينما تعطي أجوبة عن الأسئلة التي توجه إليها. إذاً، يجري تدريب الآلات في البداية على النصوص الفصيحة المضبوطة كي تصنع قوالبها وتمثيلاتها عن اللغة، ثم تعرض للعامية كي تلاحظ الفوارق فلا تعود تمنعها من الاستمرار في “التقاط” المعاني.
يعطي ذلك الوصف السابق كله تفسيراً لمعنى صنع “النماذج اللغوية الأساسية الكبيرة” Basic Large Language Models التي تعتبر الهيكل الأساس لنموذج “جي بي تي”، ويؤمل أن يستطيع العرب التوصل إلى صوغ نموذج مماثل عن لغتهم.
لعل الكلمات السابقة لم توضح كفاية على رغم إلحاحها، على الدور الهائل للغة في التطور المعلوماتي المتمثل بالذكاء الاصطناعي التوليدي. لنتأمل في اسم التقنية الجديدة “جي بي تي” GPT الذي يختصر عبارة “المحول التوليدي المسبق التدريب” (Generative Pre Trained Transformer). وتشير كلمة “توليدي” إلى ما يشبه إعادة لصياغة النصوص، ويتضمن ذلك صنع نص جديد يلخصها ويحافظ على أسلوبها ونسقها وترابطاتها.
وفي الغرب، أنجز علماء اللغة خلال سبعينيات القرن الـ20 وثمانينياته، تحولاً ضخماً في دراسة اللغة عبر إدماجها مع الرياضيات، ونقلها إلى مرحلة الـ”سيمولوجيا” ومكوناتها المتعددة التي تفوق، بالطبع، ما ورد في السطور السابقة

قد يعجبك ايضا
تعليقات