تواصل جامعة محمد بن زايد للذكاء الاصطناعي، أول جامعة للدراسات العليا المتخصِّصة في بحوث الذكاء الاصطناعي، ترسيخ مكانتها العالمية بنشر مجموعة من البحوث بوتيرة سريعة تجعلها من المؤسَّسات الرائدة في مجالها.
ونشر الباحثون في الجامعة، وهم أكثر من 80 عضواً من هيئتها التدريسية و200 باحثٍ ومئات الطلاب، ما يزيد على 300 ورقة بحثية في مجلات الذكاء الاصطناعي ومؤتمراته منذ بداية عام 2024 وحتى نهاية شهر يونيو منه. وشمل ذلك نشر 39 ورقة بحثية في «المؤتمر الدولي حول تمثيلات التعلُّم 2024» الذي عُقِد في شهر مايو 2024.
وفي عام 2023، نشرت الجامعة 612 ورقة بحثية في المؤتمرات العالمية، منها 30 ورقة في «المؤتمر الدولي حول الرؤية الحاسوبية»، و34 ورقة بحثية في «مؤتمر الرؤية الحاسوبية والتعرُّف إلى الأنماط»، التابع لـ«معهد مهندسي الكهرباء والإلكترونيات» و«مؤسَّسة الرؤية الحاسوبية»، و44 ورقة بحثية في «مؤتمر الأساليب التجريبية في معالجة اللغات الطبيعية»، و53 ورقة بحثية في «مؤتمر نُظُم معالجة المعلومات العصبية».
يُذكَر أنَّ جامعة محمد بن زايد للذكاء الاصطناعي أصبحت بعد خمسة أعوام من تأسيسها من أفضل 100 جامعة في العالم في علوم الحاسوب، ومن أفضل 20 جامعة في العالم في مجالات الذكاء الاصطناعي والرؤية الحاسوبية وتعلُّم الآلة ومعالجة اللغات الطبيعية وعلم الروبوتات، وفق تصنيف مؤسَّسة CSRankings.
وشملت الأوراق البحثية الخمس، التي نشرها باحثون في جامعة محمد بن زايد للذكاء الاصطناعي خلال الأشهر الستة الماضية، تعاون الباحثين في الجامعة مع نظراء لهم في العالم لتطوير سلسلة من الموارد التي تُسهم في التعرُّف على النصوص التي تولِّدها النماذج اللغوية الكبيرة، ما يؤثِّر عميقاً في قطاعات متعددة تشمل الصحافة والأوساط الأكاديمية والتعليم. يُشار إلى أنَّ الأبحاث في هذا المجال كانت محصورة في لغة واحدة أو لغتين، وتستخدم برنامجاً واحداً لتوليد النصوص، أو تنظر في موضوع واحدٍ فقط مثل الأخبار، أو في استخدامٍ واحدٍ مثل تلخيص النصوص. ونجح الباحثون في الجامعةفي تصميم أداة تحليلية تحمل اسم «إم 4» تشمل لغات ونماذج لغوية كبيرة متعددة ومجالات مختلفة، ما يسهم في تعزيز القدرة على التعرُّف على النصوص التي تولِّدها الآلة. وتشكِّل مجموعة البيانات المرتبطة بهذا البحث قاعدة أساسية تنطلق منها البحوث المستقبلية لتطوير نهج أفضل وأقوى لمواجهة التحديات الاجتماعية الملّحة التي قد تطرحها النصوص التي تولِّدها النماذج اللغوية الكبيرة.
وحصدت الورقة البحثية، التي نُشِرَت تحت عنوان «إم 4: التعرُّف على النصوص التي تولِّدها الآلة باستخدام أنظمة الصندوق الأسود التي تشمل أدوات توليد ومجالات ولغات متعددة»، جائزة أفضل ورقة بحثية مرجعية في «مؤتمر الفرع الأوروبي لجمعية اللغويات الحاسوبية 2024» الذي عُقِد في شهر مارس 2024.
وتعاون البروفيسور كون زانغ، نائب رئيس قسم تعلُّم الآلة، الأستاذ في قسم تعلُّم الآلة، مدير إدارة مركز الذكاء الاصطناعي التكاملي في جامعة محمد بن زايد للذكاء الاصطناعي، مع غانغشو ليو، الطالب الذي أشرف على مسيرته في برنامج الدكتوراه، وعددٍ من الباحثين من أفضل الجامعات الأمريكية، لتطوير نموذج يُسهم في تحسين دقة الإجراءات التي تتيح تحديد تسلسل الجينات والتحليلات الناتجة عنها. وقد يُسهم هذا البحث في تعزيز فهمنا لبعض الأمراض، وتحسين العلاجات المتوافرة لها، وتعزيز نتائجها.
وتمثِّل الشبكاتُ الجينيةُ التنظيميةُ العلاقةَ السببيةَ التي تحكم أنشطة الجينات في الخلايا، وتكمن أهميتها في فهم العمليات الحيوية في جسم الإنسان والأمراض التي قد تصيبه. وتُظهِر الشبكات الجينية التنظيمية عند دراستها مشكلة شائعة وهي حالات غياب القيمة، أو القيم الصفرية، في بيانات تسلسل الحمض النووي الريبوزي. وقد تنتج هذه القيم الصفرية عن غياب فعلي للبيانات، ما يعكس غياب الأنشطة الجينية، أو غياب خاطئ للبيانات ينتج عن عملية تحديد التسلسل. ولحلِّ هذه المشكلة، اقترح الباحثون في الورقة البحثية التي نشروها تحت عنوان «استدلال الشبكات الجينية التنظيمية في حالات غياب القيمة: منظور سببي» نموذجاً سببياً جديداً لغياب القيمة يرسم صورة أوضح وأدق من خلال التركيز على البيانات، باستثناء الصفرية منها، أثناء اختبار العلاقات بين الجينات. وقد قُدِّمَت هذه الورقة البحثية إلى المؤتمر الدولي حول تمثيلات التعلُّم، حيث شكَّلت محطةً بارزةً في إنجازات الأبحاث الجينية.
وتعاون وليام دي فازيليس، أحد طلاب الدفعة الأولى من خريجي برنامج الدكتوراه في جامعة محمد بن زايد للذكاء الاصطناعي، مع أحد أعضاء الهيئة التدريسية في الجامعة وطالب آخر من طلاب الدكتوراه، لتطوير خوارزميات قد تتمكَّن من تعزيز كفاءة تدريب النماذج التي تعتمد على «العتبة الصلبة»، مثل الخوارزميات التي يشيع استخدامها في علوم البيانات والإحصاءات. وقد نشر الباحثون ورقة بحثية حملت عنوان «رؤى جديدة حول خفض التباين في العتبة الصلبة من الرتبة الصفرية: نقل الخطأ في التدرُّج والتناقضات في التوسُّع»، اقترحوا من خلالها نهجاً جديداً لتقليص عدد الأخطاء عند تدريب النماذج، من خلال تحسين إدارة التباين، ما يسمح بالتوصُّل إلى نتائج موثوقة أكثر وبسرعة أكبر. ونُشِرَت الورقة البحثية في المؤتمر الدولي حول تمثيلات التعلُّم 2024.
وقاد باحثون من جامعة محمد بن زايد للذكاء الاصطناعي فريقاً عالمياً عمل على تطوير نموذج لغوي بصري متقدِّم يحمل اسم «جلام إم» ويدعم التفاعل عالي الموثوقية بين النصوص والصور. ويمتلك هذا النموذج القدرة على توليد استجابات لغوية طبيعية ترتبط بالأجسام التي تَرِد في الصور على مستوى البكسل، ما يُحسِّن الشرح الآلي للصور والاستدلال والقدرة على تبديل الأجسام فيها.
ويذكر الباحثون في ورقتهم البحثية «جلام إم: نموذج كبير متعدد الوسائط على مستوى البكسل» كيفية تدريبهم للنموذج بشكلٍ يسمح للمستخدم بالتفاعل معه من خلال التعليمات النصية والبصرية، لتوليد استجابات لغوية طبيعية تترابط بسلاسة مع الأقنعة التي تقسِّم الأجسام التي تظهر أمامها. وأنشأ الباحثون مجموعة بيانات جديدة، بهدف اختبار هذا النموذج، تضمَّنت ملايين التعليقات على الصور. إضافة إلى ذلك، تعزِّز قدرات النموذج المتقدِّمة فاعلية الذكاء الاصطناعي وبديهيته عند إنجاز مهام محدَّدة، مثل توليد المحادثات المكيّفة وفق السياق، والتعبير بناءً على العبارات المقسَّمة، وتسمية الصور والمناطق، والمحادثات اللغوية المبنيَّة على الرؤية.
ويمكن الاستفادة من هذا النموذج في العديد من القطاعات، مثل التجارة الإلكترونية والأزياء والمدن الآمنة والذكية وتجارة التجزئة المنزلية. ونُشر هذا البحث في «مؤتمر الرؤية الحاسوبية» والتعرُّف على الأنماط لعام 2024 الذي عُقِدَ في شهر يونيو 2024 في سياتل، وهو أهم فعالية علمية في مجال الهندسة وعلوم الحاسوب في العالم. واقتُبِسَت هذه الورقة البحثية أكثر من 50 مرة حتى الآن، وحصلت على 600 نجمة على منصة تطوير البرمجيات «غيت هاب».
وتعاون الدكتور شياودان ليانغ والبروفيسور شياوجون شانغ، الأستاذان في قسم الرؤية الحاسوبية في جامعة محمد بن زايد للذكاء الاصطناعي، مع نظراء لهما في العالم لتطوير تقنية جديدة تُعزِّز فاعلية محوّلات الرؤية، التي تُعدُّ عنصراً أساسياً في معظم النماذج الحديثة لتحليل الصور ومقاطع الفيديو. وكان عنوان الورقة البحثية التي أعدَّها الأستاذان: «الشبكة العصبية ذات المستقبلات متعددة الطبقات هي متعلّم متحوّل جيِّد»، وخلُصت إلى أنه يمكن استبدال بعض الطبقات في المحوّل بطبقات أكثر تبسيطاً من الشبكة العصبية ذات المستقبلات متعددة الطبقات. ويساعد هذا التغيير، الذي يرتكز على مقياس للعشوائية يُعرَف باسم «الإنتروبي»، على الحفاظ على أداء النموذج باستخدام نماذج أصغر بكثير. وتسهم هذه الطريقة الجديدة في تسهيل تدريب نماذج الذكاء الاصطناعي وتعزيز فاعليتها، ما قد يؤدي إلى تطوير تقنيات ذات أداء أسرع، وتتطلَّب موارد أقل.