كشف فريق من الأكاديميين والباحثين والمهندسين في دولة الإمارات العربية المتحدة عن روبوت محادثة جديد يعمل بالذكاء الاصطناعي يسمى "Jais" لتلبية احتياجات الأشخاص الذين يتحدثون اللغة العربية حول العالم على وجه التحديد، وفقًا لشبكة CNN.
ويرى الفريق أن اللغة العربية هي السادسة الأكثر تحدثا اللغة في العالم مع حوالي 272 مليون متحدث، كانت "ممثلة تمثيلاً ناقصًا في الذكاء الاصطناعي السائد". إنهم يأملون في إنهاء هيمنة اللغة الإنجليزية في تدريب أنظمة الذكاء الاصطناعي المعروفة باسم نماذج اللغة الكبيرة (LLMs).
يركز Jais AI chatbot على الشرق الأوسط
تعد مشكلة اللغة في الذكاء الاصطناعي مصدر قلق عالمي. تخلت اليابان مؤخرًا عن اللغة الإنجليزية حيث قامت البلاد ببناء نسختها الخاصة من ChatGPT. الباحثون محمد وفي حين يتفوق برنامج الدردشة الآلي الخاص بشركة OpenAI في اللغة الإنجليزية، فإنه غالبًا ما يتفوق في اللغة اليابانية "بسبب الاختلافات في نظام الأبجدية، والبيانات المحدودة، وعوامل أخرى".
تم تسمية جيس على اسم جبل في الإمارات العربية المتحدة، سي إن إن تقرير يقول، ويمكنه أداء المهام عند الطلب، مثل كتابة القصائد، تمامًا مثل شات جي بي تي أو جوجل الشاعر، ولكن على نطاق محدود. يتم تدريب الذكاء الاصطناعي على 13 مليار معلمة من البيانات، وهو رقم بعيد جدًا مقارنة بما يقرب من 3.5 مليار معلمة في ChatGPT 175، وهو مقياس لحجم نموذج لغة كبير، ولكن ليس دقته.
هناك خطط لتوسيع مجموعة بيانات Jais إلى 30 مليار معلمة وتمكينها من قراءة الصور والرسوم البيانية بدلاً من النص فقط، وفقًا لتيموثي بالدوين، أستاذ معالجة اللغة الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي في أبو ظبي (MBZUAI).
وعملت الجامعة مع شركة Cerebras Systems and Inception في وادي السيليكون، وهي شركة تابعة لشركة الذكاء الاصطناعي G42 ومقرها الإمارات العربية المتحدة، لإنشاء Jais. وقال بالدوين إنه في حين أن شركات LLM المنافسة مثل Meta’s LLaMA وOpenAI’s GPT يمكنها فهم اللغة العربية، إلا أنها مدربة في الغالب على البيانات الإنجليزية عبر الإنترنت.
بالنسبة لجيس، تضمن التدريب مزيجًا من مجموعات البيانات باللغتين الإنجليزية والعربية، ولكن مع التركيز المتعمد على المحتوى من الشرق الأوسط، حيث يتم التحدث والكتابة باللغة العربية على نطاق واسع.
وقال بالدوين إن مثل هذا التركيز يسمح لروبوت الدردشة المدعم بالذكاء الاصطناعي بتجاوز "ما تمكن أي شخص آخر من تحقيقه باللغة العربية".
ووفقاً لـ MBZUAI، فإن التدريب الفريد الذي يقدمه Jais يساعد روبوت الدردشة على "فهم الفروق الثقافية واللهجات الدقيقة"، مما يجعله أكثر فائدة لمجموعة واسعة من الصناعات المختلفة. جعل المطورون النموذج متاحًا للجمهور كمصدر مفتوح، مما يعني أنه يمكن لأي شخص تخصيصه.
التبديل بين اللهجات
وقال بالدوين لشبكة CNN إن تدريب جيس المتنوع على البيانات سيمكنه من التبديل بين لهجات اللغة العربية الفصحى الحديثة، والتي تستخدم في الوثائق الرسمية والكتابة الرسمية، واللهجات المحلية التي تستخدم عادة في المدونات أو وسائل التواصل الاجتماعي.
وقال: "هناك بالتأكيد مجال للتحسين هناك، ولكن التركيز كان أكثر على المتانة من حيث القدرة على فهم ما إذا كان لدينا المزيد من المدخلات غير الرسمية للنموذج".
مثل روبوتات الدردشة الأخرى التي تعمل بالذكاء الاصطناعي، تم تصميم Jais لمقاومة المطالبات التي تنشئ "سامة أو ضارة" وقال بالدوين إنه لن يجيب على الأسئلة التي "تؤدي إلى إيذاء النفس أو توحي بالإدمان". موضوعات مثل المثلية الجنسية هي خارج الحدود، وذلك تمشيا مع المعتقدات الإسلامية.
وفقاً لمحمد سليمان، مدير التقنيات الاستراتيجية وبرنامج الأمن السيبراني في معهد الشرق الأوسط في واشنطن العاصمة، فإن اللغات القائمة على الأبجدية اللاتينية مثل الإنجليزية سيطر الإنترنت، مما يعني أن مجموعات البيانات هي الأكبر في تلك اللغات.
وقال: "إن جعل الوصول إلى أدوات الذكاء الاصطناعي حصريًا لأولئك الذين يمكنهم التحدث بلغات معينة يمكن أن يمنع القطاعات المحرومة من المجتمعات من جني فوائد الذكاء الاصطناعي".
وأضاف سليمان، بحسب ما أوردته شبكة CNN: "[هؤلاء الحاصلون على ماجستير إدارة الأعمال] يفتقرون إلى الوعي بالثقافات الأخرى، مما يؤثر سلبًا على تجربة المستخدم للأشخاص من خلفيات متنوعة".
قطعت دولة الإمارات العربية المتحدة خطوات كبيرة في تطوير أنظمة الذكاء الاصطناعي التوليدية. وكانت الإمارة أول دولة في العالم تعين أ وزير منظمة العفو الدولية في عام 2017. ويقال إنها تفتخر أيضًا بأكبر نموذج توليدي للذكاء الاصطناعي في المنطقة، وهو Falcon، والذي أصدره مجلس أبحاث التكنولوجيا المتقدمة في أبو ظبي ومعهد الابتكار التكنولوجي (TII) في مارس.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://metanews.com/uaes-new-ai-chatbot-jais-caters-to-arabic-speakers-challenging-english-bias/
- :لديها
- :يكون
- :ليس
- :أين
- 13
- 2017
- 30
- 7
- a
- ماهرون
- أكاديميون
- الوصول
- وفقا
- دقة
- التأهيل
- وأضاف
- متقدم
- تكنولوجيا متقدمة
- سلبا
- تؤثر
- بعد
- AI
- منظمة العفو الدولية chatbot
- أنظمة الذكاء الاصطناعي
- يسمح
- Alphabet
- أيضا
- و
- الأجوبة
- أي شخص
- عربي
- العربيّة المُتحدة
- العربية
- هي
- يجادل
- حول
- مصطنع
- الذكاء الاصطناعي
- AS
- At
- متاح
- وعي
- خلفيات
- كان
- يجري
- المعتقدات
- الفوائد
- ما بين
- Beyond
- مليار
- BIN
- المدونة
- تفتخر
- على حد سواء
- حدود
- يبني
- بنيت
- لكن
- by
- تسمى
- CAN
- تلبية
- يلبي
- بالتأكيد
- chatbot
- chatbots
- شات جي بي تي
- وكالة المخابرات المركزية
- سي ان ان
- مجموعة
- مقارنة
- قلق
- محتوى
- استطاع
- مجلس
- البلد
- خلق
- ثقافي
- تصميم
- الانترنت
- الأمن الإلكتروني
- البيانات
- قواعد البيانات
- dc
- اعتماد
- المطورين
- تطوير
- الخلافات
- مختلف
- مدير المدارس
- عدة
- do
- وثائق
- هيمنة
- الشرق
- آخر
- الإمارة
- الإمارات
- تمكين
- النهاية
- المهندسين
- انجليزي
- حصري
- وسع
- الخبره في مجال الغطس
- العوامل
- شلالات
- بعيدا
- لعبة Far Cry
- شركة
- الاسم الأول
- تركز
- ويركز
- في حالة
- رسمي
- تبدأ من
- توليدي
- الذكاء الاصطناعي التوليدي
- Go
- جوجل
- الرسوم البيانية
- يملك
- he
- يساعد
- مرتفع
- أمل
- HTML
- HTTPS
- if
- صور
- تحسين
- in
- بداية
- الصناعات
- غير رسمي
- الابتكار
- المدخلات
- بدلًا من ذلك
- معهد
- رؤيتنا
- Internet
- المشاركة
- قضية
- IT
- انها
- اليابان
- اليابانيّة
- JPG
- م
- معروف
- نقص
- لغة
- اللغات
- كبير
- أكبر
- لاتيني
- مثل
- محدود
- خط
- اللاما نوع من الجمال
- محلي
- صنع
- التيار
- القيام ب
- مارس
- ماكس العرض
- معنى
- قياس
- الوسائط
- وسط
- الشرق الأوسط
- مليون
- نموذج
- عارضات ازياء
- تقدم
- محمد
- محمد
- الأكثر من ذلك
- جبل
- عين
- طبيعي
- معالجة اللغات الطبيعية
- الطبيعة
- قرب
- جديد
- تظليل
- of
- رسمي
- غالبا
- on
- online
- جاكيت
- المصدر المفتوح
- or
- أخرى
- خارج
- الخاصة
- المعلمات
- مجتمع
- نفذ
- خطط
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- في الغالب
- منع
- معالجة
- البروفيسور
- البرنامج
- جمهور
- الاستفسارات
- نطاق
- عرض
- جني
- مؤخرا
- صدر
- وذكرت
- بحث
- الباحثين
- الرد
- منافس
- متانة
- غرفة
- s
- قال
- يقول
- حجم
- أمن
- قصير
- هام
- السيليكون
- سادس
- المقاس
- العدالة
- وسائل التواصل الاجتماعي
- مصدر
- تحدث
- مكبرات الصوت
- محدد
- على وجه التحديد
- تحدث
- معيار
- إستراتيجي
- خطوات
- شركة فرعية
- هذه
- مفاتيح
- نظام
- أنظمة
- المهام
- فريق
- التكنولوجيا
- تكنولوجيا
- تكنولوجيا الابتكار
- سياسة الحجب وتقييد الوصول
- نص
- أن
- •
- العالم
- هناك.
- تشبه
- هم
- هؤلاء
- إلى
- قال
- أدوات
- المواضيع
- متدرب
- قادة الإيمان
- الامارات
- فهم
- فريد من نوعه
- متحد
- العربية المتحدة
- الإمارات العربية المتحدة
- جامعة
- كشف النقاب
- مستعمل
- مستخدم
- تجربة المستخدم
- عادة
- الإصدار
- وكان
- واشنطن
- we
- التي
- في حين
- من الذى
- واسع
- مدى واسع
- على نحو واسع
- سوف
- مع
- عمل
- العالم
- في جميع أنحاء العالم
- جاري الكتابة
- مكتوب
- زايد
- زفيرنت