צ'אטבוט ה-AI החדש של איחוד האמירויות "Jais" נותן מענה לדוברי ערבית

צ'אטבוט ה-AI החדש של איחוד האמירויות "Jais" נותן מענה לדוברי ערבית

צוות של אקדמאים, חוקרים ומהנדסים באיחוד האמירויות הערביות (איחוד האמירויות הערביות) חשף צ'טבוט חדש של בינה מלאכותית בשם 'Jais' כדי לספק מענה ספציפית לאנשים הדוברים את השפה הערבית ברחבי העולם, לפי CNN.

הצוות טוען כי ערבית, השישית המדוברת ביותר השפה בעולם עם כ-272 מיליון דוברים, "זכתה לייצוג נמוך ב-AI המיינסטרים". הם מקווים לשים קץ לדומיננטיות של האנגלית באימון מערכות בינה מלאכותית הידועות בשם מודלים של שפה גדולה (LLM).

צ'טבוט של Jais AI מתמקד במזרח התיכון

סוגיית השפה ב-AI היא דאגה עולמית. יפן נטשה לאחרונה את האנגלית כשהמדינה בונה גרסה משלה של ChatGPT. חוקרים אמר בעוד שהצ'אטבוט של OpenAI מצטיין באנגלית, הוא נופל לעתים קרובות ביפנית "בשל הבדלים במערכת האלפבית, נתונים מוגבלים וגורמים אחרים".

ג'ייס נקרא על שם הר באיחוד האמירויות, ה-CNN לדווח אומר, ויכול לבצע משימות לפי פקודה, כמו כתיבת שירים, בדיוק כמו ChatGPT או של גוגל מְשׁוֹרֵר, אך בהיקף מוגבל. הבינה המלאכותית מאומנת על 13 מיליארד פרמטרים של נתונים, די הרבה בהשוואה לכמעט 3.5 מיליארד פרמטרים של ChatGPT 175, מדד לגודל של מודל שפה גדול, אבל לא לדיוק שלו.

יש תוכניות להרחיב את מערך הנתונים של Jais ל-30 מיליארד פרמטרים ולאפשר לו לקרוא תמונות וגרפים במקום רק טקסט, לפי טימותי בולדווין, פרופסור לעיבוד שפה טבעית באוניברסיטת מוחמד בן זאיד לבינה מלאכותית (MBZUAI) באבו דאבי.

האוניברסיטה עבדה עם Cerebras Systems and Inception של עמק הסיליקון, חברה בת של חברת הבינה המלאכותית G42, שבסיסה באיחוד האמירויות הערביות, כדי ליצור את Jais. בולדווין אמר שבעוד שמנהלי לימודים יריבים כמו LLaMA של Meta ו-GPT של OpenAI יכולים להבין ערבית, הם מאומנים בעיקר על נתונים מקוונים באנגלית.

עבור Jais, ההכשרה כללה שילוב של מערכי נתונים באנגלית וערבית כאחד, אך עם התמקדות מכוונת בתכנים מהמזרח התיכון, שבו ערבית מדוברת וכתובה באופן נרחב.

בולדווין אמר שהתמקדות כזו מאפשרת לצ'טבוט הבינה המלאכותית לחרוג מ"מה שכל אחד אחר הצליח להשיג בערבית".

לפי MBZUAI, ההכשרה הייחודית של Jais עוזרת לצ'אטבוט 'להבין ניואנסים ודיאלקטים תרבותיים', מה שהופך אותו לשימושי יותר עבור מגוון רחב של תעשיות שונות. מפתחים הפכו את המודל לזמין לציבור בקוד פתוח, כלומר כל אחד יכול להתאים אותו.

צ'טבוט הבינה המלאכותית החדש של איחוד האמירויות "Jais" נותן מענה לדוברי ערבית PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

צ'טבוט הבינה המלאכותית החדש של איחוד האמירויות "Jais" נותן מענה לדוברי ערבית PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

מעבר בין דיאלקטים

בולדווין אמר ל-CNN שהכשרת הנתונים המגוונים של ג'איס תאפשר לו לעבור בין ניבים של ערבית סטנדרטית מודרנית, המשמשת למסמכים רשמיים ולכתיבה פורמלית, לבין ניבים מקומיים המשמשים בדרך כלל בבלוגים או במדיה חברתית.

"אין ספק שיש מקום לשיפור שם, אבל ההתמקדות הייתה יותר בחוסן מבחינת היכולת להבין אם יש לנו יותר תשומות לא פורמליות למודל", אמר.

כמו צ'אטבוטים אחרים של AI, Jais בנוי להתנגד להנחיות שיוצרות "רעיל או מזיק" תשובות, אמר בולדווין, ולא יגיב לשאלות ש"מובילות לפגיעה עצמית או מרמזות על התמכרות". נושאים כמו הומוסקסואליות הם מחוץ לתחום, בהתאם לאמונות המוסלמיות.

גם לקרוא: התלות של ChatGPT ב'שפה האנגלית' אילצה את יפן ליצור צ'טבוט AI משלה

לדברי מוחמד סולימן, מנהל טכנולוגיות אסטרטגיות ותוכנית אבטחת סייבר במכון המזרח התיכון בוושינגטון הבירה, שפות מבוססות אלפבית לטיני כמו אנגלית לשלוט האינטרנט, כלומר מערכי נתונים הם הגדולים ביותר בשפות אלו.

"הפיכת גישה לכלי בינה מלאכותית בלעדית למי שיכול לדבר שפות ספציפיות יכולה למנוע מחתכים מוחלשים של חברות לקצור את היתרונות של בינה מלאכותית", אמר.

"[למוסדות הלימוד הללו] חסרים מודעות לתרבויות אחרות, מה שמשפיע לרעה על חווית המשתמש עבור אנשים עם רקע מגוון", הוסיף סולימן, כפי שדווח ב-CNN.

איחוד האמירויות עשתה צעדים משמעותיים בפיתוח מערכות בינה מלאכותית. האמירות הייתה המדינה הראשונה בעולם שמינתה א שר בינה מלאכותית ב-2017. על פי הדיווחים הוא גם מתהדר במודל הבינה המלאכותית הגנרטיבית הגדולה ביותר באזור, Falcon, אשר שוחרר על ידי מועצת המחקר לטכנולוגיה מתקדמת של אבו דאבי והמכון לחדשנות טכנולוגית (TII) במרץ.

בול זמן:

עוד מ מטא ניוז