צוות של אקדמאים, חוקרים ומהנדסים באיחוד האמירויות הערביות (איחוד האמירויות הערביות) חשף צ'טבוט חדש של בינה מלאכותית בשם 'Jais' כדי לספק מענה ספציפית לאנשים הדוברים את השפה הערבית ברחבי העולם, לפי CNN.
הצוות טוען כי ערבית, השישית המדוברת ביותר השפה בעולם עם כ-272 מיליון דוברים, "זכתה לייצוג נמוך ב-AI המיינסטרים". הם מקווים לשים קץ לדומיננטיות של האנגלית באימון מערכות בינה מלאכותית הידועות בשם מודלים של שפה גדולה (LLM).
צ'טבוט של Jais AI מתמקד במזרח התיכון
סוגיית השפה ב-AI היא דאגה עולמית. יפן נטשה לאחרונה את האנגלית כשהמדינה בונה גרסה משלה של ChatGPT. חוקרים אמר בעוד שהצ'אטבוט של OpenAI מצטיין באנגלית, הוא נופל לעתים קרובות ביפנית "בשל הבדלים במערכת האלפבית, נתונים מוגבלים וגורמים אחרים".
ג'ייס נקרא על שם הר באיחוד האמירויות, ה-CNN לדווח אומר, ויכול לבצע משימות לפי פקודה, כמו כתיבת שירים, בדיוק כמו ChatGPT או של גוגל מְשׁוֹרֵר, אך בהיקף מוגבל. הבינה המלאכותית מאומנת על 13 מיליארד פרמטרים של נתונים, די הרבה בהשוואה לכמעט 3.5 מיליארד פרמטרים של ChatGPT 175, מדד לגודל של מודל שפה גדול, אבל לא לדיוק שלו.
יש תוכניות להרחיב את מערך הנתונים של Jais ל-30 מיליארד פרמטרים ולאפשר לו לקרוא תמונות וגרפים במקום רק טקסט, לפי טימותי בולדווין, פרופסור לעיבוד שפה טבעית באוניברסיטת מוחמד בן זאיד לבינה מלאכותית (MBZUAI) באבו דאבי.
האוניברסיטה עבדה עם Cerebras Systems and Inception של עמק הסיליקון, חברה בת של חברת הבינה המלאכותית G42, שבסיסה באיחוד האמירויות הערביות, כדי ליצור את Jais. בולדווין אמר שבעוד שמנהלי לימודים יריבים כמו LLaMA של Meta ו-GPT של OpenAI יכולים להבין ערבית, הם מאומנים בעיקר על נתונים מקוונים באנגלית.
עבור Jais, ההכשרה כללה שילוב של מערכי נתונים באנגלית וערבית כאחד, אך עם התמקדות מכוונת בתכנים מהמזרח התיכון, שבו ערבית מדוברת וכתובה באופן נרחב.
בולדווין אמר שהתמקדות כזו מאפשרת לצ'טבוט הבינה המלאכותית לחרוג מ"מה שכל אחד אחר הצליח להשיג בערבית".
לפי MBZUAI, ההכשרה הייחודית של Jais עוזרת לצ'אטבוט 'להבין ניואנסים ודיאלקטים תרבותיים', מה שהופך אותו לשימושי יותר עבור מגוון רחב של תעשיות שונות. מפתחים הפכו את המודל לזמין לציבור בקוד פתוח, כלומר כל אחד יכול להתאים אותו.
מעבר בין דיאלקטים
בולדווין אמר ל-CNN שהכשרת הנתונים המגוונים של ג'איס תאפשר לו לעבור בין ניבים של ערבית סטנדרטית מודרנית, המשמשת למסמכים רשמיים ולכתיבה פורמלית, לבין ניבים מקומיים המשמשים בדרך כלל בבלוגים או במדיה חברתית.
"אין ספק שיש מקום לשיפור שם, אבל ההתמקדות הייתה יותר בחוסן מבחינת היכולת להבין אם יש לנו יותר תשומות לא פורמליות למודל", אמר.
כמו צ'אטבוטים אחרים של AI, Jais בנוי להתנגד להנחיות שיוצרות "רעיל או מזיק" תשובות, אמר בולדווין, ולא יגיב לשאלות ש"מובילות לפגיעה עצמית או מרמזות על התמכרות". נושאים כמו הומוסקסואליות הם מחוץ לתחום, בהתאם לאמונות המוסלמיות.
גם לקרוא: התלות של ChatGPT ב'שפה האנגלית' אילצה את יפן ליצור צ'טבוט AI משלה
לדברי מוחמד סולימן, מנהל טכנולוגיות אסטרטגיות ותוכנית אבטחת סייבר במכון המזרח התיכון בוושינגטון הבירה, שפות מבוססות אלפבית לטיני כמו אנגלית לשלוט האינטרנט, כלומר מערכי נתונים הם הגדולים ביותר בשפות אלו.
"הפיכת גישה לכלי בינה מלאכותית בלעדית למי שיכול לדבר שפות ספציפיות יכולה למנוע מחתכים מוחלשים של חברות לקצור את היתרונות של בינה מלאכותית", אמר.
"[למוסדות הלימוד הללו] חסרים מודעות לתרבויות אחרות, מה שמשפיע לרעה על חווית המשתמש עבור אנשים עם רקע מגוון", הוסיף סולימן, כפי שדווח ב-CNN.
איחוד האמירויות עשתה צעדים משמעותיים בפיתוח מערכות בינה מלאכותית. האמירות הייתה המדינה הראשונה בעולם שמינתה א שר בינה מלאכותית ב-2017. על פי הדיווחים הוא גם מתהדר במודל הבינה המלאכותית הגנרטיבית הגדולה ביותר באזור, Falcon, אשר שוחרר על ידי מועצת המחקר לטכנולוגיה מתקדמת של אבו דאבי והמכון לחדשנות טכנולוגית (TII) במרץ.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- מקור: https://metanews.com/uaes-new-ai-chatbot-jais-caters-to-arabic-speakers-challenging-english-bias/
- :יש ל
- :הוא
- :לֹא
- :איפה
- 13
- 2017
- 30
- 7
- a
- יכול
- אקדמאים
- גישה
- פי
- דיוק
- להשיג
- הוסיף
- מתקדם
- טכנולוגיה מתקדמת
- באופן שלילי
- משפיע
- לאחר
- AI
- צ 'אט AI
- מערכות AI
- מאפשר
- אלפבית
- גם
- ו
- תשובות
- כל אחד
- ערבי
- איחוד האמירויות
- ערבית
- ARE
- מתווכח
- סביב
- מלאכותי
- בינה מלאכותית
- AS
- At
- זמין
- מודעות
- רקע
- היה
- להיות
- אמונות
- הטבות
- בֵּין
- מעבר
- B
- BIN
- בלוגים
- מתגאה
- שניהם
- גבולות
- בונה
- נבנה
- אבל
- by
- נקרא
- CAN
- לספק
- מספקת
- בהחלט
- chatbot
- chatbots
- ChatGPT
- ה-CIA
- CNN
- שילוב
- לעומת
- דְאָגָה
- תוכן
- יכול
- המועצה
- מדינה
- לִיצוֹר
- תרבותי
- אישית
- סייבר
- אבטחת סייבר
- נתונים
- מערכי נתונים
- dc
- תלות
- מפתחים
- מתפתח
- ההבדלים
- אחר
- מְנַהֵל
- שונה
- do
- מסמכים
- שליטה
- מזרח
- אחר
- Emirates
- נסיכויות
- לאפשר
- סוף
- מהנדסים
- אנגלית
- בלעדי
- לְהַרְחִיב
- ניסיון
- גורמים
- פולס
- רחוק
- Far Cry
- פירמה
- ראשון
- להתמקד
- מתמקד
- בעד
- רִשְׁמִי
- החל מ-
- גנרטטיבית
- AI Generative
- Go
- גוגל
- גרפים
- יש
- he
- עוזר
- גָבוֹהַ
- מקווה
- HTML
- HTTPS
- if
- תמונות
- השבחה
- in
- הַתחָלָה
- תעשיות
- לא פורמלי
- חדשנות
- תשומות
- במקום
- מכון
- מוֹדִיעִין
- אינטרנט
- מעורב
- סוגיה
- IT
- שֶׁלָה
- יפן
- יפני
- jpg
- רק
- ידוע
- חוסר
- שפה
- שפות
- גָדוֹל
- הגדול ביותר
- הלטינית
- כמו
- מוגבל
- קו
- לאמה
- מקומי
- עשוי
- זרם מרכזי
- עשייה
- צעדה
- max-width
- משמעות
- למדוד
- מדיה
- אמצע
- המזרח התיכון
- מִילִיוֹן
- מודל
- מודלים
- מודרני
- מוחמד
- מוחמד
- יותר
- הַר
- שם
- טבעי
- עיבוד שפה טבעית
- טבע
- ליד
- חדש
- ניואנסים
- of
- רשמי
- לעתים קרובות
- on
- באינטרנט
- לפתוח
- קוד פתוח
- or
- אחר
- הַחוּצָה
- שֶׁלוֹ
- פרמטרים
- אֲנָשִׁים
- לְבַצֵעַ
- תוכניות
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- בעיקר
- למנוע
- תהליך
- פרופסור
- תָכְנִית
- ציבורי
- שאילתות
- רכס
- חומר עיוני
- קְצִיר
- לאחרונה
- שוחרר
- דווח
- מחקר
- חוקרים
- להגיב
- יריב
- איתנות
- חֶדֶר
- s
- אמר
- אומר
- סולם
- אבטחה
- קצר
- משמעותי
- סיליקון
- ו
- מידה
- חֶברָתִי
- מדיה חברתית
- מָקוֹר
- לדבר
- רמקולים
- ספציפי
- במיוחד
- דיבר
- תֶקֶן
- אסטרטגי
- צעדים
- חברת בת
- כזה
- מתג
- מערכת
- מערכות
- משימות
- נבחרת
- טכנולוגיות
- טכנולוגיה
- טכנולוגיה חדשנות
- מונחים
- טֶקסט
- זֶה
- השמיים
- העולם
- שם.
- אלה
- הֵם
- אלה
- ל
- אמר לי
- כלים
- נושאים
- מְאוּמָן
- הדרכה
- איחוד האמירויות הערביות
- להבין
- ייחודי
- מאוחד
- איחוד הערבים
- איחוד האמירויות הערביות
- אוניברסיטה
- חשף
- מְשׁוּמָשׁ
- משתמש
- חוויית משתמש
- בְּדֶרֶך כְּלַל
- גרסה
- היה
- וושינגטון
- we
- אשר
- בזמן
- מי
- רָחָב
- טווח רחב
- באופן נרחב
- יצטרך
- עם
- עבד
- עוֹלָם
- עולמי
- כתיבה
- כתוב
- זאייד
- זפירנט