Noul chatbot AI „Jais” din Emiratele Arabe Unite se adresează vorbitorilor de arabă

Noul chatbot AI „Jais” din Emiratele Arabe Unite se adresează vorbitorilor de arabă

O echipă de academicieni, cercetători și ingineri din Emiratele Arabe Unite (UAE) a dezvăluit un nou chatbot generativ de inteligență artificială numit „Jais” pentru a se adresa în mod special persoanelor care vorbesc limba arabă din întreaga lume, potrivit CNN.

Echipa susține că arabă, al șaselea cel mai vorbit limba din lume, cu aproximativ 272 de milioane de vorbitori, a fost „subreprezentată în AI mainstream”. Ei speră să pună capăt dominației englezei în instruirea sistemelor AI cunoscute sub numele de modele de limbaj mari (LLM).

Chatbot-ul Jais AI se concentrează pe Orientul Mijlociu

Problema limbajului în IA este o preocupare la nivel mondial. Japonia a renunțat recent la engleză, deoarece țara își construiește propria versiune a ChatGPT. Cercetători a spus în timp ce chatbot-ul OpenAI excelează în limba engleză, deseori este insuficient în limba japoneză „din cauza diferențelor în sistemul alfabetic, a datelor limitate și a altor factori”.

Jais poartă numele unui munte din Emiratele Arabe Unite, CNN raportează spune și poate îndeplini sarcini la comandă, cum ar fi scrierea de poezii, la fel ca Chat GPT sau Google Bard, dar la scară limitată. Inteligența artificială este antrenată pe 13 miliarde de parametri de date, un lucru departe în comparație cu cei aproape 3.5 de miliarde de parametri ai ChatGPT 175, o măsură a dimensiunii unui model de limbaj mare, dar nu a acurateței acestuia.

Există planuri de a extinde setul de date al lui Jais la 30 de miliarde de parametri și de a-i permite să citească imagini și grafice în loc de doar text, potrivit Timothy Baldwin, profesor de procesare a limbajului natural la Universitatea de Inteligență Artificială Mohamed bin Zayed din Abu Dhabi (MBZUAI).

Universitatea a colaborat cu Cerebras Systems și Inception din Silicon Valley, o filială a firmei de IA G42 din Emiratele Arabe Unite, pentru a crea Jais. Baldwin a spus că, deși LLM-urile rivale, cum ar fi LLaMA de la Meta și GPT-ul OpenAI, pot înțelege limba arabă, ei sunt instruiți în principal pe date online în limba engleză.

Pentru Jais, instruirea a implicat o combinație de seturi de date în engleză și arabă, dar cu un accent deliberat pe conținutul din Orientul Mijlociu, unde araba este vorbită și scrisă pe scară largă.

Baldwin a spus că o astfel de concentrare permite chatbot-ului AI să meargă dincolo de „ceea ce altcineva a fost capabil să realizeze pentru arabă”.

Potrivit MBZUAI, pregătirea unică a lui Jais ajută chatbot-ul „să înțeleagă nuanțele culturale și dialectele”, făcându-l mai util pentru o gamă largă de industrii diferite. Dezvoltatorii au pus modelul la dispoziția publicului în sursă deschisă, ceea ce înseamnă că oricine îl poate personaliza.

UAE's New AI Chatbot 'Jais' Caters to Arabic Speakers PlatoBlockchain Data Intelligence. Vertical Search. Ai.

UAE's New AI Chatbot 'Jais' Caters to Arabic Speakers PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Comutarea între dialecte

Baldwin a declarat pentru CNN că formarea diversă a datelor lui Jais îi va permite să comute între dialectele din arabă standard modernă, care este folosită pentru documentele oficiale și scrierea formală, și dialectele locale care sunt de obicei folosite pe bloguri sau rețelele sociale.

„Cu siguranță există loc de îmbunătățire acolo, dar accentul s-a pus mai mult pe robustețea în ceea ce privește capacitatea de a înțelege dacă avem intrări mai informale la model”, a spus el.

La fel ca alți chatbot generativi AI, Jais este construit pentru a rezista solicitărilor care creează „toxice sau nocive” răspunsuri, a spus Baldwin, și nu va răspunde la întrebările care „duc la autovătămare sau sugerează dependență”. Subiecte precum homosexualitatea sunt în afara limitelor, în conformitate cu credințele musulmane.

De asemenea, se va citi: Dependența ChatGPT de „limba engleză” a forțat Japonia să-și creeze propriul Chatbot AI

Potrivit lui Mohammed Soliman, director de tehnologii strategice și program de securitate cibernetică la Institutul Orientului Mijlociu din Washington, DC, limbile bazate pe alfabet latin, cum ar fi engleza domina internetul, ceea ce înseamnă că seturile de date sunt cele mai mari în acele limbi.

„Facerea accesului la instrumentele AI exclusiv pentru cei care pot vorbi anumite limbi ar putea împiedica secțiuni transversale dezavantajate ale societăților să profite de beneficiile AI”, a spus el.

„[Aceste LLM-uri] nu sunt conștienți de alte culturi, afectând negativ experiența utilizatorului pentru oameni de diverse medii”, a adăugat Soliman, după cum a raportat CNN.

Emiratele Arabe Unite au făcut progrese semnificative în dezvoltarea sistemelor AI generative. Emiratul a fost prima țară din lume care a numit un ministru al AI în 2017. De asemenea, se laudă cu cel mai mare model AI generativ din regiune, Falcon, care a fost lansat de Consiliul de Cercetare în Tehnologie Avansată din Abu Dhabi și Institutul de Inovare Tehnologică (TII) în martie.

Timestamp-ul:

Mai mult de la MetaNews