Az Egyesült Arab Emírségek új AI Chatbotja, a „Jais” az arabul beszélőket szolgálja ki

Az Egyesült Arab Emírségek új AI Chatbotja, a „Jais” az arabul beszélőket szolgálja ki

A CNN szerint az Egyesült Arab Emírségekben (EAE) akadémikusokból, kutatókból és mérnökökből álló csapat bemutatta a „Jais” nevű új, generatív mesterséges intelligencia chatbotot, amely kifejezetten az arab nyelvet beszélő embereket szolgálja ki szerte a világon.

A csapat azzal érvel, hogy az arab, a hatodik legtöbbet beszélt A mintegy 272 millió beszélővel rendelkező nyelv a világon „alulreprezentált a mainstream MI-ben”. Azt remélik, hogy véget vetnek az angol dominanciájának a nagy nyelvi modellekként (LLM) ismert mesterséges intelligencia-rendszerek képzésében.

A Jais AI chatbot a Közel-Keletre összpontosít

A mesterséges intelligencia nyelvi problémája világszerte aggodalomra ad okot. Japán a közelmúltban lemondott az angol nyelvről, mivel az ország elkészíti a ChatGPT saját verzióját. Kutatók mondott Míg az OpenAI chatbotja angolul remekel, addig a japán nyelvben gyakran alulmarad „az ábécé rendszerbeli különbségei, a korlátozott adatok és egyéb tényezők miatt”.

Jais nevét az Egyesült Arab Emírségekben található hegyről, a CNN-ről kapta jelentést mondja, és parancsra tud feladatokat végrehajtani, például verseket írni, akárcsak ChatGPT vagy a Google-é Dalnok, de korlátozott mértékben. Az AI 13 milliárd adatparaméterre van kiképezve, ami messze van a ChatGPT 3.5 közel 175 milliárd paraméteréhez képest, ami egy nagy nyelvi modell méretének mérőszáma, de nem a pontossága.

Timothy Baldwin, az Abu-Dzabi Mohamed bin Zayed Mesterséges Intelligencia Egyetem (MBZUAI) természetes nyelvi feldolgozás professzora szerint a tervek szerint Jais adatkészletét 30 milliárd paraméterre bővítik, és lehetővé teszik a képek és grafikonok olvasását a szöveg helyett.

Az egyetem a Szilícium-völgyi Cerebras Systems and Inception vállalattal, az Egyesült Arab Emírségekben működő G42 mesterséges intelligencia cég leányvállalatával dolgozott együtt a Jais létrehozásában. Baldwin elmondta, hogy bár a rivális LLM-ek, mint a Meta LLaMA és az OpenAI GPT, tudnak arabul, túlnyomórészt az online angol adatokon tanulnak.

Jais számára a képzés az angol és az arab adatkészletek kombinációját is magában foglalta, de szándékosan a Közel-Keletről származó tartalomra összpontosított, ahol az arab nyelvet széles körben beszélik és írják.

Baldwin szerint egy ilyen fókusz lehetővé teszi az AI chatbot számára, hogy túllépjen azon, „amit bárki más elért az arab nyelven”.

Az MBZUAI szerint a Jais egyedülálló képzése segít a chatbotnak „megérteni a kulturális árnyalatokat és dialektusokat”, ami hasznosabbá teszi a különféle iparágak széles körében. A fejlesztők nyílt forráskódban tették nyilvánosan elérhetővé a modellt, vagyis bárki testreszabhatja.

Az Egyesült Arab Emírségek új mesterséges intelligencia chatbotja, a „Jais” az arab hangszórók PlatoBlockchain adatintelligenciáját szolgálja. Függőleges keresés. Ai.

Az Egyesült Arab Emírségek új mesterséges intelligencia chatbotja, a „Jais” az arab hangszórók PlatoBlockchain adatintelligenciáját szolgálja. Függőleges keresés. Ai.

Váltás a nyelvjárások között

Baldwin elmondta a CNN-nek, hogy Jais sokrétű adatképzése lehetővé teszi számára, hogy váltson a modern standard arab nyelvjárások között, amelyet hivatalos dokumentumokhoz és formális írásokhoz használnak, és a helyi dialektusok között, amelyeket általában a blogokon vagy a közösségi médiában használnak.

„Természetesen van hová fejlődnünk, de a hangsúly inkább a robusztusságon volt, ami azt jelenti, hogy meg tudjuk érteni, van-e informálisabb bemenetünk a modellbe” – mondta.

A többi generatív AI chatbothoz hasonlóan a Jais is úgy készült, hogy ellenálljon az olyan felszólításoknak, amelyekmérgező vagy káros” választ, mondta Baldwin, és nem fog válaszolni azokra a kérdésekre, amelyek „önsérüléshez vezetnek vagy függőségre utalnak”. Az olyan témák, mint a homoszexualitás, kívül esnek a határokon, összhangban a muszlim hittel.

Lásd még: A ChatGPT „angol nyelvtől” való függősége arra kényszerítette Japánt, hogy létrehozza saját mesterséges intelligencia chatbotját

Mohammed Soliman, a washingtoni Közel-Kelet Intézet stratégiai technológiákért és a kiberbiztonsági programért felelős igazgatója szerint a latin ábécé alapú nyelvek, például az angol uralkodik az internet, ami azt jelenti, hogy ezeken a nyelveken a legnagyobbak az adatkészletek.

„Ha a mesterséges intelligencia eszközökhöz kizárólag azok férhetnek hozzá, akik bizonyos nyelveket beszélnek, az megakadályozhatja, hogy a társadalmak hátrányos helyzetű rétegei kihasználják a mesterséges intelligencia előnyeit” – mondta.

"[Ezek az LLM-ek] nem ismerik a más kultúrákat, ami hátrányosan befolyásolja a különböző hátterű emberek felhasználói élményét" - tette hozzá Soliman a CNN tudósítása szerint.

Az Egyesült Arab Emírségek jelentős lépéseket tett a generatív AI-rendszerek fejlesztésében. Az Emirátus volt az első ország a világon, amely a AI minisztere 2017-ben. Állítólag a régió legnagyobb generatív AI-modelljével, a Falconnal is büszkélkedhet, amelyet az Abu Dhabi Advanced Technology Research Council és a Technology Innovation Institute (TII) márciusban adott ki.

Időbélyeg:

Még több MetaNews