AÜE uus tehisintellekti vestlusbot "Jais" sobib araabia keele kõnelejatele

AÜE uus tehisintellekti vestlusbot "Jais" sobib araabia keele kõnelejatele

Araabia Ühendemiraatide (AÜE) teadlastest, teadlastest ja inseneridest koosnev meeskond avalikustas uue generatiivse AI-vestlusboti nimega "Jais", mis on mõeldud spetsiaalselt araabia keelt kõnelevatele inimestele üle maailma, vahendab CNN.

Meeskond väidab, et araabia, kuues enim räägitud keel maailmas, kus kõneleb umbes 272 miljonit inimest, on olnud "tavalises tehisintellektis alaesindatud". Nad loodavad lõpetada inglise keele domineerimise suurte keelemudelitena (LLM) tuntud tehisintellektisüsteemide väljaõppes.

Jais AI chatbot keskendub Lähis-Idale

Keeleprobleem AI-s on ülemaailmne probleem. Jaapan loobus hiljuti inglise keelest, kuna riik ehitab oma ChatGPT versiooni. Teadlased ütles Kuigi OpenAI vestlusbot on inglise keeles suurepärane, jääb see sageli alla jaapani keeles "tähestikusüsteemi erinevuste, piiratud andmete ja muude tegurite tõttu".

Jais on nime saanud AÜE-s asuva mäe järgi, CNN aru ütleb ja oskab käsu peale ülesandeid täita, näiteks luuletusi kirjutada, just nagu ChatGPT või Google'i oma bard, kuid piiratud ulatuses. Tehisintellekt on koolitatud 13 miljardi andmeparameetriga, mis on kaugel võrreldes ChatGPT 3.5 peaaegu 175 miljardi parameetriga, mis näitab suure keelemudeli suurust, kuid mitte selle täpsust.

Abu Dhabi Mohamed bin Zayedi tehisintellekti ülikooli (MBZUAI) loomuliku keele töötlemise professori Timothy Baldwini sõnul on kavas laiendada Jaisi andmekogumit 30 miljardi parameetrini ja võimaldada sellel lugeda pilte ja graafikuid, mitte ainult teksti.

Ülikool tegi Jaisi loomisel koostööd Silicon Valley's Cerebras Systems and Inceptioniga, Araabia Ühendemiraatides asuva tehisintellektifirma G42 tütarettevõttega. Baldwin ütles, et kuigi konkureerivad LLM-id, nagu Meta LLaMA ja OpenAI GPT, saavad araabia keelest aru, on nad valdavalt koolitatud ingliskeelsete veebiandmete põhjal.

Jaisi jaoks hõlmas koolitus nii inglise kui ka araabia andmekogumite kombinatsiooni, kuid keskendus teadlikult Lähis-Ida sisule, kus araabia keelt laialdaselt räägitakse ja kirjutatakse.

Baldwin ütles, et selline keskendumine võimaldab AI-vestlusbotil minna kaugemale sellest, "mida keegi teine ​​on suutnud araabia keele jaoks saavutada".

MBZUAI sõnul aitab Jaisi ainulaadne koolitus vestlusrotil "mõista kultuurinüansse ja dialekte", muutes selle kasulikumaks paljude erinevate tööstusharude jaoks. Arendajad tegid mudeli avalikkusele kättesaadavaks avatud lähtekoodiga, mis tähendab, et igaüks saab seda kohandada.

Araabia Ühendemiraatide uus tehisintellekti vestlusbot "Jais" teenindab araabia kõnelejaid PlatoBlockchain andmeluure. Vertikaalne otsing. Ai.

Araabia Ühendemiraatide uus tehisintellekti vestlusbot "Jais" teenindab araabia kõnelejaid PlatoBlockchain andmeluure. Vertikaalne otsing. Ai.

Murdete vahel vahetamine

Baldwin ütles CNN-ile, et Jaisi mitmekesine andmekoolitus võimaldab tal lülituda ametlike dokumentide ja ametliku kirjutamise jaoks kasutatava kaasaegse standardse araabia murrete ning ajaveebides või sotsiaalmeedias tavaliselt kasutatavate kohalike murrete vahel.

"Kindlasti on arenguruumi, kuid rohkem on keskendutud tugevusele, et saaksime aru saada, kas meil on mudelisse rohkem mitteametlikke sisendeid," ütles ta.

Nagu teised generatiivsed AI-vestlusbotid, on ka Jais loodud vastu pidama viipadele, mis loovadmürgine või kahjulik" vastuseid, ütles Baldwin, ega vasta päringutele, mis "viivad enesevigastamiseni või viitavad sõltuvusele". Sellised teemad nagu homoseksuaalsus on piiridest väljas, kooskõlas moslemite tõekspidamistega.

Loe ka: ChatGPT sõltuvus "inglise keelest" on sundinud Jaapanit looma oma AI-vestlusboti

Washingtonis asuva Lähis-Ida Instituudi strateegiliste tehnoloogiate ja küberjulgeoleku programmi direktori Mohammed Solimani sõnul kasutatakse ladina tähestikul põhinevaid keeli, nagu inglise keel. domineerima Internet, mis tähendab, et andmestikud on nendes keeltes suurimad.

"Juurdepääsu tegemine tehisintellekti tööriistadele ainult neile, kes oskavad teatud keeli, võib takistada ebasoodsas olukorras olevatel ühiskondadel tehisintellekti eeliseid kasutamast," ütles ta.

"[Nendel LLM-idel] puudub teadlikkus teistest kultuuridest, mis mõjutab negatiivselt erineva taustaga inimeste kasutuskogemust," lisas Soliman, nagu teatas CNN.

AÜE on teinud olulisi edusamme generatiivsete AI-süsteemide arendamisel. Emiraat oli esimene riik maailmas, kes määras a AI minister 2017. aastal. Väidetavalt on sellel ka piirkonna suurim generatiivne tehisintellekti mudel Falcon, mille Abu Dhabi arenenud tehnoloogiauuringute nõukogu ja tehnoloogiainnovatsiooni instituut (TII) avaldasid märtsis.

Ajatempel:

Veel alates MetaNews