UAE's nye AI Chatbot 'Jais' henvender sig til arabisktalende

UAEs nye AI Chatbot 'Jais' henvender sig til arabisktalende

Et hold af akademikere, forskere og ingeniører i De Forenede Arabiske Emirater (UAE) afslørede en ny generativ AI-chatbot kaldet 'Jais' for at henvende sig specifikt til folk, der taler det arabiske sprog rundt om i verden, ifølge CNN.

Holdet hævder, at arabisk, den sjette mest talte sprog i verden med omkring 272 millioner talere, har været "underrepræsenteret i mainstream AI." De håber at afslutte dominansen af ​​engelsk i træning af AI-systemer kendt som store sprogmodeller (LLM'er).

Jais AI chatbot fokuserer på Mellemøsten

Sprogproblemet i AI er et verdensomspændende problem. Japan forlod for nylig engelsk, da landet bygger sin egen version af ChatGPT. Forskere sagde mens OpenAIs chatbot udmærker sig på engelsk, kommer den ofte til kort på japansk "på grund af forskelle i alfabetsystemet, begrænsede data og andre faktorer."

Jais er opkaldt efter et bjerg i UAE, CNN indberette siger, og kan udføre opgaver på kommando, såsom at skrive digte, ligesom ChatGPT eller Googles Bard, men i begrænset omfang. AI er trænet på 13 milliarder dataparametre, hvilket er langt fra ChatGPT 3.5's næsten 175 milliarder parametre, et mål for størrelsen af ​​en stor sprogmodel, men ikke dens nøjagtighed.

Der er planer om at udvide Jais' datasæt til 30 milliarder parametre og gøre det muligt for det at læse billeder og grafer i stedet for blot tekst, ifølge Timothy Baldwin, professor i naturlig sprogbehandling ved Abu Dhabis Mohamed bin Zayed University of Artificial Intelligence (MBZUAI).

Universitetet arbejdede sammen med Silicon Valleys Cerebras Systems and Inception, et datterselskab af UAE-baserede AI-firma G42, for at skabe Jais. Baldwin sagde, at mens rivaliserende LLM'er som Meta's LLaMA og OpenAI's GPT kan forstå arabisk, er de overvejende uddannet på online engelske data.

For Jais indebar uddannelsen en kombination af både engelske og arabiske datasæt, men med et bevidst fokus på indhold fra Mellemøsten, hvor arabisk tales og skrives meget.

Baldwin sagde, at et sådant fokus tillader AI-chatbot at gå ud over "hvad nogen anden har været i stand til at opnå for arabisk."

Ifølge MBZUAI hjælper Jais' unikke træning chatbotten med at 'forstå kulturelle nuancer og dialekter', hvilket gør det mere nyttigt for en lang række forskellige brancher. Udviklere gjorde modellen tilgængelig for offentligheden i open source, hvilket betyder, at alle kan tilpasse den.

UAEs nye AI Chatbot 'Jais' henvender sig til arabisktalende PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

UAEs nye AI Chatbot 'Jais' henvender sig til arabisktalende PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Skift mellem dialekter

Baldwin fortalte CNN, at Jais' mangfoldige datatræning vil gøre det muligt for den at skifte mellem dialekter af Modern Standard Arabic, som bruges til officielle dokumenter og formel skrivning, og lokale dialekter, der normalt bruges på blogs eller sociale medier.

"Der er bestemt plads til forbedringer der, men fokus har været mere på robustheden i forhold til at kunne forstå, om vi har mere uformelle input til modellen," sagde han.

Som andre generative AI-chatbots er Jais bygget til at modstå prompter, der skaber "giftig eller skadelig" svar, sagde Baldwin, og vil ikke svare på forespørgsler, der "fører til selvskade eller tyder på afhængighed." Emner som homoseksualitet er uden for rammerne, i tråd med muslimsk tro.

Læs også: ChatGPTs afhængighed af det engelske sprog har tvunget Japan til at oprette sin egen AI Chatbot

Ifølge Mohammed Soliman, direktør for strategiske teknologier og cybersikkerhedsprogrammet ved Middle East Institute i Washington, DC, er det latinske alfabetbaserede sprog som engelsk dominere internettet, hvilket betyder, at datasæt er de største på disse sprog.

"At give adgang til AI-værktøjer eksklusivt for dem, der kan tale specifikke sprog, kan forhindre dårligt stillede tværsnit af samfund i at høste fordelene ved AI," sagde han.

"[Disse LLM'er] mangler bevidsthed om andre kulturer, hvilket påvirker brugeroplevelsen negativt for mennesker med forskellig baggrund," tilføjede Soliman, som rapporteret af CNN.

UAE har gjort betydelige fremskridt i udviklingen af ​​generative AI-systemer. Emiratet var det første land i verden, der udnævnte en minister for AI i 2017. Den kan også prale af regionens største generative AI-model, Falcon, som blev udgivet af Abu Dhabis Advanced Technology Research Council og Technology Innovation Institute (TII) i marts.

Tidsstempel:

Mere fra MetaNews