UAEs nye AI Chatbot 'Jais' henvender seg til arabisktalende

UAEs nye AI Chatbot 'Jais' henvender seg til arabisktalende

Et team av akademikere, forskere og ingeniører i De forente arabiske emirater (UAE) avduket en ny generativ AI-chatbot kalt 'Jais' for å imøtekomme spesifikt folk som snakker det arabiske språket rundt om i verden, ifølge CNN.

Teamet hevder at arabisk, den sjette mest talte språk i verden med rundt 272 millioner høyttalere, har vært "underrepresentert i mainstream AI." De håper å få slutt på dominansen til engelsk i trening av AI-systemer kjent som store språkmodeller (LLMs).

Jais AI chatbot fokuserer på Midtøsten

Språkproblemet i AI er en verdensomspennende bekymring. Japan forlot nylig engelsk da landet bygger sin egen versjon av ChatGPT. Forskere sa mens OpenAIs chatbot utmerker seg på engelsk, kommer den ofte til kort på japansk "på grunn av forskjeller i alfabetsystemet, begrensede data og andre faktorer."

Jais er oppkalt etter et fjell i UAE, CNN rapporterer sier, og kan utføre oppgaver på kommando, som å skrive dikt, akkurat som ChatGPT eller Googles Bard, men i begrenset omfang. AI er trent på 13 milliarder parametere med data, langt ifra sammenlignet med ChatGPT 3.5s nesten 175 milliarder parametere, et mål på størrelsen på en stor språkmodell, men ikke dens nøyaktighet.

Det er planer om å utvide Jais' datasett til 30 milliarder parametere og gjøre det i stand til å lese bilder og grafer i stedet for bare tekst, ifølge Timothy Baldwin, professor i naturlig språkbehandling ved Abu Dhabis Mohamed bin Zayed University of Artificial Intelligence (MBZUAI).

Universitetet jobbet med Silicon Valleys Cerebras Systems and Inception, et datterselskap av UAE-baserte AI-firmaet G42, for å skape Jais. Baldwin sa at mens rivaliserende LLM-er som Metas LLaMA og OpenAIs GPT kan forstå arabisk, er de hovedsakelig trent på engelske data på nettet.

For Jais innebar opplæringen en kombinasjon av både engelske og arabiske datasett, men med et bevisst fokus på innhold fra Midtøsten, hvor arabisk snakkes og skrives mye.

Baldwin sa at et slikt fokus lar AI-chatboten gå utover "det noen andre har vært i stand til å oppnå for arabisk."

I følge MBZUAI hjelper Jais' unike opplæring chatboten til å "forstå kulturelle nyanser og dialekter", noe som gjør den mer nyttig for et bredt spekter av forskjellige bransjer. Utviklere gjorde modellen tilgjengelig for publikum i åpen kildekode, noe som betyr at alle kan tilpasse den.

UAEs nye AI Chatbot 'Jais' henvender seg til arabisktalende PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

UAEs nye AI Chatbot 'Jais' henvender seg til arabisktalende PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Bytte mellom dialekter

Baldwin fortalte CNN at Jais' mangfoldige dataopplæring vil gjøre det mulig for den å bytte mellom dialekter av Modern Standard Arabic, som brukes til offisielle dokumenter og formell skriving, og lokale dialekter som vanligvis brukes på blogger eller sosiale medier.

"Det er absolutt rom for forbedringer der, men fokuset har vært mer på robustheten når det gjelder å kunne forstå om vi har mer uformelle input til modellen," sa han.

Som andre generative AI chatbots, er Jais bygget for å motstå spørsmål som skaper "giftig eller skadelig" svar, sa Baldwin, og vil ikke svare på spørsmål som "fører til selvskading eller tyder på avhengighet." Temaer som homofili er utenfor grensene, i tråd med muslimsk tro.

Les også: ChatGPTs avhengighet av det engelske språket har tvunget Japan til å lage sin egen AI Chatbot

I følge Mohammed Soliman, direktør for strategiske teknologier og cybersikkerhetsprogrammet ved Middle East Institute i Washington, DC, latinske alfabetbaserte språk som engelsk dominerer Internett, noe som betyr at datasettene er de største på disse språkene.

"Å gjøre tilgang til AI-verktøy eksklusivt for de som kan snakke spesifikke språk kan forhindre vanskeligstilte tverrsnitt av samfunn fra å høste fordelene av AI," sa han.

"[Disse LLM-ene] mangler bevissthet om andre kulturer, noe som påvirker brukeropplevelsen negativt for mennesker med ulik bakgrunn," la Soliman til, som rapportert av CNN.

UAE har gjort betydelige fremskritt i utviklingen av generative AI-systemer. Emiratet var det første landet i verden som utnevnte en minister for AI i 2017. Den skal også ha regionens største generative AI-modell, Falcon, som ble utgitt av Abu Dhabis Advanced Technology Research Council og Technology Innovation Institute (TII) i mars.

Tidstempel:

Mer fra MetaNews