UAE:s nya AI Chatbot 'Jais' vänder sig till arabisktalande

UAE:s nya AI Chatbot 'Jais' vänder sig till arabisktalande

Ett team av akademiker, forskare och ingenjörer i Förenade Arabemiraten (UAE) avtäckte en ny generativ AI-chatbot som heter "Jais" för att rikta sig specifikt till människor som talar det arabiska språket runt om i världen, enligt CNN.

Teamet hävdar att arabiska, den sjätte mest talade språket i världen med cirka 272 miljoner talare, har varit "underrepresenterat i mainstream AI." De hoppas kunna få slut på dominansen av engelska i träning av AI-system som kallas stora språkmodeller (LLMs).

Jais AI chatbot fokuserar på Mellanöstern

Språkfrågan inom AI är ett världsomspännande problem. Japan lämnade nyligen engelska eftersom landet bygger sin egen version av ChatGPT. Forskare sade medan OpenAI:s chatbot utmärker sig på engelska, faller den ofta kort på japanska "på grund av skillnader i alfabetsystemet, begränsad data och andra faktorer."

Jais är uppkallad efter ett berg i Förenade Arabemiraten, CNN rapport säger, och kan utföra uppgifter på kommando, som att skriva dikter, precis som ChatGPT eller Googles Bard, men i begränsad skala. AI:n är tränad på 13 miljarder parametrar data, långt ifrån jämfört med ChatGPT 3.5:s nära 175 miljarder parametrar, ett mått på storleken på en stor språkmodell, men inte dess noggrannhet.

Det finns planer på att utöka Jais dataset till 30 miljarder parametrar och göra det möjligt för den att läsa bilder och grafer istället för bara text, enligt Timothy Baldwin, professor i naturlig språkbehandling vid Abu Dhabis Mohamed bin Zayed University of Artificial Intelligence (MBZUAI).

Universitetet arbetade med Silicon Valleys Cerebras Systems and Inception, ett dotterbolag till UAE-baserade AI-företaget G42, för att skapa Jais. Baldwin sa att medan rivaliserande LLM:er som Metas LLaMA och OpenAI:s GPT kan förstå arabiska, är de huvudsakligen utbildade på engelska onlinedata.

För Jais innebar utbildningen en kombination av både engelska och arabiska datamängder, men med ett medvetet fokus på innehåll från Mellanöstern, där arabiska talas och skrivs i stor utsträckning.

Baldwin sa att ett sådant fokus gör att AI-chatboten kan gå längre än "vad någon annan har kunnat uppnå för arabiska."

Enligt MBZUAI hjälper Jais unika utbildning chatboten att "förstå kulturella nyanser och dialekter", vilket gör den mer användbar för en lång rad olika branscher. Utvecklare gjorde modellen tillgänglig för allmänheten i öppen källkod, vilket innebär att vem som helst kan anpassa den.

UAE:s nya AI Chatbot 'Jais' vänder sig till arabisktalande PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

UAE:s nya AI Chatbot 'Jais' vänder sig till arabisktalande PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Växla mellan dialekter

Baldwin berättade för CNN att Jais mångsidiga dataträning kommer att göra det möjligt för den att växla mellan dialekter av modern standardarabiska, som används för officiella dokument och formellt skrivande, och lokala dialekter som vanligtvis används på bloggar eller sociala medier.

"Det finns säkert utrymme för förbättringar där, men fokus har varit mer på robustheten när det gäller att kunna förstå om vi har mer informella input till modellen," sa han.

Liksom andra generativa AI-chatbotar är Jais byggd för att motstå uppmaningar som skapar "giftigt eller skadligt" svar, sa Baldwin, och kommer inte att svara på frågor som "leder till självskada eller tyder på beroende." Ämnen som homosexualitet är utanför ramarna, i linje med muslimsk tro.

Läs också: ChatGPT:s beroende av det "engelska språket" har tvingat Japan att skapa sin egen AI Chatbot

Enligt Mohammed Soliman, chef för strategisk teknologi och cybersäkerhetsprogrammet vid Middle East Institute i Washington, DC, latinska alfabetbaserade språk som engelska dominera internet, vilket betyder att datauppsättningar är de största på dessa språk.

"Att göra tillgång till AI-verktyg exklusivt för dem som kan tala specifika språk kan förhindra missgynnade tvärsnitt av samhällen från att skörda fördelarna med AI", sa han.

"[Dessa LLMs] saknar medvetenhet om andra kulturer, vilket negativt påverkar användarupplevelsen för människor med olika bakgrunder," tillade Soliman, som rapporterats av CNN.

Förenade Arabemiraten har gjort betydande framsteg i utvecklingen av generativa AI-system. Emiratet var det första landet i världen att utse en minister för AI 2017. Den ska enligt uppgift också ståta med regionens största generativa AI-modell, Falcon, som släpptes av Abu Dhabis Advanced Technology Research Council och Technology Innovation Institute (TII) i mars.

Tidsstämpel:

Mer från MetaNews