Novi AI Chatbot 'Jais' ZAE skrbi za arabsko govoreče

Novi AI Chatbot 'Jais' ZAE skrbi za arabsko govoreče

Skupina akademikov, raziskovalcev in inženirjev v Združenih arabskih emiratih (ZAE) je predstavila novega generativnega klepetalnega robota z umetno inteligenco, imenovanega "Jais", ki je posebej namenjen ljudem, ki govorijo arabski jezik po vsem svetu, poroča CNN.

Ekipa trdi, da arabščina, šesti najbolj govorjeno jezik na svetu z okoli 272 milijoni govorcev, je bil "premalo zastopan v mainstream AI." Upajo, da bodo končali prevlado angleščine pri usposabljanju sistemov AI, znanih kot veliki jezikovni modeli (LLM).

Klepetalni robot Jais AI se osredotoča na Bližnji vzhod

Jezikovno vprašanje v AI je zaskrbljujoče po vsem svetu. Japonska je pred kratkim opustila angleščino, saj država gradi svojo različico ChatGPT. Raziskovalci je dejal medtem ko je klepetalni robot OpenAI odličen v angleščini, pogosto ne uspe v japonščini "zaradi razlik v sistemu abecede, omejenih podatkov in drugih dejavnikov."

Jais je dobil ime po gori v ZAE, CNN poročilo pravi, in lahko opravlja naloge na ukaz, kot je pisanje pesmi, tako kot ChatGPT ali Googlovega Bard, vendar v omejenem obsegu. AI je usposobljen za 13 milijard parametrov podatkov, kar je veliko v primerjavi s skoraj 3.5 milijardami parametrov ChatGPT 175, kar je merilo velikosti velikega jezikovnega modela, ne pa tudi njegove natančnosti.

Timothy Baldwin, profesor obdelave naravnega jezika na Univerzi za umetno inteligenco Mohamed bin Zayed (MBZUAI) v Abu Dhabiju, načrtuje razširitev Jaisovega nabora podatkov na 30 milijard parametrov in omogočanje branja slik in grafov namesto le besedila.

Univerza je pri ustvarjanju Jaisa sodelovala s Cerebras Systems iz Silicijeve doline in Inception, hčerinsko družbo podjetja AI G42 s sedežem v ZAE. Baldwin je dejal, da medtem ko konkurenčni LLM-ji, kot sta Metin LLaMA in OpenAI-jev GPT, razumejo arabščino, so večinoma usposobljeni na spletnih angleških podatkih.

Za Jaisa je usposabljanje vključevalo kombinacijo angleških in arabskih naborov podatkov, vendar z namenskim poudarkom na vsebini z Bližnjega vzhoda, kjer se arabščina pogosto govori in piše.

Baldwin je dejal, da takšna osredotočenost klepetalnemu robotu AI omogoča, da preseže »to, kar je komu drugemu uspelo doseči za arabščino«.

Po besedah ​​MBZUAI Jaisovo edinstveno usposabljanje pomaga klepetalnemu robotu "razumeti kulturne nianse in narečja", zaradi česar je bolj uporaben za široko paleto različnih panog. Razvijalci so dali model na voljo javnosti v obliki odprte kode, kar pomeni, da ga lahko vsak prilagodi.

UAE's New AI Chatbot 'Jais' Caters to Arabic Speakers PlatoBlockchain Data Intelligence. Vertical Search. Ai.

UAE's New AI Chatbot 'Jais' Caters to Arabic Speakers PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Preklapljanje med narečji

Baldwin je za CNN povedal, da bo Jaisovo raznoliko podatkovno usposabljanje omogočilo preklapljanje med narečji sodobne standardne arabščine, ki se uporablja za uradne dokumente in formalno pisanje, ter lokalnimi narečji, ki se običajno uporabljajo v blogih ali družbenih medijih.

"Vsekakor obstaja prostor za izboljšave, vendar je bil poudarek bolj na robustnosti v smislu zmožnosti razumevanja, ali imamo več neformalnih vložkov v model," je dejal.

Tako kot drugi generativni klepetalni roboti z umetno inteligenco je Jais zgrajen tako, da se upira pozivom, ki ustvarjajo "strupeno ali škodljivo" odgovore, je dejal Baldwin, in ne bo odgovarjal na vprašanja, ki "vodijo do samopoškodovanja ali kažejo na zasvojenost." Teme, kot je homoseksualnost, so v skladu z muslimanskimi prepričanji izven meja.

Preberite tudi: Odvisnost ChatGPT od 'angleškega jezika' je prisilila Japonsko, da je ustvarila lastnega AI Chatbota

Po mnenju Mohammeda Solimana, direktorja strateških tehnologij in programa kibernetske varnosti na Bližnjevzhodnem inštitutu v Washingtonu, DC, jeziki, ki temeljijo na latinici, kot je angleščina prevladujejo internet, kar pomeni, da so nabori podatkov največji v teh jezikih.

»Omogočanje dostopa do orodij umetne inteligence izključno za tiste, ki govorijo določene jezike, bi lahko preprečilo, da bi prikrajšani sloji družb izkoristili prednosti umetne inteligence,« je dejal.

"[Ti LLM-ji] se ne zavedajo drugih kultur, kar negativno vpliva na uporabniško izkušnjo za ljudi različnih okolij," je dodal Soliman, kot poroča CNN.

ZAE so naredili pomemben korak pri razvoju generativnih sistemov umetne inteligence. Emirat je bil prva država na svetu, ki je imenovala a minister za AI leta 2017. Ponaša se tudi z največjim generativnim modelom umetne inteligence v regiji, Falcon, ki sta ga marca izdala Raziskovalni svet za napredno tehnologijo v Abu Dabiju in Inštitut za tehnološke inovacije (TII).

Časovni žig:

Več od MetaNovice