Arabiemiirikuntien uusi AI Chatbot "Jais" palvelee arabian puhujia

Arabiemiirikuntien uusi AI Chatbot "Jais" palvelee arabian puhujia

CNN:n mukaan joukko tutkijoita, tutkijoita ja insinöörejä Yhdistyneissä arabiemiirikunnissa (UAE) julkisti uuden generatiivisen AI-chatbotin nimeltä "Jais", joka palvelee erityisesti arabian kieltä puhuvia ihmisiä ympäri maailmaa.

Ryhmä väittää, että arabia, kuudes puhutuin kieli maailmassa noin 272 miljoonalla puhujalla on ollut "aliedustettuna valtavirran tekoälyssä". He toivovat lopettavansa englannin dominanssin suurten kielimallien (LLM) koulutuksessa tunnetuissa tekoälyjärjestelmissä.

Jais AI chatbot keskittyy Lähi-itään

Tekoälyn kieliongelma on maailmanlaajuinen huolenaihe. Japani luopui äskettäin englannista, kun maa rakentaa omaa ChatGPT-versiotaan. Tutkijat sanoi vaikka OpenAI:n chatbot on erinomainen englannin kielellä, se jää usein alle japanin "aakkosjärjestelmän erojen, rajallisten tietojen ja muiden tekijöiden vuoksi".

Jais on nimetty Yhdistyneissä arabiemiirikunnissa sijaitsevan vuoren mukaan, CNN raportti sanoo, ja voi suorittaa tehtäviä käskystä, kuten kirjoittaa runoja, aivan kuten ChatGPT tai Googlen Bardi, mutta rajoitetussa mittakaavassa. Tekoäly on koulutettu 13 miljardiin dataparametriin, mikä on paljon verrattuna ChatGPT 3.5:n lähes 175 miljardiin parametriin, mikä mittaa suuren kielimallin kokoa, mutta ei sen tarkkuutta.

Abu Dhabin Mohamed bin Zayedin tekoälyn yliopiston (MBZUAI) luonnollisen kielen prosessoinnin professorin Timothy Baldwinin mukaan Jaisin tietojoukkoa on tarkoitus laajentaa 30 miljardiin parametriin ja mahdollistaa se, että se voi lukea kuvia ja kaavioita pelkän tekstin sijaan.

Yliopisto työskenteli Silicon Valleyn Cerebras Systemsin ja Inceptionin kanssa, joka on Arabiemiirikunnissa toimivan tekoälyyrityksen G42:n tytäryhtiö, luodakseen Jais. Baldwin sanoi, että vaikka kilpailevat LLM-yritykset, kuten Metan LLaMA ja OpenAI:n GPT, voivat ymmärtää arabiaa, he ovat pääasiassa koulutettuja englannin verkkotiedoilla.

Jaisille koulutus sisälsi sekä englannin- että arabiankielisten tietokokonaisuuksien yhdistelmän, mutta keskittyen tietoisesti Lähi-idän sisältöön, jossa arabiaa puhutaan ja kirjoitetaan laajalti.

Baldwin sanoi, että tällainen keskittyminen antaa tekoäly-chatbotille mennä pidemmälle kuin "mitä kukaan muu on pystynyt saavuttamaan arabian kielellä".

MBZUAI:n mukaan Jaisin ainutlaatuinen koulutus auttaa chatbotia "ymmärtämään kulttuurisia vivahteita ja murteita", mikä tekee siitä hyödyllisemmän monille eri toimialoille. Kehittäjät asettivat mallin yleisön saataville avoimessa lähdekoodissa, mikä tarkoittaa, että kuka tahansa voi muokata sitä.

Arabiemiirikuntien uusi AI Chatbot "Jais" palvelee arabiankielisiä kaiuttimia PlatoBlockchain Data Intelligencea. Pystysuuntainen haku. Ai.

Arabiemiirikuntien uusi AI Chatbot "Jais" palvelee arabiankielisiä kaiuttimia PlatoBlockchain Data Intelligencea. Pystysuuntainen haku. Ai.

Vaihtaminen murteiden välillä

Baldwin kertoi CNN:lle, että Jaisin monipuolisen datakoulutuksen avulla se voi vaihtaa virallisiin asiakirjoihin ja viralliseen kirjoittamiseen käytettävän modernin standardaraabian murteiden ja blogeissa tai sosiaalisessa mediassa tavallisesti käytettyjen paikallisten murteiden välillä.

"Siissä on varmasti parantamisen varaa, mutta painopiste on ollut enemmän jäykkyydessä sen ymmärtämisen kannalta, onko meillä epämuodollisempaa panosta malliin", hän sanoi.

Kuten muutkin generatiiviset AI-chatbotit, Jais on rakennettu vastustamaan kehotteita, jotka luovat "myrkyllistä tai haitallista" vastauksia, Baldwin sanoi, eikä vastaa kyselyihin, jotka "johtavat itsensä vahingoittamiseen tai viittaavat riippuvuuteen". Homoseksuaalisuuden kaltaiset aiheet ovat rajojen ulkopuolella, sopusoinnussa muslimien uskomusten kanssa.

Lue myös: ChatGPT:n riippuvuus "englannin kielestä" on pakottanut Japanin luomaan oman AI-chatbotin

Washington DC:n Lähi-idän instituutin strategisten teknologioiden ja kyberturvallisuusohjelman johtajan Mohammed Solimanin mukaan latinallisiin aakkosiin perustuvat kielet, kuten englanti hallita Internetissä, mikä tarkoittaa, että tietojoukot ovat suurimmat näillä kielillä.

"Tekoälytyökalujen käyttäminen vain niille, jotka puhuvat tiettyjä kieliä, voisi estää yhteiskuntien heikommassa asemassa olevia ryhmiä hyödyntämästä tekoälyn etuja", hän sanoi.

"[Näillä LLM:illä] puuttuu tietoisuus muista kulttuureista, mikä vaikuttaa haitallisesti eri taustaisten ihmisten käyttökokemukseen", Soliman lisäsi CNN:n mukaan.

Arabiemiirikunnat ovat edistyneet merkittävästi luovien tekoälyjärjestelmien kehittämisessä. Emiraatti oli ensimmäinen maa maailmassa, joka nimitti a AI ministeri Vuonna 2017. Siinä kerrotaan myös olevan alueen suurin generatiivinen tekoälymalli, Falcon, jonka Abu Dhabin Advanced Technology Research Council ja Technology Innovation Institute (TII) julkaisivat maaliskuussa.

Aikaleima:

Lisää aiheesta MetaNews