Il nuovo chatbot AI "Jais" degli Emirati Arabi Uniti si rivolge a chi parla arabo

Il nuovo chatbot AI "Jais" degli Emirati Arabi Uniti si rivolge a chi parla arabo

Secondo la CNN, un team di accademici, ricercatori e ingegneri negli Emirati Arabi Uniti (EAU) ha presentato un nuovo chatbot generativo basato sull'intelligenza artificiale chiamato "Jais" per soddisfare specificamente le persone che parlano la lingua araba in tutto il mondo.

La squadra sostiene che l'arabo, il sesto più parlato lingua nel mondo con circa 272 milioni di parlanti, è stata “sottorappresentata nell’intelligenza artificiale tradizionale”. Sperano di porre fine al predominio dell’inglese nella formazione dei sistemi di intelligenza artificiale noti come modelli linguistici di grandi dimensioni (LLM).

Il chatbot AI di Jais si concentra sul Medio Oriente

La questione linguistica nell’intelligenza artificiale è una preoccupazione mondiale. Il Giappone ha recentemente abbandonato l’inglese mentre il paese costruisce la propria versione di ChatGPT. Ricercatori disse mentre il chatbot di OpenAI eccelle in inglese, spesso non è all'altezza in giapponese "a causa delle differenze nel sistema alfabetico, dei dati limitati e di altri fattori".

Jais prende il nome da una montagna negli Emirati Arabi Uniti, la CNN rapporto dice, e può eseguire compiti a comando, come scrivere poesie, proprio come ChatGPT o di Google Vate, ma su scala limitata. L'intelligenza artificiale è addestrata su 13 miliardi di parametri di dati, ben lontani dai quasi 3.5 miliardi di parametri di ChatGPT 175, una misura delle dimensioni di un grande modello linguistico, ma non della sua accuratezza.

Ci sono piani per espandere il set di dati di Jais a 30 miliardi di parametri e consentirgli di leggere immagini e grafici invece che solo testo, secondo Timothy Baldwin, professore di elaborazione del linguaggio naturale presso l'Università di Intelligenza Artificiale Mohamed bin Zayed di Abu Dhabi (MBZUAI).

L'università ha collaborato con Cerebras Systems e Inception della Silicon Valley, una filiale della società di intelligenza artificiale G42 con sede negli Emirati Arabi Uniti, per creare Jais. Baldwin ha affermato che sebbene i LLM rivali come LLaMA di Meta e GPT di OpenAI possano capire l'arabo, sono formati prevalentemente su dati inglesi online.

Per Jais, la formazione prevedeva una combinazione di set di dati sia in inglese che in arabo, ma con un focus deliberato sui contenuti del Medio Oriente, dove l’arabo è ampiamente parlato e scritto.

Baldwin ha affermato che tale attenzione consente al chatbot AI di andare oltre “ciò che chiunque altro è stato in grado di ottenere per l’arabo”.

Secondo MBZUAI, la formazione unica di Jais aiuta il chatbot a "comprendere le sfumature e i dialetti culturali", rendendolo più utile per un'ampia gamma di settori diversi. Gli sviluppatori hanno reso il modello disponibile al pubblico in open source, il che significa che chiunque può personalizzarlo.

Il nuovo chatbot AI "Jais" degli Emirati Arabi Uniti si rivolge ai parlanti arabi PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Il nuovo chatbot AI "Jais" degli Emirati Arabi Uniti si rivolge ai parlanti arabi PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Passaggio da un dialetto all'altro

Baldwin ha detto alla CNN che la diversa formazione dei dati di Jais gli consentirà di passare tra i dialetti dell’arabo standard moderno, utilizzato per documenti ufficiali e scrittura formale, e i dialetti locali che vengono solitamente utilizzati sui blog o sui social media.

"C'è sicuramente spazio per miglioramenti, ma l'attenzione si è concentrata maggiormente sulla robustezza in termini di capacità di capire se disponiamo di input più informali per il modello", ha affermato.

Come altri chatbot con intelligenza artificiale generativa, Jais è costruito per resistere ai suggerimenti che creano "tossico o nocivo” risponde, ha detto Baldwin, e non risponderà a domande che “portano all’autolesionismo o suggeriscono dipendenza”. Temi come l’omosessualità sono vietati, in linea con le credenze musulmane.

Leggi anche: La dipendenza di ChatGPT dalla "lingua inglese" ha costretto il Giappone a creare un proprio chatbot AI

Secondo Mohammed Soliman, direttore delle tecnologie strategiche e del programma di sicurezza informatica presso il Middle East Institute di Washington, DC, le lingue basate sull'alfabeto latino come l'inglese dominare Internet, il che significa che i set di dati sono i più grandi in quelle lingue.

“Rendere l’accesso agli strumenti di intelligenza artificiale esclusivo a coloro che parlano lingue specifiche potrebbe impedire a settori trasversali svantaggiati delle società di raccogliere i benefici dell’intelligenza artificiale”, ha affermato.

"[Questi LLM] mancano di consapevolezza delle altre culture, influenzando negativamente l'esperienza dell'utente per persone di diversa estrazione", ha aggiunto Soliman, come riportato dalla CNN.

Gli Emirati Arabi Uniti hanno fatto passi da gigante nello sviluppo di sistemi di intelligenza artificiale generativa. L'Emirato è stato il primo Paese al mondo a nominare un ministro dell'AI nel 2017. Secondo quanto riferito, vanta anche il più grande modello di intelligenza artificiale generativa della regione, Falcon, che è stato rilasciato dall'Advanced Technology Research Council di Abu Dhabi e dal Technology Innovation Institute (TII) a marzo.

Timestamp:

Di più da MetaNotizie