Der neue KI-Chatbot „Jais“ der VAE richtet sich an Arabischsprachige

Der neue KI-Chatbot „Jais“ der VAE richtet sich an Arabischsprachige

Laut CNN hat ein Team aus Akademikern, Forschern und Ingenieuren in den Vereinigten Arabischen Emiraten (VAE) einen neuen generativen KI-Chatbot namens „Jais“ vorgestellt, der sich speziell an Menschen richtet, die auf der ganzen Welt Arabisch sprechen.

Das Team argumentiert, dass Arabisch das sechste ist am meisten gesprochen Sprache auf der Welt mit rund 272 Millionen Sprechern sei „in der Mainstream-KI unterrepräsentiert“. Sie hoffen, die Dominanz des Englischen beim Training von KI-Systemen, sogenannten Large Language Models (LLMs), zu beenden.

Der KI-Chatbot von Jais konzentriert sich auf den Nahen Osten

Das Sprachproblem in der KI ist ein weltweites Problem. Japan hat kürzlich Englisch aufgegeben, da das Land seine eigene Version von ChatGPT entwickelt. Forscher sagte Während der Chatbot von OpenAI auf Englisch hervorragend ist, ist er auf Japanisch oft unzureichend, „aufgrund von Unterschieden im Alphabetsystem, begrenzten Daten und anderen Faktoren“.

Jais ist nach einem Berg in den Vereinigten Arabischen Emiraten benannt, so CNN berichten sagt, und kann auf Befehl Aufgaben ausführen, wie zum Beispiel Gedichte schreiben ChatGPT oder Google Barde, aber in begrenztem Umfang. Die KI wird auf 13 Milliarden Datenparametern trainiert, was im Vergleich zu den fast 3.5 Milliarden Parametern von ChatGPT 175 weit entfernt ist, ein Maß für die Größe eines großen Sprachmodells, aber nicht für seine Genauigkeit.

Laut Timothy Baldwin, Professor für natürliche Sprachverarbeitung an der Mohamed bin Zayed University of Artificial Intelligence (MBZUAI) in Abu Dhabi, gibt es Pläne, den Datensatz von Jais auf 30 Milliarden Parameter zu erweitern und ihn in die Lage zu versetzen, Bilder und Grafiken statt nur Text zu lesen.

Bei der Entwicklung von Jais arbeitete die Universität mit Cerebras Systems und Inception aus dem Silicon Valley zusammen, einer Tochtergesellschaft des in den Vereinigten Arabischen Emiraten ansässigen KI-Unternehmens G42. Baldwin sagte, dass konkurrierende LLMs wie LLaMA von Meta und GPT von OpenAI zwar Arabisch verstehen, ihre Ausbildung jedoch überwiegend auf Online-Englischdaten erfolgt.

Für Jais umfasste die Schulung eine Kombination aus englischen und arabischen Datensätzen, wobei der Schwerpunkt jedoch bewusst auf Inhalten aus dem Nahen Osten lag, wo Arabisch weit verbreitet gesprochen und geschrieben wird.

Baldwin sagte, ein solcher Fokus ermögliche es dem KI-Chatbot, über „das, was alle anderen für Arabisch erreichen konnten“, hinauszugehen.

Laut MBZUAI hilft Jais‘ einzigartiges Training dem Chatbot, „kulturelle Nuancen und Dialekte zu verstehen“, was ihn für eine Vielzahl unterschiedlicher Branchen nützlicher macht. Die Entwickler stellten das Modell der Öffentlichkeit als Open Source zur Verfügung, sodass jeder es anpassen kann.

Der neue KI-Chatbot „Jais“ der VAE richtet sich an Arabischsprachige PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Der neue KI-Chatbot „Jais“ der VAE richtet sich an Arabischsprachige PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Wechsel zwischen Dialekten

Baldwin sagte gegenüber CNN, dass Jais durch sein vielfältiges Datentraining in die Lage versetzt werde, zwischen Dialekten des modernen Hocharabisch, das für offizielle Dokumente und formelle Schriften verwendet wird, und lokalen Dialekten, die normalerweise in Blogs oder sozialen Medien verwendet werden, zu wechseln.

„Da gibt es sicherlich Raum für Verbesserungen, aber der Fokus lag mehr auf der Robustheit im Hinblick auf die Fähigkeit, zu verstehen, ob wir informellere Eingaben in das Modell haben“, sagte er.

Wie andere generative KI-Chatbots ist Jais darauf ausgelegt, Aufforderungen zu widerstehen, die „giftig oder schädlich“ Antworten, sagte Baldwin, und werden nicht auf Fragen antworten, die „zu Selbstverletzung führen oder auf eine Sucht hinweisen“. Themen wie Homosexualität sind im Einklang mit muslimischen Überzeugungen tabu.

Lies auch: Die Abhängigkeit von ChatGPT von der „englischen Sprache“ hat Japan gezwungen, einen eigenen KI-Chatbot zu entwickeln

Laut Mohammed Soliman, Direktor für strategische Technologien und das Cybersicherheitsprogramm am Middle East Institute in Washington, D.C., basieren Sprachen wie Englisch auf dem lateinischen Alphabet dominieren Das bedeutet, dass die Datensätze in diesen Sprachen am umfangreichsten sind.

„Wenn der Zugang zu KI-Tools ausschließlich denjenigen vorbehalten wird, die bestimmte Sprachen sprechen, könnte benachteiligte Teile der Gesellschaft daran gehindert werden, von den Vorteilen der KI zu profitieren“, sagte er.

„[Diesen LLMs] fehlt das Bewusstsein für andere Kulturen, was sich negativ auf die Benutzererfahrung für Menschen mit unterschiedlichem Hintergrund auswirkt“, fügte Soliman hinzu, wie CNN berichtete.

Die VAE haben erhebliche Fortschritte bei der Entwicklung generativer KI-Systeme gemacht. Das Emirat war das erste Land der Welt, das einen ernannte Minister für KI im Jahr 2017. Es verfügt Berichten zufolge auch über das größte generative KI-Modell der Region, Falcon, das im März vom Advanced Technology Research Council von Abu Dhabi und dem Technology Innovation Institute (TII) veröffentlicht wurde.

Zeitstempel:

Mehr von MetaNews