UAEの新しいAIチャットボット「Jais」はアラビア語話者に対応

UAEの新しいAIチャットボット「Jais」はアラビア語話者に対応

CNN によると、アラブ首長国連邦(UAE)の学者、研究者、エンジニアのチームは、特に世界中のアラビア語を話す人々に対応する、「Jais」と呼ばれる新しい生成型AIチャットボットを発表した。

研究チームは、アラビア語はXNUMX番目であると主張している。 最もよく話される 世界で約 272 億 XNUMX 万人の話者がいるこの言語は、「主流の AI では過小評価されている」。 彼らは、大規模言語モデル (LLM) として知られる AI システムのトレーニングにおける英語の支配を終わらせたいと考えています。

Jais AI チャットボットは中東に焦点を当てています

AI における言語の問題は世界的な懸念事項です。 日本は最近、独自バージョンの ChatGPT を構築するため、英語を廃止しました。 研究者 OpenAIのチャットボットは英語では優れているが、「アルファベット体系の違い、限られたデータ、その他の要因により」日本語では不十分なことが多い。

ジェイスという名前はアラブ首長国連邦の山にちなんで付けられたとCNNが報じた。 レポート と言い、命令に応じて詩を書くなどのタスクを実行できます。 AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 またはGoogleの 吟遊詩人、ただし規模は限られています。 AI は 13 億のデータ パラメーターに基づいてトレーニングされており、ChatGPT 3.5 の 175 億近くのパラメーター (大規模な言語モデルのサイズの尺度ではありますが、精度ではありません) に比べればはるかに優れています。

アブダビのモハメド・ビン・ザイード人工知能大学(MBZUAI)の自然言語処理教授ティモシー・ボールドウィン氏によると、Jaisのデータセットを30億パラメータに拡張し、テキストだけでなく画像やグラフを読み取れるようにする計画があるという。

同大学は、アラブ首長国連邦に本拠を置くAI企業G42の子会社であるシリコンバレーのCerebras Systems and Inceptionと協力して、Jaisを開発した。 ボールドウィン氏は、MetaのLLaMAやOpenAIのGPTなどのライバルLLMはアラビア語を理解できるものの、主にオンラインの英語データでトレーニングを受けていると述べた。

Jais の場合、トレーニングには英語とアラビア語の両方のデータセットが含まれていましたが、アラビア語が広く話され、書かれている中東のコンテンツに意図的に焦点を当てていました。

ボールドウィン氏は、このような焦点により、AI チャットボットは「アラビア語に関して他の人が達成できたこと」を超えることができると述べた。

MBZUAI 氏によると、Jais の独自のトレーニングにより、チャットボットは「文化的なニュアンスや方言を理解」することができ、さまざまな業界でより便利になるそうです。 開発者はモデルをオープンソースで公開したため、誰でもカスタマイズできるようになりました。

UAEの新しいAIチャットボット「Jais」はアラビア語話者に対応 PlatoBlockchain Data Intelligence。垂直検索。あい。

UAEの新しいAIチャットボット「Jais」はアラビア語話者に対応 PlatoBlockchain Data Intelligence。垂直検索。あい。

方言の切り替え

ボールドウィン氏はCNNに対し、Jaisの多様なデータトレーニングにより、公文書やフォーマルな文書に使用される現代標準アラビア語の方言と、通常ブログやソーシャルメディアで使用される地元の方言とを切り替えることが可能になると語った。

「確かに改善の余地はありますが、モデルにもっと非公式な入力があるかどうかを理解できるという点で、堅牢性に重点が置かれています」と彼は言いました。

他の生成型 AI チャットボットと同様に、Jais は、「有毒または有害です」 ボールドウィン氏は、「自傷行為につながる、または依存症を示唆する」質問には応じないと述べた。 同性愛などの話題はイスラム教の信仰に則り、立ち入り禁止となっている。

また、お読みください。 ChatGPTの「英語」への依存により、日本は独自のAIチャットボットの作成を余儀なくされた

ワシントン DC にある中東研究所の戦略テクノロジーおよびサイバー セキュリティ プログラムのディレクターであるモハメド ソリマン氏によると、英語のようなラテン文字ベースの言語は、 支配する つまり、これらの言語ではデータセットが最大になります。

「特定の言語を話す人だけがAIツールにアクセスできるようにすると、社会の恵まれない層がAIの恩恵を受けられなくなる可能性がある」と同氏は述べた。

CNNの報道によると、「[これらのLLMは]他文化への認識が欠けており、多様な背景を持つ人々のユーザーエクスペリエンスに悪影響を及ぼしている」とソリマン氏は付け加えた。

UAE は生成 AI システムの開発において大きな進歩を遂げました。 首長国は世界で最初に次官を任命した国となった。 AI大臣 また、アブダビの先端技術研究評議会とテクノロジーイノベーション研究所(TII)が2017月にリリースした地域最大の生成AIモデル「ファルコン」も誇っていると伝えられている。

タイムスタンプ:

より多くの メタニュース