CNN によると、アラブ首長国連邦(UAE)の学者、研究者、エンジニアのチームは、特に世界中のアラビア語を話す人々に対応する、「Jais」と呼ばれる新しい生成型AIチャットボットを発表した。
研究チームは、アラビア語はXNUMX番目であると主張している。 最もよく話される 世界で約 272 億 XNUMX 万人の話者がいるこの言語は、「主流の AI では過小評価されている」。 彼らは、大規模言語モデル (LLM) として知られる AI システムのトレーニングにおける英語の支配を終わらせたいと考えています。
Jais AI チャットボットは中東に焦点を当てています
AI における言語の問題は世界的な懸念事項です。 日本は最近、独自バージョンの ChatGPT を構築するため、英語を廃止しました。 研究者 と OpenAIのチャットボットは英語では優れているが、「アルファベット体系の違い、限られたデータ、その他の要因により」日本語では不十分なことが多い。
ジェイスという名前はアラブ首長国連邦の山にちなんで付けられたとCNNが報じた。 レポート と言い、命令に応じて詩を書くなどのタスクを実行できます。 AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 またはGoogleの 吟遊詩人、ただし規模は限られています。 AI は 13 億のデータ パラメーターに基づいてトレーニングされており、ChatGPT 3.5 の 175 億近くのパラメーター (大規模な言語モデルのサイズの尺度ではありますが、精度ではありません) に比べればはるかに優れています。
アブダビのモハメド・ビン・ザイード人工知能大学(MBZUAI)の自然言語処理教授ティモシー・ボールドウィン氏によると、Jaisのデータセットを30億パラメータに拡張し、テキストだけでなく画像やグラフを読み取れるようにする計画があるという。
同大学は、アラブ首長国連邦に本拠を置くAI企業G42の子会社であるシリコンバレーのCerebras Systems and Inceptionと協力して、Jaisを開発した。 ボールドウィン氏は、MetaのLLaMAやOpenAIのGPTなどのライバルLLMはアラビア語を理解できるものの、主にオンラインの英語データでトレーニングを受けていると述べた。
Jais の場合、トレーニングには英語とアラビア語の両方のデータセットが含まれていましたが、アラビア語が広く話され、書かれている中東のコンテンツに意図的に焦点を当てていました。
ボールドウィン氏は、このような焦点により、AI チャットボットは「アラビア語に関して他の人が達成できたこと」を超えることができると述べた。
MBZUAI 氏によると、Jais の独自のトレーニングにより、チャットボットは「文化的なニュアンスや方言を理解」することができ、さまざまな業界でより便利になるそうです。 開発者はモデルをオープンソースで公開したため、誰でもカスタマイズできるようになりました。
方言の切り替え
ボールドウィン氏はCNNに対し、Jaisの多様なデータトレーニングにより、公文書やフォーマルな文書に使用される現代標準アラビア語の方言と、通常ブログやソーシャルメディアで使用される地元の方言とを切り替えることが可能になると語った。
「確かに改善の余地はありますが、モデルにもっと非公式な入力があるかどうかを理解できるという点で、堅牢性に重点が置かれています」と彼は言いました。
他の生成型 AI チャットボットと同様に、Jais は、「有毒または有害です」 ボールドウィン氏は、「自傷行為につながる、または依存症を示唆する」質問には応じないと述べた。 同性愛などの話題はイスラム教の信仰に則り、立ち入り禁止となっている。
また、お読みください。 ChatGPTの「英語」への依存により、日本は独自のAIチャットボットの作成を余儀なくされた
ワシントン DC にある中東研究所の戦略テクノロジーおよびサイバー セキュリティ プログラムのディレクターであるモハメド ソリマン氏によると、英語のようなラテン文字ベースの言語は、 支配する つまり、これらの言語ではデータセットが最大になります。
「特定の言語を話す人だけがAIツールにアクセスできるようにすると、社会の恵まれない層がAIの恩恵を受けられなくなる可能性がある」と同氏は述べた。
CNNの報道によると、「[これらのLLMは]他文化への認識が欠けており、多様な背景を持つ人々のユーザーエクスペリエンスに悪影響を及ぼしている」とソリマン氏は付け加えた。
UAE は生成 AI システムの開発において大きな進歩を遂げました。 首長国は世界で最初に次官を任命した国となった。 AI大臣 また、アブダビの先端技術研究評議会とテクノロジーイノベーション研究所(TII)が2017月にリリースした地域最大の生成AIモデル「ファルコン」も誇っていると伝えられている。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://metanews.com/uaes-new-ai-chatbot-jais-caters-to-arabic-speakers-challenging-english-bias/
- :持っている
- :は
- :not
- :どこ
- 13
- 2017
- 30
- 7
- a
- できる
- 学者
- アクセス
- 従った
- 精度
- 達成する
- 追加されました
- 高度な
- 先進技術
- 逆に
- 影響
- 後
- AI
- AIチャットボット
- AIシステム
- ことができます
- アルファベット
- また
- および
- 回答
- 誰も
- アラブ
- アラブ首長国連邦
- アラビア語
- です
- 主張する
- 周りに
- 人工の
- 人工知能
- AS
- At
- 利用できます
- 認知度
- 背景
- き
- さ
- 信念
- 利点
- の間に
- 越えて
- 10億
- BIN
- ブログ
- 誇る
- 両言語で
- 境界
- 構築します
- 内蔵
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 呼ばれます
- 缶
- 応じます
- ケータリング
- 確かに
- チャットボット
- チャットボット
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- 中央情報局(CIA)
- CNN
- 組み合わせ
- 比べ
- 懸念
- コンテンツ
- 可能性
- 協議会
- 国
- 作ります
- 文化的な
- カスタマイズ
- サイバー
- サイバーセキュリティ
- データ
- データセット
- dc
- 依存性
- 開発者
- 開発
- の違い
- 異なります
- 取締役
- 異なる
- do
- ドキュメント
- 支配
- 東
- ほかに
- エミレーツ
- エミレーツ航空
- enable
- end
- エンジニア
- 英語
- 特別
- 詳細
- 体験
- 要因
- フォールズ
- 遠く
- ファークライ
- 会社
- 名
- フォーカス
- 焦点を当てて
- フォーマル
- から
- 生々しい
- 生成AI
- Go
- Googleの
- グラフ
- 持ってる
- he
- ことができます
- ハイ
- 期待して
- HTML
- HTTPS
- if
- 画像
- 改善
- in
- 開始
- 産業
- 非公式
- 革新的手法
- 入力
- を取得する必要がある者
- 機関
- インテリジェンス
- インターネット
- 関係する
- 問題
- IT
- ITS
- 日本
- 日本語
- JPG
- ただ
- 既知の
- 欠如
- 言語
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 大
- 最大の
- ローマ字
- ような
- 限定的
- LINE
- ラマ
- ローカル
- 製
- 主流
- 作成
- 3月
- 最大幅
- 意味
- だけど
- メディア
- 真ん中
- 中東
- 百万
- モデル
- モダン
- モハメド
- モハメッド
- 他には?
- 山
- 名前付き
- ナチュラル
- 自然言語処理
- 自然
- 近く
- 新作
- ニュアンス
- of
- 公式
- 頻繁に
- on
- オンライン
- 開いた
- オープンソース
- or
- その他
- でる
- 自分の
- パラメータ
- のワークプ
- 実行する
- プラン
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 主に
- 防ぐ
- 処理
- 東京大学大学院海洋学研究室教授
- 演奏曲目
- 公共
- クエリ
- 範囲
- 読む
- 収穫
- 最近
- リリース
- 報告
- 研究
- 研究者
- 反応します
- ライバル
- 丈夫
- ルーム
- s
- 前記
- 言う
- 規模
- セキュリティ
- ショート
- 重要
- シリコン
- 第6
- サイズ
- 社会
- ソーシャルメディア
- ソース
- 話す
- スピーカー
- 特定の
- 特に
- 話
- 標準
- 戦略的
- ストライド
- 子会社
- そのような
- スイッチ
- システム
- タスク
- チーム
- テクノロジー
- テクノロジー
- 技術革新
- 条件
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- それ
- 世界
- そこ。
- ボーマン
- 彼ら
- それらの
- 〜へ
- 言われ
- 豊富なツール群
- トピック
- 訓練された
- トレーニング
- UAE
- わかる
- ユニーク
- ユナイテッド
- アラブ首長国連邦
- アラブ首長国連邦
- 大学
- 発表
- 中古
- ユーザー
- 操作方法
- 通常
- バージョン
- ました
- ワシントン
- we
- which
- while
- 誰
- ワイド
- 広い範囲
- 広く
- 意志
- 働いていました
- 世界
- 書き込み
- 書かれた
- ザイード
- ゼファーネット