Meta の最新の大規模言語モデルである LLaMA がオンラインでリークされ、ダウンロード可能になっていますが、研究目的のみにアクセスを制限しようとしているようです。
フェイスブックのオーナー 発表の XNUMX月には、恐怖の中で遊ぶために学者、政府系、企業を選択するために、限定的な方法でモデルをリリースしていました ラマ 悪用される可能性があります。 しかし、情報は無料であることを望んでいる、または少なくとも特定の人々は無料であることを望んでおり、Meta の作成物はトレント リークから始まり、いずれにせよオンラインに流れました。
入力プロンプトからテキストのパッセージを生成する文予測大規模言語モデルは、自分の文章を自動補完することから、自然言語を使用してタスクを実行するように求められたときにタスクを実行できるチャットボットまで、着実に進化しています。
専門家は、この技術が大量のフェイク ニュース、スパム、フィッシング メール、偽情報、煽動などの作成を自動化するために今後何年も使用される可能性があると警告しています。 これらのモデルを構築する組織は、多くの場合、ソフトウェアを覆い隠したり、API の背後に置いたり、限定バージョンやデモをリリースしたりします。
「大規模な言語モデルにおける偏見、有毒なコメント、幻覚のリスクに対処するために行う必要がある研究はまだまだあります」と Meta は述べています。 と 先週。
「他のモデルと同様に、LLaMA はこれらの課題を共有しています。 基本モデルとして、LLaMA は用途が広いように設計されており、特定のタスク用に設計された微調整されたモデルとは対照的に、さまざまなユース ケースに適用できます。
「整合性を維持し、誤用を防ぐために、研究のユースケースに焦点を当てた非商用ライセンスの下でモデルをリリースしています。 モデルへのアクセスは、ケースバイケースで学術研究者に許可されます。 政府、市民社会、学界の組織に所属する人々。 および世界中の業界研究機関です。」
ハウツーガイド
しかし、LLaMA へのアクセスを制御しようとする Meta の努力は無駄だったようです。 モデルを特定のボフィン、および業界や市民社会の人々と共有した直後に、4Chan の誰かが、ピアツーピアのファイル共有を介してモデル全体を取得する方法の詳細を投稿し、最終的には すべてをダウンロードする方法の説明 GitHub で公開されました。
いつものように、誰かが悪質なものを隠している場合に備えて、トレントからこのようなものを取得するときは注意してください. 65 億のパラメーター モデルは、約 220 GB のディスク容量を占有すると言われています。
GitHub 経由で入手できる LLaMA のコピーは合法であるように見えます。 ショーン・プレッサー AIエンジニア Microsoft のコード共有サイトでダウンロード手順を書いた彼は、モデルからテキストを生成することに成功したスクリーンショットを見せてくれました。 彼は、Meta からモデルへのアクセスを許可された研究者がモデルを漏らしたため、おそらく予想よりも広く配布されたと考えています。
陰謀論エンジンを起動します。
プレッサー氏は、モデルを承認された学者に限定するよりも、警告なしで自由にリリースする方がよいと考えています。 「少なくとも100倍は、良いことが悪いことを上回ると思います。 おそらく XNUMX 倍近くになるだろう」と彼は語った。 登録.
最先端の大規模言語モデルのトレーニングと実行には、一般的に費用がかかります。 GPU やその他のインフラストラクチャの山にアクセスできる組織だけが、それらを構築、調整、テストできる立場にあります。 Meta の AI 研究者 LLaMA を小型化、今日の商用モデルよりもコンパクトになるため、重要な IT 予算がなくても学者や開発者がアクセスしやすくなります。
Meta の機械学習の達人は、彼らのシステムが OpenAI の GPT-3 よりも優れており、Google の 540 億パラメーターの PaLM や DeepMind の 70 億パラメーターのチンチラなど、他の大規模言語モデルと同じくらい優れていると主張しました。 サイズが小さいということは、計算リソースが少ない科学者にとって使いやすいことを意味します。 そして、はい、あらゆる形とサイズの言語モデルがたくさんあります。 それは OpenAI と Facebook だけではありません。
LLaMA には、数百ギガバイトのストレージと、それを駆動するための十分な量のコンピューティングが必要です。 この種のシステムの取り扱いに慣れていない限り、モデルを起動して実行することも簡単ではありません。また、より悪質な活動のためにモデルを再利用するには、さらに技術的な専門知識が必要になります。 モデルがリークされているにもかかわらず、Meta は、選択された研究者のみに LLaMA を共有し続けると述べました。
現在のリリース戦略により、責任とオープン性のバランスを取ることができると信じています
「最先端の AI モデルを研究コミュニティのメンバーと共有して、それらのモデルの評価と改善を支援することが Meta の目標です」と広報担当者は語った。 登録.
「LLaMA は、以前の大規模な言語モデルを共有した方法と一致して、研究目的で共有されました。 すべての人がモデルにアクセスできるわけではなく、承認プロセスを回避しようとする人もいますが、現在のリリース戦略により、責任とオープン性のバランスを取ることができると考えています。」
言い換えれば、Facebook グループは、自社の技術を配布するアプローチを支持しています。
大規模な言語モデルをリリースしようとする Meta の最近の試みは、順調に進んでいません。 昨年、おしゃべりな BlenderBot は 批判 誤報と反ユダヤ主義の見解を広めるために。 科学的知識を要約するために設計されたギャラクティカは、 削除 偽の人種差別的なコンテンツを生成するために立ち上げられてから XNUMX 日後。 ®
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 情報源: https://go.theregister.com/feed/www.theregister.com/2023/03/08/meta_llama_ai_leak/
- :は
- $UP
- 7
- a
- 私たちについて
- アカデミー
- アカデミック
- アクセス
- アクセス可能な
- 活動
- 住所
- 所属している
- 後
- AI
- すべて
- ことができます
- 常に
- の中で
- 量
- 金額
- および
- API
- 見かけ上
- 現れる
- 適用された
- アプローチ
- 承認
- 承認された
- です
- 周りに
- AS
- At
- 試み
- 自動化する
- 利用できます
- 悪い
- 基礎
- BE
- 背後に
- さ
- 信じる
- と考えています
- より良いです
- バイアス
- 予算
- ビルド
- 建物
- by
- 缶
- できる
- 場合
- 例
- 一定
- 課題
- チャットボット
- 主張した
- クローザー
- CO
- 来ます
- 注釈
- コマーシャル
- コミュニティ
- 企業
- 計算
- 整合性のある
- 陰謀
- コンテンツ
- 続ける
- コントロール
- 可能性
- 創造
- 電流プローブ
- 日
- ディープマインド
- デモ
- 設計
- にもかかわらず
- 細部
- 開発者
- 異なります
- 虚偽情報
- 分配します
- ディストリビューション
- ダウンロード
- ドラマ
- ドライブ
- 容易
- 努力
- メール
- エンジン
- 評価する
- 最終的に
- 進化
- 運動
- 高価な
- 専門知識
- 偽
- 偽のニュース
- ファッション
- 恐怖
- 2月
- File
- 焦点を当て
- フォワード
- 発見
- Foundation
- 無料版
- から
- さらに
- 一般に
- 生成する
- 生成
- 受け
- GitHubの
- 与えられた
- 目標
- 良い
- でログイン
- 政府・公共機関
- GPU
- 付与された
- グループ
- ハンドリング
- 持ってる
- 助けます
- 隠されました
- 認定条件
- How To
- HTTPS
- 何百
- i
- 改善します
- in
- 産業を変えます
- 情報
- インフラ
- 説明書
- 整合性
- IT
- ITS
- JPG
- キープ
- 種類
- 知識
- 言語
- 大
- 姓
- 昨年
- 最新の
- 打ち上げ
- 主要な
- 漏れ
- リーク
- 合法の
- ライセンス
- ような
- LIMIT
- 限定的
- ラマ
- 維持する
- 作成
- 多くの
- 手段
- メガ
- メンバー
- Meta
- Microsoft
- 誤報
- モデル
- 他には?
- 名
- ナチュラル
- ニーズ
- ニュース
- 入手する
- of
- on
- ONE
- オンライン
- OpenAI
- 開放性
- 組織
- その他
- 所有者
- ヤシ
- ピアツーピア
- のワークプ
- 実行
- おそらく
- フィッシング詐欺
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレイ
- 過多
- 位置
- 掲示
- 防ぐ
- 前
- 多分
- プロセス
- 公表
- 目的
- RE
- 最近
- リリース
- 必要とする
- 必要
- 研究
- 研究者
- 研究者
- リソース
- 責任
- リスク
- ランニング
- s
- 前記
- 科学的な
- 科学者たち
- スクリーンショット
- 選択
- シェイプ
- シェアする
- shared
- 株式
- シェアリング
- まもなく
- すべき
- ウェブサイト
- サイズ
- サイズ
- より小さい
- スムーズに
- So
- 社会
- ソフトウェア
- 一部
- 誰か
- 何か
- スペース
- スパム
- 話す
- 特定の
- スポークスパーソン
- 広がる
- スタンド
- 起動
- 最先端の
- まだ
- ストレージ利用料
- ストレート
- 戦略
- 首尾よく
- そのような
- まとめる
- システム
- 取り
- 仕事
- タスク
- テク
- 技術的
- テクノロジー
- test
- それ
- 世界
- アプリ環境に合わせて
- それら
- そこ。
- ボーマン
- 三
- 〜へ
- 今日
- 急流
- 下
- us
- つかいます
- 空しいです
- 多才な
- 対
- 、
- ビュー
- 仕方..
- 週間
- which
- while
- 誰
- 全体
- 意志
- 無し
- 言葉
- 世界
- 書き込み
- 年
- 年
- You
- あなたの
- ゼファーネット