Llama 3 は XNUMX 月に登場—OpenAI は心配する必要があるか? - 復号化

Llama 3 は XNUMX 月に登場—OpenAI は心配する必要があるか? – 復号化

Llama 3 は XNUMX 月に登場—OpenAI は心配する必要があるか? - PlatoBlockchain データ インテリジェンスを復号化します。垂直検索。あい。

ロンドンで開催された注目の AI イベントで、メタの幹部らは火曜日、同社のオープンソース大規模言語モデルの待望の次期版である Llama 3 の差し迫ったリリースに関する最初の公式確認と詳細を明らかにした。

「来月以内、実際にはそれよりも短い期間内に、できれば非常に短い期間内に、次世代基盤モデルの新しいスイートであるLlama 3の展開を開始したいと考えています」とMetaのグローバル担当プレジデントであるニック・クレッグ氏はMetaで発表した。 AI デイ ロンドン、 報告 TechCrunchの.

クレッグ氏は、Llama 3は「さまざまな機能、さまざまな汎用性を備えた多数の異なるモデル」で構成されており、今年中に展開が開始される予定だと述べた。

Llama 3 が起動すると、 予想される Meta はその開発に多額の投資を行っており、利用可能な最も先進的なオープンソース モデルになります。メタによれば、このモデルは 140 億のパラメータでトレーニングされ、これは Llama 2 の能力の XNUMX 倍に相当します。Meta の CEO マーク・ザッカーバーグ氏は次のように述べています。 いじめられた 技術的な詳細の一部は 1 月に発表されました。

「私たちは将来のロードマップをサポートするために、今年末までに 350 万台の H100 を含む大規模なコンピューティング インフラストラクチャを構築しています。他の GPU を含めると全体でほぼ 600 万台の H100 に相当するコンピューティングを実現します」とザッカーバーグ氏は当時述べていました。この量のコンピューティング能力は、OpenAI が GPT-4 をトレーニングするために使用する量よりも大幅に大きくなります。 推定 25,000 ~ 90 日で約 100 個の GPU が必要になります。

ザッカーバーグも 明らかになった AI アシスタントである Meta AI は Llama 3 を搭載する予定です。

最高製品責任者の Chris Cox 氏は、Llama 3 は Meta 全体に統合されると述べました。

「私たちの計画は、Llama 3 をアプリファミリー全体で複数の異なる製品とエクスペリエンスに提供することです」と彼は言いました。

オープンソース戦略

OpenAI with ChatGPT などのライバルが採用するクローズドで独自のアプローチとは明らかに対照的に、Llama 3 をオープンソース モデルとして開発するという同社の哲学的な取り組みを考えると、Llama XNUMX のリリースの影響は Meta をはるかに超えて広がります。

Meta は言語モデルをオープンソース化することで、オープン AI 開発のエコシステムを育成し、Llama ファミリをサードパーティの開発者や研究者によって作成された多様なツールやアプリケーションの基盤として位置づけることを目指しています。

「イノベーションは常に他者からの以前の貢献、時には非常に類似した貢献に基づいて構築されることを認識することが非常に重要です」とMetaのAI研究責任者ヤン・ルカン氏は先月ツイートした。 「これが、オープンリサーチが非常に重要である理由です。オープンリサーチにより、誰もがこの分野をより早く進歩させることができます。」

この オープンな精神 はすでにラマの周りに集まる活気に満ちたコミュニティを生み出しています。現在最も先進的なオープンソース言語モデルのいくつかは次のとおりです。 ミストラル, ファルコン、および Beluga は、初期の Llama 2 基礎モデルを微調整して構築されています。これらのコミュニティ モデルのいくつかは、特定のベンチマークで GPT-3.5 と同等またはそれを上回っています。

別のオープンソース基盤モデルとしての Llama-3 のリリースは、AI の品質と効率の点でさらに高い基準を設定する新世代の LLM への道を開く可能性があります。

OpenAI の優位性への挑戦

Llama 3 のオープンソースの前提は、OpenAI の現在の市場支配力、ひいては Claude や Gemini などの他の独自モデルに対して、手ごわい多層的な課題をもたらします。

オープンソース コミュニティは間もなく Llama 3 を基盤として構築し、そのバリエーションを迅速に反復して潜在的に GPT-4 の機能と同等またはそれを超えています—GPT-3.5に対してやったのと同じように。オープン エコシステムは、コントリビューター間で共有されるトレーニング コストが低いため、膨大なコンピューティング リソースとコストを必要とする OpenAI 独自のモデル開発を飛び越える可能性があります。

オープンソース製品が商用製品と同等の水準を定期的に達成すれば、企業は OpenAI に依存してお金を払うよりも、Llama のようなよりアクセスしやすくコスト効率の高いエコシステムに引き寄せられるかもしれません。現在、GPT-4 はトークンあたりのコストの点で市場で最も高価なモデルです。

さらに、オープンソース コミュニティは、より多くの人が参加するほど強力になります。メタは、モデルの上に巨大なコミュニティを構築し、モデルを微調整し、新しいテクノロジーを開発し、無償で改善することで恩恵を受けています。これにより、Meta は、次のような代替スキームを通じてモデルを収益化しながら、モデルのより良いバージョンを開発することが容易になります。 大企業による商用利用のライセンス供与.

言い換えれば、継続的な慣性とネットワーク効果により、将来的に OpenAI の独自モデルがユーザーや顧客を引き付けることが難しくなる可能性があります。

確かに、OpenAI は現在、収益性の面で強力なリードを保っています。 Anthropic は、AI 分野で最高のパフォーマンスを誇る LLM を誇ります。しかし、Llama 3 は、生成 AI の状況を一変させるメタによる新たな戦略的攻撃となるでしょう。

もちろん、多くは Llama 3 の実世界でのパフォーマンスと今後 2 年間の採用に依存します。しかし、オープンソース AI コミュニティは非常に活発で、すでに Llama-5 を愛しています。特に OpenAI の GPT-XNUMX に関しては、今後数か月で非常に興味深いものになるでしょう。 角を曲がったところ.

による編集 ライアン・オザワ.

暗号ニュースを常に把握し、受信トレイで毎日更新を入手してください。

タイムスタンプ:

より多くの 解読する