Bing Chat は GPU を大量に消費するため、Microsoft は Oracle の

Bing Chat は GPU を大量に消費するため、Microsoft は Oracle の

Bing Chat は非常に GPU を必要とするため、Microsoft は Oracle の PlatoBlockchain Data Intelligence をレンタルする予定です。垂直検索。あい。

MicrosoftのAIサービスに対する需要は明らかに非常に大きく、あるいはレドモンドのリソースは非常に逼迫しているため、ソフトウェア大手は火曜日に発表された複数年契約の一環として、Bing Searchで使用される機械学習モデルの一部をOracleのGPUスーパークラスターにオフロードする計画を立てている。

Microsoftの検索およびAIマーケティングチームを率いるDivya Kumar氏は、「Oracleとの協力、およびMicrosoft Azure AIインフラストラクチャと合わせたOracle Cloudインフラストラクチャの使用により、顧客へのアクセスが拡大し、多くの検索結果の速度が向上します」と説明しました。で ステートメント.

この提携は本質的に次のとおりです。Microsoft は、言われている AI サービスの「爆発的な成長」に対応するために、より多くのコンピューティング リソースを必要としていますが、Oracle はたまたまレンタル可能な数万台の Nvidia A100 および H100 GPU を持っています。 ラリー・エリソンが設立したデータベース巨人が、自社のシリコン在庫を消費できるほどのクラウド顧客を抱えていないなどと示唆するのは私たちからは程遠い。

Microsoft は、生成型 AI チャットボットを自社の検索エンジンに最初に統合した企業の XNUMX つです。 起動する XNUMX 月に遡る Bing Chat の様子。 もう皆さんはそのドリルをご存知でしょう。Bing Chat にプロンプ​​ト、リクエスト、クエリを入力すると、Bing Chat は情報を検索したり、下手な詩を書いたり、画像やその他のコンテンツを生成したりしようとします。

サービスを支える大規模な言語モデルは、トレーニングに大規模な GPU クラスターを必要とするだけでなく、推論 (モデルを機能させるプロセス) を大規模に実行するためにも必要です。 この推論作業を支援するのは、Oracle の GPU スタックです。

XNUMX つのクラウドプロバイダーの最新のコラボレーションでは、Oracle Interconnect for Microsoft Azure を活用しており、これにより、Azure で実行されているサービスが Oracle Cloud Infrastructure (OCI) のリソースと対話できるようになります。 XNUMXつのスーパー軍団は、 前に はこのサービスを使用して、顧客が Azure で実行されているワークロードを OCI データベースに接続できるようにしました。

この場合、Microsoft はこのシステムを Azure Kubernetes Service と併用して Oracle の GPU ノードを調整し、Bing の AI 機能に対する需要とされるものに対応しています。

StatCounter によると、2023 年 XNUMX 月の Bing の 3.1パーセント すべてのプラットフォームを対象とした世界のウェブ検索市場シェア – これは Google の 91.6% と比較されますが、前月の 3% から増加しました。 デスクトップでは Bing が 9.1%、タブレットでは 4.6% に上昇しました。

StatCounter が間違っている可能性があります。 おそらく、Microsoft のおしゃべりな検索エンジンは、私たちが信じられているほど驚くほど人気が​​あるわけではありません。 おそらく Microsoft は、Bing の需要が高いように見せたいだけなのかもしれません。 おそらくレドモンドには追加のコンピューティングが本当に必要なのかもしれません。

オラクルは、おそらくBingが使用するクラウドスーパークラスタは、超低遅延のリモートダイレクトメモリアクセス(RDMA)ネットワークを使用して、それぞれ32,768個のNvidia A100または16,384個のH100 GPUまで拡張できると主張している。 これは、高度な並列アプリケーションをサポートするように設計されたペタバイト規模の高性能クラスター ファイル ストレージによってサポートされています。

Microsoftは自社のAIサービスやアプリにOracleのGPUノードがどれだけ必要かについては明らかにしておらず、今後も明らかにしない。 広報担当者は「これらは、この発表の一環として私たちが共有する詳細ではない」と語った。 私たちはオラクルにも詳細を尋ねており、何か返答があればお知らせします。

敵対者同士が助けを求め合うのはこれが初めてではない。 XNUMX月に遡るとオラクル 発表の データベース システムを Microsoft Azure データセンターに併置することになります。 この場合、コラボレーションは、OCI で実行されている Oracle データベースを Azure のワークロードに接続する際の待機時間を短縮することを目的としていました。 ®

タイムスタンプ:

より多くの 登録