分析プラットフォーム Databricks は、企業がそのツールを使用して LLM の時流に乗ることを期待して、オープンソースの基本的な大規模言語モデルを立ち上げました。
Apache Spark を中心に設立されたこのビジネスは、DBRX と呼ばれる汎用 LLM が言語理解、プログラミング、数学の点でオープンソースのライバルに勝ると主張する多数のベンチマークを公開しました。開発者はまた、同じ基準で OpenAI 独自の GPT-3.5 を上回ったと主張しました。
DBRX は Mosaic AI によって開発されました。 データブリックを取得しました 1.3 億ドルで、Nvidia DGX Cloud でトレーニングされました。 Databricks は、複数の専門家ネットワークまたは学習者が問題を分割する、専門家混合 (MoE) アーキテクチャと呼ばれるものを使用して効率を高めるために DBRX を最適化したと主張しています。
Databricks 氏は、このモデルには 132 億個のパラメーターがあるが、36 つの入力でアクティブになるのは XNUMX 億個だけであると説明しました。
Databricks マーケティング副社長の Joel Minnick 氏は次のように述べています。 登録: 「それが、このモデルがこれほど効率的に実行できるだけでなく、驚くほど高速に実行できる大きな理由です。実際のところ、現在世に出ている主要なチャットボットを使用している場合は、おそらく、回答が生成されるのを待って見守ることに慣れているでしょう。 DBRX を使用すると、ほぼ瞬時に完了します。」
ただし、モデル自体のパフォーマンスは Databricks にとって重要ではありません。結局のところ、ビジネスの目的は、DBRX を次の目的で利用できるようにすることです。 GitHub で無料 および ハグ顔.
Databricks は、顧客がこのモデルを独自の LLM の基礎として使用することを望んでいます。そうなれば、顧客のチャットボットや社内の質問応答が改善される可能性があると同時に、Databricks 独自のツールを使用して DBRX がどのように構築されたかも示される可能性があります。
Databricks は、データ処理に Apache Spark と Databricks ノートブック、データ管理とガバナンスに Unity Catalog、実験追跡に MLflow を使用して、DBRX の開発元となったデータセットをまとめました。
ミニク氏は、サードパーティの所有権とガバナンスに対する懸念により、企業のLLMへの投資が遅れていることを明らかにした。 「データをサードパーティに移さなければならないこと、モデルの重みに対する所有権を持たないこと、データのガバナンスをエンドツーエンドで完全に制御できないこと、これらが速度を低下させる要因です」と彼は説明しました。
「私たちが構築しようとしたのは、企業が独自の特定のユースケースに合わせて独自のアプリケーションに導入するために使用できる、非常に効率的なモデルでした。」
Amalgam Insights の CEO 兼主任アナリストである Hyun Park 氏は、DBRX の重要性は、Databricks がモデルがどのように構築されたかを、他の企業がフォローして微調整するためのプロセスとして段階的に表示できることであると述べました。
「エンドツーエンドのモデルのチューニング、テスト、運用化における系統、可視性、再現性、モデルの所有権の組み合わせが重要です。」
Park 氏は、Databricks がクライアント向けにすでに 50,000 を超えるカスタム モデルを構築していることを理解していると述べました。 「モデル構築の経験と、最高の民間およびオープンソースの取り組みと同等の高性能モデルを大規模に実行できる能力の組み合わせこそが、この発表をエンタープライズ IT の観点から私にとって注目すべきものにしているのです。」
DBRX ニュースは、Databricks の競争環境の変化を背景に展開されます。この業界は Microsoft と長期的な戦略的パートナーシップを結んでおり、その結果、Azure Databricks が誕生しました。ユーザーは、レドモンドの巨人のクラウド プラットフォームと緊密に連携した統合データ サービスが約束されています。
しかし、2017 年にこのサービスが開始されて以来、Microsoft は Databricks のレイクハウス市場に参入しており、ユーザーには XNUMX つの環境でデータ ウェアハウジングとデータ レイクが提供されており、エンタープライズ グレードの LLM をユーザーに約束しています。 その10億ドル OpenAI パートナーシップ。ファブリック環境では、 マイクロソフトも提供できます トランザクション データベース システム Azure Cosmos DB および Azure SQL DB からの「ミラーリング」により、データを移動せずに分析サービスへのアクセスを提供します。
Databricks と Microsoft の両方の戦略にかかっている未解決の疑問は、LLM テクノロジーへの予想される大量の投資がいつ到着するかということです。 1月に、 ガートナーの予測 このテクノロジーに対する企業の支出は今年は予定されておらず、他の IT 投資への影響はほとんどないでしょう。 ®
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://go.theregister.com/feed/www.theregister.com/2024/03/28/databricks_dbrx_llm/
- :持っている
- :は
- :not
- :どこ
- $UP
- 000
- 2017
- 36
- 50
- 7
- a
- 能力
- できる
- アクセス
- 越えて
- アクティブ
- 後
- に対して
- AI
- すべて
- 既に
- また
- an
- アナリスト
- 分析論
- および
- お知らせ
- 回答
- 応答
- どれか
- アパッチ
- 建築
- です
- 周りに
- AS
- At
- 利用できます
- Azure
- 背景
- 基礎
- BE
- ビート
- さ
- ベンチマーク
- BEST
- ビッグ
- 10億
- BIZ
- 両言語で
- 持って来る
- ビルド
- 建物
- 内蔵
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- コール
- 缶
- 例
- カタログ
- 最高経営責任者(CEO)
- 変化
- チャットボット
- チーフ
- 主張した
- 主張
- クレーム
- クライアント
- 密接に
- クラウド
- クラウドプラットフォーム
- CO
- 組み合わせ
- 到来
- 競争力のある
- コントロール
- コスモス
- カスタム
- 顧客
- Customers
- データ
- データ管理
- データ処理
- データベース
- 遅延
- 発展した
- Developer
- 分割
- do
- ありません
- ダウン
- ダビングされた
- 効率
- 効率的な
- 効率良く
- 努力
- 端から端まで
- Enterprise
- エンタープライズグレード
- 企業
- 環境
- 予想される
- 体験
- 実験
- エキスパート
- 説明
- 非常に
- ファブリック
- スピーディー
- 恐怖
- 終わり
- 洪水
- 基礎的な
- 設立
- から
- 完全に
- 一般的用途
- 生成された
- 取得する
- 巨大な
- Go
- 行く
- ガバナンス
- 持っていました
- 起こります
- 持ってる
- 持って
- he
- ハイ
- 期待して
- 認定条件
- HTTPS
- if
- 影響
- 重要
- 改善します
- in
- 洞察
- 統合された
- 内部
- に
- 投資
- IT
- ITS
- 自体
- 1月
- JPG
- ジャンプ
- 種類
- 湖
- 言語
- 大
- 打ち上げ
- 学習者
- 系統
- 少し
- LLM
- 長期的
- 主要な
- 作る
- 作成
- 管理
- 市場
- マーケティング
- math
- me
- 措置
- Microsoft
- かもしれない
- ミラーリング
- モデル
- 移動
- 移動する
- の試合に
- 近く
- ネットワーク
- ニュース
- 注目すべき
- 注意
- Nvidia
- of
- 提供
- 提供
- 提供すること
- on
- ONE
- の
- 開いた
- オープンソース
- OpenAI
- オプト
- 最適化
- or
- その他
- でる
- が
- 自分の
- 所有権
- パラメータ
- パーク
- パーティー
- パートナーシップ
- パフォーマンス
- 実行
- 視点
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 演劇
- ポイント
- 所持
- 実用的
- 社長
- プライベート
- 多分
- 問題
- プロセス
- 処理
- プログラミング
- 約束された
- 約束
- 所有権
- 公表
- 置きます
- 質問
- RE
- 理由
- 明らかに
- ライバル
- ラン
- runs
- s
- 同じ
- 規模
- サービス
- セッションに
- 表示する
- 表示
- 意義
- から
- 遅く
- ソース
- スパーク
- 特定の
- 支出
- 戦略的
- 戦略的パートナーシップ
- 作戦
- システム
- テクノロジー
- テクノロジー
- 条件
- テスト
- それ
- アプリ環境に合わせて
- それら
- そこ。
- ボーマン
- 物事
- 三番
- 第三者
- サードパーティ
- この
- 今年
- タイド
- 〜へ
- 今日
- 一緒に
- 言われ
- 豊富なツール群
- 追跡
- 訓練された
- トランザクションの
- 曲
- チューニング
- 理解する
- 理解された
- ユニティ
- つかいます
- 中古
- users
- バイス
- 副会長
- 視認性
- 待っています
- ました
- 見ている
- we
- この試験は
- いつ
- which
- while
- なぜ
- 意志
- 無し
- 勝った
- でしょう
- 年
- You
- ゼファーネット