AWS は、GPU リソースを切望している顧客に、予定された日時に予約料金を支払う、前払いで注文の変更は許可されないという新しい金儲けのスキームを考案しました。
新しい消費モデルは Amazon Elastic Compute Cloud (EC2) として知られています ML のキャパシティ ブロック。 これにより、お客様は、短い機械学習ワークロードを実行するために、非常に需要の高い GPU コンピューティングにアクセスできるようになります。
機械学習モデルのトレーニングと推論のための GPU 容量に対する需要の増加が業界全体の供給を上回っており、GPU が希少なリソースとなっています。
もちろん AWS が認めていないのは、これはハイパースケーラーが GPU の待ち行列の先頭に立って、AWS 自体を含む供給を大量に供給しているためであるということです。 エヌビディア 報道によると は、第 22 四半期のカレンダー収益の 2% が単一のクラウド サービス プロバイダーによってもたらされたと述べました。
EC2 キャパシティ ブロックは、最初は Amazon EC2 で利用可能になります P5 仮想マシン インスタンス、現在、このタイプは p5.48xlarge の 192 つだけです。 これには 2 個の vCPU、100 TB のシステム メモリ、および XNUMX 個の Nvidia の HXNUMX GPU が搭載されており、かなり大規模なインスタンスになります。
AWS によると、EC2 キャパシティ ブロックの予約はホテルの部屋の予約と同じように機能します。 日付と期間、部屋のサイズを指定します。同様に、AWS では、GPU インスタンスが必要な日付と期間、および必要なインスタンスの数を選択できます。
お客様は、単一インスタンスまたは最大 2 個のインスタンスで構成される EC64 キャパシティ ブロックを予約でき、必要に応じて 14 ~ XNUMX 日間予約できます。 AWS はこれらを最大 XNUMX 週間前まで予約できるようにし、顧客は必要なときに GPU 容量を確保できることを確信して機械学習の導入を計画できると主張しています。
AWS によると、EC2 キャパシティ ブロックの価格は動的であり、顧客が購入する時点での需要と供給の利用可能な合計レベルに依存します。 AWS は、顧客が指定した範囲を満たす利用可能な最低価格の製品を表示すると主張しています。 あ 会社のブログのスクリーンショット は、2,344 日あたり XNUMX ドルかかる単一インスタンスの例を示しています。
しかし、ここに問題があります。EC2 キャパシティ ブロックの総コストは前払いされ、12 時間以内にアカウントに請求されます。また、AWS は購入後の変更やキャンセルを許可していません。 したがって、その日にその GPU 容量が本当に必要かどうかを確認したほうがよいでしょう。
そして、時間が経過すると、作業は無造作に停止されます。 EC2 は、Amazon EventBridge を通じてイベントを発行して予約が終了することを警告し、ユーザーがワークロードをチェックポイントできるようにします。 実行中のインスタンスは予約が終了する 30 分前にシャットダウン状態になりますが、時間が経過すると、まだ実行中のインスタンスは終了されます。
EC2 キャパシティ ブロックは現在利用可能ですが、当初は AWS 米国東部 (オハイオ) リージョンでのみ利用可能です。 AWS によると、将来的には追加のリージョンとローカル ゾーンでも利用可能になる予定です。
クラウドビジネス 報告された収益 今年の第 23 四半期の売上高は 3 億ドルと、前年同期の 20.5 億ドルから増加しました。これは、クラウド市場の継続的な成長を反映していますが、顧客が支出を抑制する方法を模索しているため、ペースは鈍化しています。 他の大手クラウドと同様に、AWS は AI サービスの需要をその傾向に対抗する手段として捉えています。 ®
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- :持っている
- :は
- :not
- $UP
- 12
- 14
- 22
- 30
- a
- アクセス
- NEW
- 認める
- 進める
- 後
- AI
- AIサービス
- 警告
- 許す
- 許可されて
- Amazon
- Amazon EC2
- an
- および
- どれか
- です
- AS
- At
- 賃貸条件の詳細・契約費用のお見積り等について
- 利用できます
- AWS
- BE
- なぜなら
- より良いです
- ビッグ
- 10億
- BIZ
- ブロック
- ブロック
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- 買う
- by
- カレンダー
- 缶
- 容量
- 確実性
- 荷担した
- 主張
- クレーム
- クラウド
- CO
- 戦闘
- 来ます
- 会社
- 備えます
- 計算
- 消費
- 継続します
- 費用
- コース
- 現在
- 顧客
- Customers
- 日付
- 試合日
- 中
- 日
- 需要
- 配備
- ありません
- doesnの
- ドリブン
- デュレーション
- ダイナミック
- 前
- 東
- エンディング
- 終了
- イベント
- 例
- 特徴
- から
- フロント
- 未来
- Go
- GPU
- GPU
- 成長性
- 持ってる
- こちら
- 非常に
- ホテル
- HOURS
- HTTPS
- in
- 含めて
- 当初
- に
- IT
- ITS
- 自体
- JPG
- ただ
- 知っている
- 既知の
- 学習
- う
- ことができます
- させる
- レベル
- ような
- ローカル
- 機械
- 機械学習
- 作成
- 市場
- ミーツ
- メモリ
- 分
- モデル
- 修正されました
- 金儲け
- 必要
- 新作
- いいえ
- 今
- 数
- Nvidia
- of
- 提供すること
- オハイオ
- on
- かつて
- ONE
- の
- or
- 注文
- その他
- 平和
- 支払われた
- 支払う
- パーセント
- 計画
- 計画されました
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- かなり
- 価格、またオプションについて
- プロバイダー
- 購入
- Q2
- Q3
- 範囲
- 本当に
- 反射
- 払い戻し
- 地域
- 地域
- の提出が必要です
- 予約
- ご予約
- 予約済み
- リソースを追加する。
- リソース
- 収入
- ルーム
- ラン
- ランニング
- s
- 前記
- 同じ
- 言う
- 乏しい
- 予定の
- スキーム
- Seek
- 見て
- サービス
- サービスプロバイダー
- サービス
- ショート
- 表示する
- 作品
- サイズ
- So
- 指定の
- 支出
- 都道府県
- まだ
- 供給
- 需要と供給
- 確か
- それ
- アプリ環境に合わせて
- それら
- その後
- そこ。
- ボーマン
- 彼ら
- この
- 今年
- それらの
- 介して
- 時間
- <font style="vertical-align: inherit;">回数</font>
- 〜へ
- トータル
- トレーニング
- トレンド
- type
- us
- ユーザー
- バーチャル
- バーチャルマシン
- ました
- 仕方..
- 方法
- ウィークス
- いつ
- which
- 意志
- 以内
- 仕事
- 年
- You
- あなたの
- ゼファーネット
- ゾーン