トリトン
Amazon SageMaker と NVIDIA NIM マイクロサービスの統合を使用して、NVIDIA GPU での LLM 推論の価格パフォーマンスを最適化する |アマゾン ウェブ サービス
ソースノード: 1957361
タイムスタンプ: 2024 年 3 月 18 日
Amazon SageMaker を使用して基盤モデルの推論を数百のモデルに拡張する – パート 1 | アマゾン ウェブ サービス
ソースノード: 1919452
タイムスタンプ: 2023 年 11 月 30 日
新しい Amazon SageMaker コンテナで LLM の推論パフォーマンスを向上 | アマゾン ウェブ サービス
ソースノード: 1918390
タイムスタンプ: 2023 年 11 月 27 日
Amazon Music が NVIDIA と SageMaker を使用して ML トレーニングと推論のパフォーマンスとコストを最適化する方法 | アマゾン ウェブ サービス
ソースノード: 1916113
タイムスタンプ: 2023 年 11 月 21 日
MONAI を使用して医療画像 AI 推論パイプラインを構築する AWS にデプロイする | アマゾン ウェブ サービス
ソースノード: 1911054
タイムスタンプ: 2023 年 11 月 8 日
Veriff が Amazon SageMaker マルチモデル エンドポイントを使用してデプロイ時間を 80% 短縮した方法 | アマゾン ウェブ サービス
ソースノード: 1902575
タイムスタンプ: 2023 年 10 月 16 日