ジェネレーティブ AI アプリケーションの作成に使用される大規模な言語およびビジョンモデルのトレーニング、微調整、および展開を加速するために、AWS と Hugging Face の間の拡張されたコラボレーションを発表できることを嬉しく思います。 Generative AI アプリケーションは、テキストの要約、質問への回答、コード生成、画像の作成、エッセイや記事の作成など、さまざまなタスクを実行できます。
AWS には、ジェネレーティブ AI におけるイノベーションの深い歴史があります。 たとえば、Amazon は AI を使用して、顧客が毎週何十億回もやり取りしている Alexa との会話体験を提供しています。 Alexa で作成する. さらに、Amazon Search 内のグループである M5 は、Amazon 全体のチームが大規模なモデルをアプリケーションに導入し、大規模なモデルをトレーニングして改善するのを支援します。 Amazon.com での検索結果. AWS は、インフラストラクチャ、ツール、 アマゾンセージメーカー、AI サービスなど アマゾン コード ウィスパラーは、IDE のコードとコメントに基づいてコードの推奨事項を生成することにより、開発者の生産性を向上させるサービスです。 AWS は、トレーニング用に専用の ML アクセラレーターも作成しました (AWS トレーニング) と推論 (AWSインフェレンティア) AWS での大規模な言語モデルとビジョン モデル。
Hugging Face が AWS を選択したのは、以下を含む Hugging Face モデルをトレーニング、微調整、およびデプロイするための最先端のツール全体に柔軟性を提供するためです。 アマゾンセージメーカー, AWS トレーニング, AWSインフェレンティア. Hugging Face を使用する開発者は、パフォーマンスを簡単に最適化し、コストを削減して、ジェネレーティブ AI アプリケーションをより迅速に運用できるようになりました。
高性能で費用対効果の高いジェネレーティブ AI
大規模な言語およびビジョン モデルの構築、トレーニング、デプロイは、費用と時間がかかるプロセスであり、機械学習 (ML) に関する深い専門知識が必要です。 モデルは非常に複雑で、何千億ものパラメータを含む可能性があるため、ジェネレーティブ AI は多くの開発者にとって手が届かないところにあります。
このギャップを埋めるために、Hugging Face は現在 AWS と協力して、開発者が AWS サービスにアクセスしやすくし、生成 AI アプリケーション専用の Hugging Face モデルをデプロイしやすくしています。 利点は次のとおりです。より高速なトレーニングと、低レイテンシーで高スループットの推論のスケーリング。 たとえば、Amazon EC2 Trn1 インスタンスは、 AWS トレーニング 同等の GPU ベースのインスタンスよりも最大 50% のコスト削減を実現しながら、トレーニング時間を短縮します。 Amazon EC2 の新しい Inf2 インスタンスは、最新世代の AWSインフェレンティア、最新世代の大規模な言語およびビジョン モデルを展開し、最大 1 倍のスループットと最大 4 倍の低レイテンシを実現することで Inf10 のパフォーマンスを向上させるために構築されています。 開発者は、ML 用のツールとワークフローを備えたサービスである Amazon SageMaker などのマネージド サービスを通じて、AWS Trainium と AWS Inferentia を使用できます。 または、Amazon EC2 で自己管理できます。
今日から始めましょう
AWS で Hugging Face モデルの使用を開始するには、次の XNUMX つの方法があります。SageMaker を使用する ジャンプスタート、 ハグフェイス AWS Deep Learning Containers (DLC), または チュートリアル モデルを AWS Trainium または AWS Inferentia にデプロイします。 Hugging Face DLC には、最適化されたトランスフォーマー、データセット、およびトークナイザー ライブラリが詰め込まれており、最小限のコード変更で生成 AI アプリケーションを数週間ではなく数時間で大規模に微調整およびデプロイできるようになります。 SageMaker JumpStart と Hugging Face DLC は、 すべての地域 Amazon SageMaker の場所 利用できます 追加料金なしでご利用いただけます。 読む ドキュメント および ディスカッションフォーラム詳細を確認するか、 サンプルノートブック 。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/aws-and-hugging-face-collaborate-to-make-generative-ai-more-accessible-and-cost-efficient/
- 7
- a
- 加速する
- 加速器
- アクセス
- アクセス可能な
- 越えて
- 添加
- NEW
- AI
- AIサービス
- アレクサ
- すべて
- Amazon
- Amazon EC2
- アマゾンセージメーカー
- および
- アナウンス
- エリア
- 物品
- 利用できます
- AWS
- AWSインフェレンティア
- ベース
- なぜなら
- 利点
- の間に
- 億
- 持って来る
- 変更
- 閉じる
- コード
- 協力します
- 協業
- 環境、テクノロジーを推奨
- 来ます
- 注釈
- 匹敵します
- 複雑な
- 絶えず
- 含む
- コンテナ
- 会話
- 費用
- 作ります
- 作成した
- 創造
- Customers
- データセット
- 深いです
- 深い専門知識
- 深い学習
- 配信する
- 配信する
- 展開します
- 展開する
- 展開
- Developer
- 開発者
- 各
- 容易
- 簡単に
- 効率的な
- enable
- 例
- 拡大
- 高価な
- 体験
- エクスペリエンス
- 専門知識
- 顔
- 速いです
- 柔軟性
- ギャップ
- 生成
- 世代
- 生々しい
- 生成AI
- グループ
- ことができます
- より高い
- history
- HOURS
- HTML
- HTTPS
- 抱き合う顔
- 何百
- 画像
- 改善します
- in
- 含めて
- ますます
- インフラ関連事業
- 革新的
- 革新的手法
- を取得する必要がある者
- 相互作用
- IT
- 言語
- 大
- 主として
- レイテンシ
- 最新の
- LEARN
- 学習
- ライブラリ
- 機械
- 機械学習
- make
- マネージド
- 多くの
- 最小限の
- ML
- モデル
- 他には?
- 新作
- 提供すること
- オファー
- 最適化
- 最適化
- パック
- パラメータ
- 部
- 実行する
- パフォーマンス
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- パワード
- プロセス
- 生産
- 生産性
- 質問
- 上げる
- リーチ
- 読む
- 提言
- 必要
- 結果
- セージメーカー
- 貯蓄
- 規模
- スケーリング
- を検索
- 選択
- サービス
- サービス
- から
- 特に
- start
- 開始
- 最先端の
- そのような
- タスク
- チーム
- アプリ環境に合わせて
- 三
- 興奮
- 介して
- スループット
- 時間
- 時間がかかる
- <font style="vertical-align: inherit;">回数</font>
- 〜へ
- 今日
- 豊富なツール群
- トレーニング
- 訓練された
- トレーニング
- トランスフォーマー
- つかいます
- 多様
- ビジョン
- 方法
- 週間
- while
- 以内
- ワークフロー
- 書き込み
- あなたの
- ゼファーネット