この投稿の内容と意見はサードパーティの作成者のものであり、AWSはこの投稿の内容または正確性について責任を負いません。
コンピュータービジョンや自然言語処理などのディープラーニング手法を使用する組織が増えるにつれ、機械学習(ML)開発者のペルソナには、実験の追跡、系統、コラボレーションに関するスケーラブルなツールが必要になります。 実験の追跡には、オペレーティングシステム、使用するインフラストラクチャ、ライブラリ、入力データセットと出力データセットなどのメタデータが含まれます。多くの場合、スプレッドシートで手動で追跡されます。 リネージュには、MLモデルの作成に使用されるデータセット、変換、アルゴリズムの追跡が含まれます。 コラボレーションには、単一のプロジェクトに取り組んでいるML開発者と、チーム間およびビジネスの利害関係者と結果を共有するML開発者が含まれます。このプロセスは、通常、電子メール、スクリーンショット、およびPowerPointプレゼンテーションを介して行われます。
この投稿では、Weights&Biases(W&B)と自動運転車のユースケースのオブジェクトを識別するためのモデルをトレーニングします。 アマゾンセージメーカー。 共同ソリューションがML開発者の手作業を削減し、モデル開発プロセスの透明性を高め、チームがプロジェクトで共同作業できるようにする方法を紹介します。
この例を実行します Amazon SageMakerスタジオ あなたが自分で試してみるために。
ウェイトとバイアスの概要
Weights&Biasesは、MLチームがより優れたモデルをより迅速に構築するのに役立ちます。 SageMakerノートブックに数行のコードを含めるだけで、チームメートと協力しながら、モデル(アーキテクチャ、ハイパーパラメータ、git commit、モデルの重み、GPU使用率、データセット、予測)を即座にデバッグ、比較、再現できます。
W&Bは、世界で最も革新的な企業や研究機関の200,000万人以上のML実務家から信頼されています。 無料で試すには、でサインアップしてください ウェイトとバイアス、または訪問 W&BAWSマーケットプレイスのリスト.
SageMakerStudioの使用を開始する
SageMaker Studioは、MLの最初の完全統合開発環境(IDE)です。 Studioは、MLの実践者とデータサイエンティストが数回クリックするだけでモデルを構築、トレーニング、および展開できる単一のWebベースのインターフェイスをすべてXNUMXか所で提供します。
Studioの使用を開始するには、AWSアカウントと AWS IDおよびアクセス管理 (IAM)Studioドメインを作成する権限を持つユーザーまたはロール。 参照する AmazonSageMakerドメインにオンボード ドメインを作成するには、 スタジオのドキュメント Studioビジュアルインターフェイスとノートブックの使用の概要については、
環境をセットアップする
この投稿では、独自のコードを実行することに関心があるので、GitHubからいくつかのノートブックをインポートしましょう。 以下を使用します GitHubレポ 例として、ロードしましょう このノートブック.
ターミナルまたはStudioUIのいずれかを介してリポジトリのクローンを作成できます。 ターミナルを介してリポジトリのクローンを作成するには、システムターミナルを開きます( File メニュー、選択 新作 & ターミナル)そして次のコマンドを入力します:
Studio UIからリポジトリのクローンを作成するには、以下を参照してください。 SageMakerStudioでGitリポジトリのクローンを作成する.
開始するには、 01_データ処理.ipynb ノート。 カーネルスイッチャープロンプトが表示されます。 この例ではPyTorchを使用しているため、ビルド済みのものを選択できます PyTorch 1.10 Python3.8GPU最適化 ノートブックを起動するための画像。 アプリが起動しているのがわかります。カーネルの準備が整うと、ノートブックの右上にインスタンスの種類とカーネルが表示されます。
私たちのノートブックには、いくつかの追加の依存関係が必要です。 このリポジトリは、追加の依存関係を持つrequirements.txtを提供します。 最初のセルを実行して、必要な依存関係をインストールします。
ライフサイクル構成を作成して、PyTorchアプリを起動するたびにパッケージを自動的にインストールすることもできます。 見る ライフサイクル設定を使用してAmazonSageMakerStudioをカスタマイズする 手順とサンプル実装について。
SageMakerStudioでウェイトとバイアスを使用する
ウェイトとバイアス(wandb
)は標準のPythonライブラリです。 インストールすると、トレーニングスクリプトに数行のコードを追加するだけで、実験を記録する準備が整います。 すでにrequirements.txtファイルからインストールしています。 次のコードを使用して手動でインストールすることもできます。
ケーススタディ:自動運転車のセマンティックセグメンテーション
データセット
私たちは、使用 ケンブリッジ-運転ラベル付きビデオデータベース (CamVid)この例では。 これには、メタデータを備えたオブジェクトクラスのセマンティックラベルが付いたビデオのコレクションが含まれています。 データベースは、各ピクセルを32のセマンティッククラスのXNUMXつに関連付けるグラウンドトゥルースラベルを提供します。 データセットを次のようにバージョン管理できます wandb.アーティファクト、そうすれば後で参照できます。 次のコードを参照してください。
あなたはで従うことができます 01_データ処理.ipynb ノート。
また、ログに記録します テーブル データセットの。 テーブルは豊富で強力なDataFrameのようなエンティティであり、表形式のデータのクエリと分析を可能にします。 データセットを理解し、モデルの予測を視覚化し、中央のダッシュボードで洞察を共有できます。
重みとバイアスの表は、画像、音声、波形など、多くのリッチメディア形式をサポートしています。 メディア形式の完全なリストについては、を参照してください。 データ型.
次のスクリーンショットは、グラウンドトゥルースセグメンテーションを使用した生の画像の表を示しています。 また、表示することができます このテーブルのインタラクティブバージョン.
モデルをトレーニングする
これで、モデルを作成し、データセットでトレーニングできます。 を使用しております パイトーチ & ファタイ ベースラインのプロトタイプをすばやく作成してから、 wandb.Sweeps
ハイパーパラメータを最適化します。 でフォローしてください 02_semantic_segmentation.ipynb ノート。 ノートブックを開くときにカーネルの入力を求められたら、最初のノートブックから同じカーネルを選択します。 PyTorch 1.10 Python3.8GPU最適化。 同じアプリを使用しているため、パッケージはすでにインストールされています。
モデルは、自律エージェントの観点からキャプチャされたシーンのピクセルごとの注釈を学習することになっています。 モデルは、特定のシーンの各ピクセルを、道路、歩行者、歩道、車など、32の関連するカテゴリに分類またはセグメント化する必要があります。 テーブル上のセグメント化された画像のいずれかを選択し、このインタラクティブなインターフェイスにアクセスして、セグメンテーションの結果とカテゴリにアクセスできます。
から ファタイ ライブラリはと統合されています wandb
、あなたは単に渡すことができます WandbCallback
学習者へ:
ベースライン実験では、 Uネット とは異なるバックボーンを持つ紙 ティム。 モデルをトレーニングしました フォーカルロス 基準として。 次のスクリーンショットに示すように、Weights&Biasesを使用すると、実験の概要を含むダッシュボードを簡単に作成して、トレーニング結果をすばやく分析できます。 あなたもすることができます このダッシュボードをインタラクティブに表示する.
スイープを使用したハイパーパラメータ検索
ベースラインモデルのパフォーマンスを向上させるには、トレーニングする最適なモデルと最適なハイパーパラメータのセットを選択する必要があります。 W&Bを使用すると、これを簡単に使用できます スイープ.
私たちは実行します ベイジアンハイパーパラメータ検索 検証データセットのモデルの前景精度を最大化することを目的としています。 スイープを実行するには、構成ファイルsweep.yamlを定義します。 このファイル内で、使用する目的のメソッドを渡します。ベイとパラメーター、およびそれらに対応する値を検索します。 この例では、さまざまなバックボーン、バッチサイズ、および損失関数を試します。 また、学習率や重みの減衰など、さまざまな最適化パラメーターについても説明します。 これらは連続値であるため、分布からサンプリングします。 複数あります スイープに使用できる構成オプション。
その後、ターミナルで、を使用してスイープを起動します wandbコマンドライン:
次に、次のコードを使用して、このマシンでスイープエージェントを起動します。
スイープが終了したら、平行座標プロットを使用して、さまざまなバックボーンとさまざまなハイパーパラメーターのセットを使用したモデルのパフォーマンスを調べることができます。 これに基づいて、どのモデルが最高のパフォーマンスを発揮するかを確認できます。
次のスクリーンショットは、平行座標チャートとパラメーター相関チャートを含むスイープの結果を示しています。 あなたもすることができます このスイープダッシュボードをインタラクティブに表示.
スイープから次の重要な洞察を引き出すことができます。
- 学習率が低く、重みの減衰が少ないと、前景の精度とダイススコアが向上します。
- バッチサイズは、メトリックと強い正の相関関係があります。
- VGGベースのバックボーン 最終モデルは結果として生じる傾向があるため、最終モデルをトレーニングするのに適したオプションではない可能性があります。 勾配消失。 (損失が発散したため、それらは除外されます。)
- レスネット バックボーンは、メトリックに関して全体的に最高のパフォーマンスをもたらします。
- ResNet34またはResNet50バックボーンは、メトリックの点で強力なパフォーマンスを発揮するため、最終モデルとして選択する必要があります。
データとモデルの系統
W&Bアーティファクトは、ファイルをW&Bで保存するかどうか、またはW&Bで追跡するバケットが既にあるかどうかに関係なく、データセットとモデルを簡単にバージョン管理できるように設計されています。 データセットまたはモデルファイルを追跡した後、W&Bは各変更を自動的にログに記録し、ファイルへの変更の完全で監査可能な履歴を提供します。
この場合、トレーニング中に生成されたデータセット、モデル、およびさまざまなテーブルがワークスペースに記録されます。 に移動すると、この系統をすばやく表示して視覚化できます。 アーティファクト ページで見やすくするために変数を解析したりすることができます。
モデルの予測を解釈する
重量とバイアスは、次の力を使用してモデルのパフォーマンスを評価するときに特に役立ちます。 wandb.テーブル モデルがうまく機能していない場所を視覚化するため。 この場合、自転車や歩行者など、正しく脆弱なユーザーを検出することに特に関心があります。
予測されたマスクをクラスごとのダイススコア係数とともにテーブルに記録しました。 次に、目的のクラスを含む行でフィルタリングし、Diceスコアの昇順で並べ替えました。
次の表では、最初にDiceスコアが正の場所(画像内に歩行者がいる場所)を選択してフィルタリングします。 次に、昇順で並べ替えて、最も検出された歩行者を特定します。 1に等しいダイススコアは、歩行者クラスを正しくセグメント化することを意味することに注意してください。 あなたもすることができます この表をインタラクティブに表示.
自転車や信号機など、他の脆弱なクラスでもこの分析を繰り返すことができます。
この機能は、正しくラベル付けされていない画像を識別し、タグを付けて再注釈を付けるための非常に優れた方法です。
まとめ
この投稿では、Weights&Biases MLOpsプラットフォーム、SageMaker StudioでW&Bをセットアップする方法、および共同ソリューションで入門ノートブックを実行する方法を紹介しました。 次に、自動運転車のセマンティックセグメンテーションのユースケースを実行し、W&B実験を使用した追跡トレーニングの実行、W&Bスイープを使用したハイパーパラメータの最適化、およびW&Bテーブルを使用した結果の解釈を示しました。
詳細に興味がある場合は、ライブにアクセスできます W&Bレポート。 ウェイトとバイアスを無料で試すには、次のURLでサインアップしてください。 ウェイトとバイアス、または訪問 W&BAWSマーケットプレイスのリスト.
著者について
トーマス・カペレ は、WeightsandBiasesの機械学習エンジニアです。 彼は、www.github.com / wandb/examplesリポジトリを最新の状態に保つ責任があります。 彼はまた、MLOPS、業界へのW&Bのアプリケーション、および一般的な楽しいディープラーニングに関するコンテンツを構築しています。 以前は、ディープラーニングを使用して太陽エネルギーの短期予測を解決していました。 彼は、都市計画、組み合わせ最適化、交通経済学、および応用数学のバックグラウンドを持っています。
ドゥルガスリー は、Amazon SageMakerServiceSAチームのMLソリューションアーキテクトです。 彼女は、機械学習を誰もが利用できるようにすることに情熱を注いでいます。 AWSでの3年間、彼女は企業顧客向けのAI/MLプラットフォームのセットアップを支援してきました。 仕事をしていないときは、バイクに乗る、ミステリー小説、XNUMX歳のハスキーと一緒にハイキングをするのが大好きです。
カルティク・バラシー はAmazonSageMakerの製品リーダーであり、XNUMX年以上の製品管理、製品戦略、実行、発売の経験があります。
- "
- &
- 000
- 10
- 100
- a
- 私たちについて
- アクセス
- アクセス可能な
- アクセス
- 越えて
- NEW
- AI
- アルゴリズム
- すべて
- 既に
- Amazon
- 分析
- 分析します
- アプリ
- 適用された
- 建築
- 周りに
- 仲間
- オーディオ
- 自動的に
- 自律的
- 利用できます
- AWS
- 背景
- ベースライン
- なぜなら
- BEST
- ビルド
- 構築します
- ビジネス
- 自動車
- 場合
- 中央の
- チャート
- 選択する
- 選ばれた
- class
- クラス
- コード
- 協力します
- 協業
- 環境、テクノロジーを推奨
- コレクション
- 企業
- コンプリート
- コンピュータ
- 含まれています
- コンテンツ
- 対応する
- 作ります
- 作成します。
- Customers
- ダッシュボード
- データ
- データベース
- 十年
- 決定しました
- 深いです
- 実証
- 展開します
- 設計
- Developer
- 開発者
- 開発
- 異なります
- ディストリビューション
- ドメイン
- 間に
- 各
- 簡単に
- Economics
- enable
- 可能
- エネルギー
- エンジニア
- 入力します
- Enterprise
- エンティティ
- 環境
- 特に
- 誰も
- 例
- 実行
- 体験
- 実験
- 探る
- スピーディー
- 速いです
- 特徴
- 名
- フォロー中
- 無料版
- から
- フル
- 楽しいです
- 機能
- 生成された
- Gitの
- GitHubの
- 与え
- 目標
- 行く
- 良い
- GPU
- 助けました
- ことができます
- history
- 認定条件
- How To
- HTTPS
- 識別する
- 識別
- アイデンティティ
- 画像
- 画像
- 実装
- 改善します
- 含ま
- 含めて
- 産業
- インフラ
- 革新的な
- 洞察
- インスピレーションある
- install
- 統合された
- 統合
- 相互作用的
- 興味がある
- インタフェース
- はじめに
- IT
- キープ
- 保管
- キー
- ラベル
- 言語
- 起動する
- リーダー
- LEARN
- 学習
- 図書館
- ライン
- リスト
- ライブ
- 負荷
- 機械
- 機械学習
- make
- 作る
- 作成
- 管理
- マニュアル
- 手仕事
- 手動で
- 市場
- マスク
- math
- 手段
- メディア
- メトリック
- かもしれない
- マインド
- ML
- モデル
- 他には?
- 最も
- オートバイ
- の試合に
- 謎
- ナチュラル
- ニーズ
- ノート
- 開いた
- 開設
- オペレーティング
- オペレーティングシステム
- 意見
- 最適化
- 最適化
- オプション
- オプション
- 注文
- 組織
- その他
- 全体
- 自分の
- 紙素材
- 特に
- 情熱的な
- パフォーマンス
- 公演
- 計画
- プラットフォーム
- プラットフォーム
- ポイント
- 視点
- 正の
- 電力
- 強力な
- 予測
- 現在
- プレゼンテーション
- プロセス
- 処理
- プロダクト
- 製品管理
- 生産性
- プロジェクト
- プロジェクト(実績作品)
- は、大阪で
- すぐに
- Raw
- 関連した
- 繰り返す
- 倉庫
- の提出が必要です
- 要件
- 研究
- 責任
- 結果として
- 結果
- ロード
- 職種
- ラン
- ランニング
- 同じ
- ド電源のデ
- シーン
- 科学者たち
- を検索
- セグメント
- セグメンテーション
- サービス
- セッションに
- シェアする
- シェアリング
- 短期
- ショーケース
- 示す
- 符号
- 簡単な拡張で
- サイズ
- So
- 太陽
- 太陽エネルギー
- 溶液
- ソリューション
- 解決する
- 一部
- 標準
- start
- 開始
- 店舗
- 戦略
- 強い
- 研究
- 勉強
- サポート
- スイープ
- チーム
- チーム
- テクニック
- ターミナル
- 条件
- ジョイント
- 世界
- サードパーティ
- 介して
- 時間
- top
- 追跡する
- 追跡
- トラフィック
- トレーニング
- 変換
- 透明性
- 信頼されている
- ui
- わかる
- 都市
- us
- つかいます
- users
- 値
- さまざまな
- 自動車
- バージョン
- ビデオ
- 動画
- 詳しく見る
- ビジョン
- 脆弱な
- ウェブベースの
- かどうか
- while
- Wikipedia
- 仕事
- ワーキング
- 世界
- 年
- あなたの