TorchVision v0.11のスニークピーク– TorchVision開発者の回顧録– 2

TorchVision v0.11のスニークピーク– TorchVision開発者の回顧録– 2

トーチビジョン v0.11 のスニーク ピーク – トーチビジョン開発者の回想録 – 2 PlatoBlockchain Data Intelligence。垂直検索。あい。
TorchVision v0.11のスニークピーク– TorchVision開発者の回顧録– 2

PyTorchv1.10とTorchVisionv0.11のリリースを必死に準備しているため、ここ数週間は「PyTorchLand」で非常に忙しかったです。 この第2回では シリーズ、TorchVisionのリリースブランチに現在含まれている今後の機能のいくつかについて説明します。

免責事項: 今後のリリースには多くの機能強化とバグ/テスト/ドキュメントの改善が含まれていますが、ここでは私が個人的に興味を持っているドメインの新しい「ユーザー向け」機能に焦点を当てています。 ブログ投稿を書いた後、私はまた、私がレビューした、書いた、またはそれらの開発を綿密に追跡した機能への偏見に気づきました。 機能をカバーする(またはカバーしない)ことは、その重要性について何も言いません。 表明された意見は私自身のものです。

新モデル

新しいリリースには、新しいモデルが満載です。

  • KaiZhangはの実装を追加しました RegNetアーキテクチャ 事前にトレーニングされたウェイトと一緒に 14種類 元の紙を忠実に再現します。
  • 最近、の実装を追加しました EfficientNetアーキテクチャ LukeMelas-KyriaziとRossWightmanによって提供されたバリアントB0-B7の事前トレーニング済みウェイトとともに。

新しいデータ拡張

最新バージョンには、いくつかの新しいデータ拡張手法が追加されています。

  • サミュエルガブリエルが貢献しました 些細なオーグメント、AutoAugmentよりも優れた結果を提供するように見える新しいシンプルで非常に効果的な戦略。
  • 追加しました ランドオーグメント 自動拡張のメソッド。
  • 私はの実装を提供しました MixupとCutMix 参照で変換します。 これらは、APIが完成すると、次のリリースでトランスフォームに移動されます。

新しい演算子とレイヤー

いくつかの新しい演算子とレイヤーが含まれています。

参考資料/トレーニングレシピ

参照スクリプトの改善は継続的な取り組みですが、次のバージョンに含まれるいくつかの新機能を次に示します。

  • PrabhatRoyはのサポートを追加しました 指数移動平均 私たちの分類レシピで。
  • サポートするために参照を更新しました ラベルスムージング、最近、JoelSchlosserとThomasJ.FanによってPyTorchコアに導入されました。
  • 実行するオプションを含めました 学習率ウォーミングアップ、IlqarRamazanliによって開発された最新のLRスケジューラーを使用します。

その他の改善

このリリースで追加されたその他の注目すべき改善点は次のとおりです。

  • アレクサンダーソアレとフランシスコマッサは FXベースのユーティリティ これにより、モデルアーキテクチャから任意の中間機能を抽出できます。
  • NikitaShulgaがのサポートを追加しました CUDA 11.3 TorchVisionへ。
  • ZhongkaiZhuは 依存関係の問題 JPEG libの(この問題は多くのユーザーに大きな頭痛の種を引き起こしました)。

進行中および次のアップ

このリリースでは実現しなかった、開発中のエキサイティングな新機能がたくさんあります。 ここにいくつかあります:

  • Moto Hira、Parmeet Singh Bhatiaと私はRFCを起草しました。これは、 モデルのバージョン管理 事前にトレーニングされた重みに関連付けられたメタデータを処理するため。 これにより、モデルごとに事前にトレーニングされた複数の重みをサポートし、ラベル、前処理変換などの関連情報をモデルに添付できるようになります。
  • 私は現在、「電池含む」プロジェクトの精度を向上させるために 事前トレーニング済みモデル。 目標は、TorchVisionが提供する最も人気のある事前トレーニング済みモデルでクラス最高の結果を達成することです。
  • PhilipMeierとFranciscoMassaは、TorchVisionの新しいプロトタイプのエキサイティングなプロトタイプに取り組んでいます。 データセット および 変換 APIです。
  • Prabhat Royは、PyTorchCoreの拡張に取り組んでいます。 AveragedModel サポートするクラス バッファの平均化 パラメータに加えて。 この機能の欠如は、一般的にバグとして報告され、 多数のダウンストリームライブラリを有効にする カスタムEMA実装を削除するためのフレームワーク。
  • アディツア・オケ ユーティリティを書いた 許可する 結果をプロットする 元の画像のキーポイントモデルの数(私たちが圧倒され、時間内にレビューできなかったため、機能はリリースに到達しませんでした🙁)
  • 私は構築しています プロトタイプFX-ユーティリティ これは、任意のモデルアーキテクチャで残留接続を検出し、ネットワークを変更して正則化ブロックを追加することを目的としています( StochasticDepth).

最後に、バックログにいくつかの新機能があります(PRは近日公開予定)。

上記の要約がおもしろいと思います。 ブログシリーズのフォーマットをどのように適応させるかについてのアイデアは大歓迎です。 私を襲って LinkedIn or Twitter.

タイムスタンプ:

より多くの データムボックス