トーチビジョン V0.11 の概要 – トーチビジョン開発者の回想録

プラトン再発行

フォロワー： 0

トーチビジョン v0.11 のスニークピーク – トーチビジョン開発者の回想録 – 2 PlatoBlockchain Data Intelligence。垂直検索。あい。 — TorchVision v0.11のスニークピーク– TorchVision開発者の回顧録– 2

PyTorchv1.10とTorchVisionv0.11のリリースを必死に準備しているため、ここ数週間は「PyTorchLand」で非常に忙しかったです。この第2回ではシリーズ、TorchVisionのリリースブランチに現在含まれている今後の機能のいくつかについて説明します。

免責事項： 今後のリリースには多くの機能強化とバグ/テスト/ドキュメントの改善が含まれていますが、ここでは私が個人的に興味を持っているドメインの新しい「ユーザー向け」機能に焦点を当てています。ブログ投稿を書いた後、私はまた、私がレビューした、書いた、またはそれらの開発を綿密に追跡した機能への偏見に気づきました。機能をカバーする（またはカバーしない）ことは、その重要性について何も言いません。表明された意見は私自身のものです。

新モデル

新しいリリースには、新しいモデルが満載です。

KaiZhangはの実装を追加しました RegNetアーキテクチャ事前にトレーニングされたウェイトと一緒に 14種類元の紙を忠実に再現します。
最近、の実装を追加しました EfficientNetアーキテクチャ LukeMelas-KyriaziとRossWightmanによって提供されたバリアントB0-B7の事前トレーニング済みウェイトとともに。

新しいデータ拡張

最新バージョンには、いくつかの新しいデータ拡張手法が追加されています。

サミュエルガブリエルが貢献しました些細なオーグメント、AutoAugmentよりも優れた結果を提供するように見える新しいシンプルで非常に効果的な戦略。
追加しましたランドオーグメント自動拡張のメソッド。
私はの実装を提供しました MixupとCutMix 参照で変換します。これらは、APIが完成すると、次のリリースでトランスフォームに移動されます。

新しい演算子とレイヤー

いくつかの新しい演算子とレイヤーが含まれています。

参考資料/トレーニングレシピ

参照スクリプトの改善は継続的な取り組みですが、次のバージョンに含まれるいくつかの新機能を次に示します。

PrabhatRoyはのサポートを追加しました指数移動平均私たちの分類レシピで。
サポートするために参照を更新しましたラベルスムージング、最近、JoelSchlosserとThomasJ.FanによってPyTorchコアに導入されました。
実行するオプションを含めました学習率ウォーミングアップ、IlqarRamazanliによって開発された最新のLRスケジューラーを使用します。

その他の改善

このリリースで追加されたその他の注目すべき改善点は次のとおりです。

アレクサンダーソアレとフランシスコマッサは FXベースのユーティリティこれにより、モデルアーキテクチャから任意の中間機能を抽出できます。
NikitaShulgaがのサポートを追加しました CUDA 11.3 TorchVisionへ。
ZhongkaiZhuは依存関係の問題 JPEG libの（この問題は多くのユーザーに大きな頭痛の種を引き起こしました）。

進行中および次のアップ

このリリースでは実現しなかった、開発中のエキサイティングな新機能がたくさんあります。ここにいくつかあります：

Moto Hira、Parmeet Singh Bhatiaと私はRFCを起草しました。これは、モデルのバージョン管理事前にトレーニングされた重みに関連付けられたメタデータを処理するため。これにより、モデルごとに事前にトレーニングされた複数の重みをサポートし、ラベル、前処理変換などの関連情報をモデルに添付できるようになります。
私は現在、「電池含む」プロジェクトの精度を向上させるために事前トレーニング済みモデル。目標は、TorchVisionが提供する最も人気のある事前トレーニング済みモデルでクラス最高の結果を達成することです。
PhilipMeierとFranciscoMassaは、TorchVisionの新しいプロトタイプのエキサイティングなプロトタイプに取り組んでいます。データセットおよび変換 APIです。
Prabhat Royは、PyTorchCoreの拡張に取り組んでいます。 AveragedModel サポートするクラスバッファの平均化パラメータに加えて。この機能の欠如は、一般的にバグとして報告され、多数のダウンストリームライブラリを有効にするカスタムEMA実装を削除するためのフレームワーク。
アディツア・オケユーティリティを書いた許可する結果をプロットする元の画像のキーポイントモデルの数（私たちが圧倒され、時間内にレビューできなかったため、機能はリリースに到達しませんでした🙁）
私は構築していますプロトタイプFX-ユーティリティこれは、任意のモデルアーキテクチャで残留接続を検出し、ネットワークを変更して正則化ブロックを追加することを目的としています（ StochasticDepth).