TorchVision v0.11 预览 – TorchVision 开发人员回忆录 – 2

TorchVision v0.11 预览 – TorchVision 开发人员回忆录 – 2

抢先浏览 TorchVision v0.11 – TorchVision 开发人员回忆录 – 2 PlatoBlockchain 数据智能。垂直搜索。人工智能。
TorchVision v0.11 预览 – TorchVision 开发人员回忆录 – 2

最近几周在“PyTorch Land”上非常忙碌,因为我们正在疯狂地准备 PyTorch v1.10 和 TorchVision v0.11 的发布。 在这第二期 该系列,我将介绍 TorchVision 的发布分支中当前包含的一些即将推出的功能。

免责声明: 尽管即将发布的版本包含许多增强功能和错误/测试/文档改进,但在这里我要重点介绍我个人感兴趣的域上的新“面向用户”功能。 写完这篇博文后,我还注意到我对我审查、编写或密切关注其开发的功能的偏见。 覆盖(或不覆盖)一个特征并没有说明它的重要性。 表达的意见完全是我自己的。

新型号

新版本包含新模型:

  • 张凯添加了一个实现 RegNet架构 以及预先训练的权重 14个变体 紧密地复制了原始论文。
  • 我最近添加了一个实现 高效网络架构 以及由 Luke Melas-Kyriazi 和 Ross Wightman 提供的变体 B0-B7 的预训练权重。

新的数据增强

最新版本中添加了一些新的数据增强技术:

  • 塞缪尔·加布里埃尔做出了贡献 平凡的增强,一种新的简单但高效的策略,似乎为 AutoAugment 提供了卓越的结果。
  • 我已经添加了 兰德 自动增强中的方法。
  • 我提供了一个实现 Mixup 和 CutMix 在引用中转换。 一旦它们的 API 最终确定,这些将在下一个版本的转换中移动。

新的运算符和层

包括了许多新的运算符和层:

参考资料/培训食谱

虽然我们的参考脚本的改进是一项持续的努力,但以下是即将推出的版本中包含的一些新功能:

  • Prabhat Roy 增加了对 指数移动平均线 在我们的分类食谱中。
  • 我已经更新了我们的参考资料以支持 标签平滑,最近由 Joel Schlosser 和 Thomas J. Fan 在 PyTorch 核心上介绍。
  • 我已经包含了执行的选项 学习率热身,使用由 Ilqar Ramazanli 开发的最新 LR 调度程序。

其他改进

以下是该版本中添加的其他一些显着改进:

  • Alexander Soare 和 Francisco Massa 开发了一种 基于外汇的实用程序 它允许从模型架构中提取任意中间特征。
  • Nikita Shulga 增加了对 CUDA 11.3 到 TorchVision。
  • 朱仲恺已修复 依赖性问题 JPEG lib(这个问题给我们的许多用户带来了很大的麻烦)。

进行中和后续

有许多令人兴奋的新功能正在开发中,但在此版本中没有出现。 以下是一些:

  • Moto Hira、Parmeet Singh Bhatia 和我起草了一份 RFC,其中提出了一种新机制 模型版本控制 以及处理与预训练权重相关的元数据。 这将使我们能够为每个模型支持多个预训练权重,并将相关信息(例如标签、预处理转换等)附加到模型中。
  • 我目前正在使用由“包括电池”项目以提高我们的准确性 预训练模型. 目标是为 TorchVision 提供的最流行的预训练模型获得一流的结果。
  • 菲利普·迈耶和弗朗西斯科·马萨正在为 TorchVision 的新产品开发令人兴奋的原型 数据集变换 API。
  • Prabhat Roy 正致力于扩展 PyTorch Core AveragedModel 类来支持 缓冲区的平均 除了参数。 缺少此功能通常被报告为错误,并将 启用众多下游库 和框架以删除其自定义 EMA 实现。
  • 阿迪亚·奥克 写了一个实用程序 这使得 绘制结果 原始图像上的关键点模型(该功能没有发布,因为我们被淹没并且无法及时查看它🙁)
  • 我正在建造一个 原型 FX 实用程序 它旨在检测任意模型架构中的残差连接并修改网络以添加正则化块(例如 StochasticDepth).

最后,我们的 backlog 中有一些新功能(PR 即将推出):

我希望你觉得上面的总结很有趣。 非常欢迎关于如何调整博客系列格式的任何想法。 打我 LinkedIn or Twitter.

时间戳记:

更多来自 基准框