目标检测开源框架YOLOv6全面升级,更快更准的2.0版本来啦

9月5日,美团视觉智能部发布了YOLOv6 2.0版别,本次更新对轻量级网络进行了全面升级,量化版模型 YOLOv6-S 到达了 869 FPS,一起,还推出了归纳功能优异的中大型网络(YOLOv6-M/L),丰富了YOLOv6网络系列。其间,YOLOv6-M/L 在 COCO 上检测精度(AP)别离到达 49.5%/52.5%,在 T4 卡上推理速度别离可达 233/121 FPS(batch size =32)。

GitHub下载地址:github.com/meituan/YOL…。欢迎Star保藏,随时取用。

官方出品具体的Tech Report带你解构YOLOv6:YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications。

目标检测开源框架YOLOv6全面升级,更快更准的2.0版本来啦

注:YOLOv6系列模型均在练习300epoch且不运用预练习模型或额定检测数据集下取得,”‡“表明采用了自蒸馏算法,”∗“表明从官方代码库对发布模型进行从头测评的目标。以上速度目标均在T4 TRT7.2 环境下测验。

目标检测开源框架YOLOv6全面升级,更快更准的2.0版本来啦

注:YOLOv6系列模型均在练习300epoch且不运用预练习模型或额定检测数据集下取得,”‡“表明采用了自蒸馏算法,”∗“表明从官方代码库对发布模型进行从头测评的目标。以上速度目标均在T4 TRT7.2 环境下测验。

本次版别升级,主要有以下更新:

功能更强的全系列模型

  1. 针对中大型模型(YOLOv6-M/L),规划了新主干网络 CSPStackRep,它在归纳功能上比上一版的 Single Path 结构更具优势。
  2. 针对不同网络,系统性地验证了各种最新策略/算法的优劣,归纳精度和速度,为每类网络挑选合适的计划。一起将模型全体练习时间减少了 50%,极大地提升了模型的练习效率。
  3. 引入自蒸馏思维并规划了新的学习策略,大幅提升了 YOLOv6-M/L 的模型精度。
  4. 经过练习时 Early Stop 强数据增强及推理时图像 Resize 优化策略,修正了前期版别中输入尺度对齐到 640×640 后精度丢失的问题,提升了现有模型的实践部署精度。

表 1 展现了 YOLOv6 与当前主流的其他 YOLO 系列算法相比较的实验成果,比照业界其他 YOLO 系列,YOLOv6在所有系列均具有必定的优势:

  • YOLOv6-M 在 COCO val 上 取得了 49.5% 的精度,在 T4 显卡上运用 TRT FP16 batchsize=32 进行推理,可到达 233 FPS 的功能。
  • YOLOv6-L 在 COCO val 上 取得了 52.5% 的精度,在 T4 显卡上运用 TRT FP16 batchsize=32 进行推理,可到达 121 FPS 的功能。
  • 一起,YOLOv6-N/ S 模型在坚持同等推理速度情况下,大幅提升了精度目标,练习400 epoch 的条件下,N 网络从 35.0% 提升至 36.3%,S 网络从 43.1% 提升至 43.8%。

量身定制的量化计划

本次发布还集成了专门针对 YOLOv6 的量化计划,对重参数化系列模型的量化也有参阅含义。该计划借鉴 RepOptimizer [1] 在梯度更新时做重参数化,解决了多支路动态规模过大导致难以量化的问题,用 RepOptimizer 练习的 YOLOv6 模型可以直接运用练习后量化(Post-training Quantization,PTQ),而不发生过大的精度丢失。

在这一基础上,咱们剖析了各层的量化敏感性,将部分敏感层以更高精度运算,进一步提升了模型的精度。另外,咱们一起发布了针对 2.0 版别的基于逐通道蒸馏的量化感知练习计划 (Quantization-aware Training,QAT),并结合图优化,YOLOv6-S 2.0 版别的量化功能可到达 43.3 mAP 和 869 FPS (batch size=32)。

目标检测开源框架YOLOv6全面升级,更快更准的2.0版本来啦

注:以上速度目标均在 T4 TRT8.4 环境下测验。比照方法为 PaddleSlim [30] 。

不同之处是 PaddleSlim 运用 YOLOv6-S 1.0 版别,咱们的量化计划应用于 2.0 版别。更详尽的关于量化部署实践的相关内容,近期会在美团技能团队大众号上进行推送,敬请期待。

齐备的开发支撑和多平台部署适配

YOLOv6 支撑检测模型练习、评价、预测以及模型量化、蒸馏等全链路开发流程,一起支撑 GPU(TensorRT)、CPU(OPENVINO)、ARM(MNN、TNN、NCNN)等不同平台的部署,极大简化工程部署时的适配作业。更具体的教程指引请移步 YOLOv6 Github 库房 Deployment 的部分。

相关论文

[1] RepOptimizer:Re-parameterizing Your Optimizers rather than Architectures

阅览美团技能团队更多技能文章合集

前端 | 算法 | 后端 | 数据 | 安全 | 运维 | iOS | Android | 测验

| 在大众号菜单栏对话框回复【2021年货】、【2020年货】、【2019年货】、【2018年货】、【2017年货】等关键词,可检查美团技能团队历年技能文章合集。

目标检测开源框架YOLOv6全面升级,更快更准的2.0版本来啦

| 本文系美团技能团队出品,著作权归属美团。欢迎出于分享和沟通等非商业意图转载或运用本文内容,敬请注明“内容转载自美团技能团队”。本文未经许可,不得进行商业性转载或者运用。任何商用行为,请发送邮件至tech@meituan.com请求授权。