NeurIPS 2019 | 国科大、厦大联合提出FreeAnchor：一种新的anchor匹配学习法

2024-06-22 01:08:16

FreeAnchor：Learning to Match Anchors for Visual Object Detection

论文地址：

https://static.aminer.cn/misc/pdf/1909.02466.pdf

开源地址：

https://github.com/zhangxiaosong18/FreeAnchor

论文作者：

Xiaosong Zhang， Fang Wan， Chang Liu， Rongrong Ji， Qixiang Ye（中国科学院大学，厦门大学）

前言

本文将对NeurIPS2019会议论文《FreeAnchor：Learning to Match Anchors for Visual Object Detection》进行解读。为了打破IoU（Intersection-over-Unit）的限制，作者提出了一种新的anchor匹配学习的方法，允许以灵活的方式来匹配目标与anchor，称为“FreeAnchor”。FreeAnchor通过将目标检测器训练转换为最大似然估计（MLE）过程，实现将hand -crafted设定的anchors更新为“free”方式产生的anchors。在COCO的实验表明，FreeAnchor在性能上显著超过同类方法。

研究现状

为了表示具有有限卷积特征的各种外观，宽高比和空间布局的目标，大多数基于CNN的检测器都用多个比例和宽高比的anchor boxes作为目标定位的参考点，通过分配给每个目标若干个anchors，可以确定features并执行分类和定位。基于anchor的检测器通常利用空间对齐方式（即目标与anchor之间的IoU）作为anchor分配依据，并以hand-crafted方式选择。一方面，对具有倾斜特征的目标（如细长目标），其最具代表性的特征并不靠近目标中心。因此，空间对齐的anchor可能对应较少的features，会降低分类和定位能力。另一方面，当多个目标组合在一起时，使用IoU匹配适当的anchors则更为困难。由此可见，很难设计一种通用的规则，可以将anchors/features与各种几何布局的目标进行最佳匹配。

为了打破预先分配anchors的限制， anchor-free方法采用了像素级监督【1】和中心位置边界框回归【2】。CornerNet【3】和CenterNet 【4】用关键点学习替换了边界框学习。MetaAnchor【5】方法学习从带有子网络的任意自定义的先验框中生成anchors。GuidedAnchoring 【6】利用语义特征来指导anchors的预测，同时用预测的anchors替换密集的anchors。IoU-Net【7】结合了IoU引导的NMS（Non-Maximum Suppression，非极大值抑制），这有助于消除由误导的分类置信度引起的回归失败。

但在检测器训练期间仍然缺乏一种系统的方法来对anchors和目标之间的对应关系进行建模，这阻碍了features选择和学习的优化。

图1：hand-crafted anchor分配（顶部）和FreeAnchor（底部）的比较。

FreeAnchor允许每个目标在检测器训练期间从一组anchors中灵活匹配最佳的anchor。

方法

实验

· 模型效果（Model Effect）

如图5所示，对于方形目标类别， FreeAnchor的性能相当于RetinaNet。但在细长目标上，FreeAnchor性能明显优于RetinaNet。其原因在于，FreeAnchor激活每个目标的anchors集合内的至少一个anchor，以便预测正确的类别和位置，且激活的anchor不一定与目标空间对齐，只需有对分类和定位的最具代表性的features。

图5：正方形和细长对象的性能比较。

作者进一步比较了在各种拥挤情况下RetinaNet和FreeAnchor的性能，如图6所示。随着每个图像中目标数量的增加，FreeAnchor优势越来越明显。

图6：目标拥挤情况下的性能比较。

为了评估anchors预测与NMS的兼容性，作者将NMS召回率NR_τ 定义为在给定IoU阈值τ下NMS前后的召回率之比。遵循COCO中AP的定义方式，NR定义为τ以0.05为间隔变化，从0.50到0.90中NR_τ 的平均值。实验结果如表1 所示，FreeAnchor的NR_τ 显著高于RetinaNet。

· 检测性能（Detection Performance）

表2为FreeAnchor与RetinaNet的性能比较，FreeAnchor可将AP提升3.0%左右，这对通用目标检测任务来说是一个显著提升。

表3所示为FreeAnchor和其他方法的对比。FreeAnchor使用的ResNeXt-64x4d-101骨干网络少，训练迭代次数少，但在AP方面可与CenterNet相媲美（分别为44.9%和44.9%），尤其AP50性能更为突出。

总结

作者提出了一种用于视觉目标检测的FreeAnchor方法。FreeAnchor通过将目标检测器训练转换为最大似然估计（MLE）过程，将hand-crafted的anchor分配更新为“free”的目标与-anchor对应。实验结果表明，FreeAnchor显着提高了目标检测的性能。

参考文献：

【1】Xinyu Zhou, Cong Yao, He Wen, Yuzhi Wang, Shuchang Zhou, Weiran He, and Jiajun Liang. EAST: an efficient and accurate scene text detector. In IEEE CVPR, pages 2642-2651, 2017

【2】Zhi Tian, Chunhua Shen, Hao Chen, and Tong He. Fcos: Fully convolutional one-stage object detection. arXiv: 1904.01355, 2019

【3】Hei Law and Jia Deng. Cornernet: Detecting objects as paired keypoints. In ECCV, pages 765-781, 2018

【4】Kaiwen Duan, Song Bai, Lingxi Xie, Honggang Qi, Qingming Huang, and Qi Tian. Centernet: Object detection with keypoint triplets. In IEEE CVPR, 2019

【5】Tong Yang, Xiangyu Zhang, Zeming Li, Wenqiang Zhang, and Jian Sun. Metaancho: Learning to detect objects with customized anchors. In NIPS, pages 320-330, 2018

【6】Jiaqi Wang, Kai Chen, Shuo Yang, Chen Change Loy, and Dahua Lin. Region proposal by guided anchoring. In IEEE CVPR, pages 2965-2974, 2019

【7】Borui Jiang, Ruixuan Luo, Jiayuan Mao, Tete Xiao, and Yuning Jiang. Acquisition of localization confidence for accurate object detection. In ECCV, pages 784-799, 2018

【8】Ross B. Girshick. Fast R-CNN. In IEEE ICCV, pages 1440-1448, 2015

【9】Joseph Redmon and Ali Farhadi. YOLO9000: better, faster, stronger. In IEEE CVPR, pages 6517-6525, 2017

【10】Tsung-Yi Lin, Priya Goyal, Ross B. Girshick, Kaiming He, and Piotr Dollár. Focal loss for dense object detection. In IEEE ICCV, pages 2999-3007, 2017

50万奖金，10亿像素，这个目标检测与跟踪可不简单

近期,中国人工智能学会在阿里云天池平台上发布了首届全球人工智能技术创新大赛,其中一个赛道是在10亿像素的图像视频中进行目标检测与跟踪,总奖池50万人民币,初赛将于3月2日开赛. 随着视频监控的发展,大 ...
大盘点 | 2020年5篇目标检测算法最佳综述

作者丨Cynthia Yawain 编辑丨极市平台本文为极市平台原创整理. 引言在过去的一年中,计算机视觉领域出现了许多优秀的工作,并推动了相关领域的技术发展与进步.去年上半年,极市曾盘点过计算机 ...
CenterNet：目标即点（代码已开源）

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...
目标检测 | 经典算法笔记—Cascade R-CNN再回首

AI研习图书馆,发现不一样的精彩世界论文笔记论文:https://arxiv.org/abs/1712.00726 代码:https://github.com/zhaoweicai/cascad ...
PP-YOLOv2开源，你的目标检测器又该升级了！性能超越YOLOv5且推理耗时保持不变

作者丨happy 审稿丨邓富城编辑丨极市平台极市导读本文是百度的研究员对PP-YOLO的一次升级,从PP-YOLO出发,通过增量消融方式逐步添加有助于性能提升且不增加推理耗时的措施,取得了更佳的 ...
YOLOS：通过目标检测重新思考Transformer（附源代码）

计算机视觉研究院专栏作者:Edison_G 最近"计算机视觉研究院"有一段时间没有分享最新技术,但是最近我看了一些之前的检测框架,发现有两个很有意思,不错的框架,接下来我给大家简 ...
目标检测集 | ECCV 2020 论文大盘点(附论文&代码下载)

计算机视觉研究院 " --------计算机视觉研究院专栏-------- 作者:Edison_G 微信公众号 : 计算机视觉研究院知乎专栏:计算机视觉战队不知不觉2020年已经进入11 ...
目标检测之IoU、precision、recall、AP、mAP详解

目录 1. 目标检测概述 2. IoU 3.precision(精度)和recall(召回率) 4. AP和mAP 5.实际计算方法 1. 目标检测概述目标检测的任务是找出图像中所有感兴趣的目标(物 ...
YOLOv4详细分析 | 细数当前最佳检测框架小细节（附论文及源码下载）

获取有趣.好玩的前沿干货! 来源:计算机视觉研究院链接:https://medium.com/@jonathan_hui/yolov4-c9901eaa8e61 著作权归作者所有,侵删前段时间,突 ...
CVPR 2018 | Repulsion loss：专注于遮挡情况下的行人检测

极市平台是专业的视觉算法开发和分发平台,加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖 ...
综述：目标检测二十年（2001-2021）

作者丨派派星来源丨CVHub 编辑丨极市平台极市导读目标检测领域发展至今已有二十余载,本文将对目标检测领域近20年的发展做一次系统性的介绍,并为目标检测构建一个完整的知识体系架构. 引言目标检 ...
Adversarial patch camouflage against aerial detection

Adversarial Patch Camouflage against Aerial Detection [Adversarial Patch Camouflage against Aerial D ...
CVPR 2018|Cascade R-CNN：向高精度目标检测器迈进

极市平台是专业的视觉算法开发和分发平台,加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖 ...
Label Assign：提升目标检测上限

加入极市专业CV交流群,与 10000+来自港科大.北大.清华.中科院.CMU.腾讯.百度等名校名企视觉开发者互动交流! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总,行业技术交流.关注 ...
扔掉FPN来做目标检测，效果竟然这么强！YOLOF开源：你只需要看一层特征｜CVPR2021

作者丨happy 审稿丨邓富城编辑丨极市平台导读旷视科技&中科院对单阶段目标检测中的FPN进行了重思考,采用一级特征进行检测替换复杂的特征金字塔来解决优化问题,提出了YOLOF.该 ...
一文看尽 27 篇 CVPR2021 2D 目标检测论文

作者丨二玖编辑丨极市平台极市导读本文对我们汇总的 CVPR 2021 检测大类中的2D目标检测领域的论文进行了盘点,将会依次阐述每篇论文的方法思路和亮点.在极市平台回复"CVPR21检 ...
Paper：《YOLOv4: Optimal Speed and Accuracy of Object Detection》的翻译与解读

Paper:<YOLOv4: Optimal Speed and Accuracy of Object Detection>的翻译与解读YOLOv4的评价1.四个改进和一个创新这篇文章主要 ...

NeurIPS 2019 | 国科大、厦大联合提出FreeAnchor：一种新的anchor匹配学习法

相关推荐