涨点技巧！小目标检测：数据增广

2024-05-07 11:06:12

近年来，目标检测算法取得了很好的成绩，但是，小目标和大目标的检测性能差异较大。小目标检测是目标检测中必不可少且具有挑战性的问题，在人脸检测、交通标记、缺陷检测等领域都是其重要挑战。缓解小目标检测问题的方法有很多，例如：多尺度特征学习，数据增强，训练策略，基于上下文的检测和基于GAN的检测等，今天我们介绍一篇通过改进数据扩增方式提升小目标检测的准确率。

论文题目：Augmentation for small object detection

论文链接：https://arxiv.org/abs/1902.07296

代码链接：https://github.com/gmayday1997/SmallObjectAugmentation

小目标检测困难的原因

造成小目标检测困难的原因主要有两个：1、小目标的实例较少，2、小目标标注面积占比小。

1.1 小目标实例较少

第一个问题小目标实例较少，作者以 MSCOCO 数据集为例进行分析，训练集中出现的所有目标中有 41.43% 是小的，而只有 34.4% 和 24.2% 分别是中型和大型目标，并在训练集中出现小目标图片约占一半，而 70.07% 和 82.28% 的训练图像分别包含中型和大型物体，如Table 2所示：

1.2 小目标标注面积占比小

不同大小的目标的 Total Object Area 差异很大，经统计，只有 1.23% 的标注像素属于小目标，中型目标占比 10.18%，是小目标的十倍，而有 82.28% 的占比属于大目标。

当前检测器大部分的anchor匹配策略是以anchor和groud truth的IOU来划分正负样本，例如将 anchor 和 GT 匹配后，匹配 IoU≥0.5 的 anchor 会作为正样本参与训练（如下图所示）。然而这种匹配方式更倾向于大目标，会造成了小目标匹配少、大目标匹配多的不平衡性。

小目标检测的数据扩增方法

上面两个问题体现出了小目标的检测性能较差的原因之一是：训练数据中小目标的再现性较差，因此，作者提出对小目标样本进行 Oversampling（过采样），然后在对样本里的小目标进行 Copy-Pasting（复制粘贴），以此来提供足够的小目标来和 anchor 进行匹配，以此实现提高小目标检测的性能。

2.1 Oversampling

在训练阶段对有小目标的图像进行Oversampling(过采样)，来解决含有小目标的图像较少的问题，过采样简单来说就是将一张图片重复加入训练几次，这种方式十分简单，但也有效，并且实现方式也很简单只需要将含有小目标的样本多复制几遍并修改名字就行。复制的次数就是oversampleing rate（过采样率），通过控制oversampleing rate来实现大中小的样本数量均衡。

2.2 Copy-Pasting

作者在Oversampling基础上增加了Copy-Pasting（复制粘贴策略），也就是将小目标贴到图像中的任意位置并生成新的标注，并且粘贴的小目标可以进行随机变换（缩放，翻折，旋转等），这种方式通过增加每个图像中小目标的数量，匹配的 anchor 的数量也会随之增加，这进而提升了小目标在训练阶段对 loss 计算的贡献。

作者提出了三种复制粘贴小目标的方式：

1、图像中选择一个小目标，然后在随机位置复制粘贴多次

2、图像中选择许多小目标，并在任意位置复制粘贴它们一次

3、图像中所有的小目标在任意位置复制粘贴多次

下图说明了所提出的 augmentation 策略以及如何在训练中增加匹配 anchor 的数量，从而更好地检测小目标。

实验结果

3.1 Oversampling

作者做了充足的实验验证了这种扩增方式对小目标性能的提升。首先作者将Baseline（Mask RCNN）与加入Oversampling进行对比，如Table 3 所示，可以看出 Oversampling 不管是在检测还是分割都有所提高，但可能对大尺度目标的检测效果有损害，因此需要根据实际数据进行调整，并不是越大越好。

3.2 Copy-Pasted

接着作者对Copy-Pasting（复制粘贴）的有效性进行了验证，将Baseline（Mask RCNN）与几种组合Oversampling以及Augmentation进行比较如 Table 4所示。主要包括以下几类：

1、用Copy-Pasted后的图像代替原始的图像(表格中的第二行)

2、在上面方法的基础上使用Oversampling(表格中的第三行)可以发现，上述两个的结果相比于Baseline都比较差。

3、在测试的时候，不是在原始的测试集上了，而是用训练集上的Augmentation方法同样去处理Test数据集，性能获得了较大的提高。

作者认为出现这种情况是由于人工复制的不完美性导致的，例如粘贴的目标 mask 和 background 亮度差，这些相对容易被神经网络发现。采用augmentation and oversampling 相结合的方法，取得了较好的效果，augmentation的概率为 0.5，这使得原始目标和 augmented 的目标比例为 2:1。这种设置比单纯的 oversampling 效果更好，验证了所提出的粘贴小对象策略的有效性。

3.3 Copy-Pasted Strategies

作者最后还对三种复制粘贴策略进行了测试：

1、图像中选择一个小目标，然后在随机位置复制粘贴多次；

2、图像中选择许多小目标，并在任意位置复制粘贴它们一次；

3、图像中所有的小目标在任意位置复制粘贴多次。

这里我们简要介绍一下最好的情况，在这三种策略中第二种也就是选择多个小目标进行复制粘贴取得了最好的效果，并且在粘贴三次小目标的效果最好。如图表所示：

总结

这篇文章分析表明小目标检测性能较差的原因之一是训练数据中小目标数量较少，导致在anchor匹配小目标匹配少，大目标匹配多的不平衡性，也就是训练数据中小目标的再现性较差。因此，作者提出了过采样和复制粘贴的策略通过增加小目标的数量提升小目标检测的性能并且在实验中证明了其有效性。

神经网络绘图神器下载

机器视觉编码技术与标准进展

正文字数:8411 阅读时长:15分钟本文整理自中国电信研究院新技术所机器视觉标准与应用研究部主任张园在LiveVideoStack做的线上分享.她详细介绍了VCM.DCM等标准组织机器视觉编码标 ...
目标检测：Segmentation is All You Need ？

对于目标检测,从滑动窗口时代开始,我们已经习惯了候选区域特征提取然后分类的套路,深度学习时代强大的特征表示能力让我们能够探索不一样的道路,比如: ECCV18 Oral | CornerNet目标检测 ...
【YOLOX】新一代 anchor-free 目标检测器，吊打一切！

OLOX 介绍 YOLOX 在 YOLO 系列的基础上做了一系列工作,其主要贡献在于:在 YOLOv3 的基础上,引入了「Decoupled Head」,「Data Aug」,「Anchor Free ...
竞赛冠军方案：2020珠港澳人工智能算法大赛双料冠军解读

团队介绍团队来自深圳市威富视界有限公司.中国科学院半导体研究所,队长为宁欣副研究员,成员分别为石园.刘江宽.支金林.王镇.荣倩倩,排名不分先后. 珠港澳人工智能算法赛题介绍以检测和识别为核心的各项 ...
令我“细思极恐”的Faster-R-CNN

作者简介 CW,广东深圳人,毕业于中山大学(SYSU)数据科学与计算机学院,毕业后就业于腾讯计算机系统有限公司技术工程与事业群(TEG)从事Devops工作,期间在AI LAB实习过,实操过道路交通元 ...
DL之Yolo：Yolo算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

DL之Yolo:Yolo算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略相关文章 CV:人工智能之计算机视觉方向的简介(常用数据集+CV职位).传统方法对比CNN类算法.计算机视觉八大 ...
非常好用的Python图像增强工具，适用多个框架

小白学视觉 4天前以下文章来源于AI公园 ,作者ronghuaiyang AI公园做一个生产真正有用的AI内容的公众号.点击上方"小白学视觉",选择加"星标"或 ...
在目标检测中如何解决小目标的问题？

机器学习与生成对抗网络记录分享通俗.有趣的AI科技知识,包括不限于CV.GAN等等,还有程序员求职面试.内推等资料,偶尔分享诗词歌赋.陶冶情操,一起做个有趣.前沿的人! 94篇原创内容公众号作者 ...
谷歌简单粗暴“复制-粘贴”数据增广，刷新COCO目标检测与实例分割新高度

近日,谷歌.UC伯克利与康奈尔大学的研究人员公布了一篇论文 Simple Copy-Paste is a Strong Data Augmentation Method for Instance Se ...
2021年小目标检测最新研究综述

作者丨高新波.莫梦竟成.汪海涛.冷佳旭编辑丨极市平台极市导读与以往将小目标与常规目标等同对待或只关注特定应用场景下的目标检测综述不同,本文对小目标检测这一不可或缺且极具挑战性的研究领域进行了系 ...
小目标检测的福音：Stitcher，简单又有效

向大家推荐一篇今天新出的目标检测相关论文 Stitcher: Feedback-driven Data Provider for Object Detection ,该文发明了一种简单方法改进业界老大 ...
Scale Match：国科大提出小目标检测的尺度匹配方法，用于预训练数据集处理

圣诞快乐- 该文作者信息: 作者均来自中国科学院大学. 众所周知,小目标检测一直是比较棘手的技术问题,现有目标检测算法往往难以给出理想的结果,但在某些场合,小目标检测却非常有意义. 比如,长距离的视频 ...
使用Python+OpenCV进行数据增广方法综述（附代码演练）

原创磐怼怼深度学习与计算机视觉 1周前数据扩充是一种增加数据集多样性的技术,无需收集更多的真实数据,但仍然有助于提高模型的准确性和防止模型过度拟合.在这篇文章中,你将学习使用Python和Ope ...
赛尔笔记 | 自然语言处理领域的数据增广方法

作者:哈工大SCIR 李博涵 1.摘要本文介绍自然语言处理领域的数据增广方法.数据增广(Data Augmentation,也有人将Data Augmentation翻译为"数据增强&qu ...
基于深度学习的数据增广技术一览

加入极市专业CV交流群,与 10000+来自港科大.北大.清华.中科院.CMU.腾讯.百度等名校名企视觉开发者互动交流! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总,行业技术交流.关注 ...
青出于蓝而胜于蓝，超越MixUp、CutMix的样本混合数据增广新算法FMix

深度学习实践中,数据的增广有很多种方法,比如在计算机视觉任务中除了常规的对单样本进行缩放.颜色扰动.旋转.镜像等外,也可以通过对两个样本进行混合,生成新的虚拟样本训练集.这类方法被称为样本混合数据增广 ...
使用 Python 和 OpenCV 进行数据增广

重磅干货,第一时间送达数据扩充是一种增加数据集多样性的技术,无需收集更多真实数据,但仍有助于提高模型精度并防止模型过度拟合.在这篇文章中,我们将学习使用 Python 和 OpenCV 为对象检测任 ...

涨点技巧！小目标检测：数据增广

相关推荐