AAAI 2020 | GlobalTrack:简单又强大!视频长期目标跟踪新基线


今日新出论文GlobalTrack: A Simple and Strong Baseline for Long-term Tracking,提出一种全新的使用全局搜索思路的视频长期目标跟踪方法GlobalTrack,使用极其简单的架构,按照作者的说法“没有运动模型,没有在线学习,没有位置或尺度变化的惩罚,没有尺度平滑和轨迹改进,因此没有累积误差”,特别适合于目标长期跟踪。

该文作者信息:

作者团队来自中科院和中科院大学。

目标跟踪问题中,为了更好的利用前一帧甚至前几帧的信息,往往会对模型做很多假设,包括目标的运动、位置变化、尺度变化等,而这也带来了模型的累计误差,在长期跟踪时,这样的累计误差往往会使得后期的目标跟踪结果差很多。

作者在文中给出的一些例子:

面对目标的尺度变化、遮挡、消失重现等问题,该文提出的算法GlobalTrack和其他SOTA的比较结果。因为 GlobalTrack 对视频每一帧的跟踪完全不依赖相邻帧,没有累计误差使得它在长期跟踪问题中准确率保持稳定。

重头戏来了!

作者使用的算法网络架构:

有意思的是,作者是在二阶段目标检测器Faster R-CNN启发下发明了 GlobalTrack 算法。

作者完全把目标跟踪看为全局实例搜索问题,即在给定第一帧目标包围框后,对后续每一帧的跟踪过程都是一样的。

其最大的创新点在于Query-Guided RPN 和Query-Guided RCNN模块。

查询图像和搜索图像经过骨干网后,进入Query-Guided RPN,仿照Faster R-CNN,它用于生成目标候选框,不同的是它是一个根据特定查询图生成特定目标候选框的网络结构,故称“查询引导的 RPN”,具体做法是在特征调和时,将ROI特征和搜索图特征进行卷积计算相关。

而 Query-Guided RCNN 则是对候选目标位置进行更精细的分类和定位,同样其也使用了特征调和模块。跟踪时直接使用置信度最高的候选目标包围框作为最终结果。

下图是作者举的一个例子:

车牌在长期跟踪过程中消失了一段时间,当车牌再次出现的时候,其他跟踪算法就再也无法恢复跟踪了,而没有累计误差的 GlobalTrack不受前面的影响立刻跟踪到了目标。

下面是在一些主流数据集上与其他算法的比较:

从比较结果看,在没有使用任何后处理等步骤的前提下,GlobalTrack 取得了SOTA的结果,而且非常值得一提的是,作者认为,测评数据集中的视频长度越长,GlobalTrack 的表现越好!

作者称代码将很快开源,期望这种简单又强大的长期目标跟踪基线算法能启发更多优秀的工作!

论文地址:

https://arxiv.org/abs/1912.08531v1

(0)

相关推荐