ICCV 2021 | COLMAP 优化建图组件 Pixel-Perfect SFM

2024-04-09 07:30:40

快速获得最新干货

1. 背景

论文题目“Pixel-Perfect Structure-from-Motion with Featuremetric Reﬁnement”（通过深度特征度量优化提高 SFM精度），发表于 ICCV 2021 (oral)。

注意到本文的作者是Paul‑Edouard Sarlin^[1]，该作者近两年发表了几项高质量的成果，如Superglue (CVPR 2020, 点击查看) / Pixloc (CVPR 2021, 点击查看)。

本文算法开源：

https://github.com/cvg/pixel-perfect-sfm，

作者提到，该算法作为COLMAP优化建图插件后续会集成到视觉定位工具包hloc^[2]中。

论文：https://arxiv.org/abs/2108.08291

2. 摘要

在 3D 重建任务中，跨视角可复检的特征点提取尤为重要。原有的 SFM 框架中，特征提取之后其位置并不会发生改变，若这个提取过程中出现了误差（噪声干扰），势必造成后续几何结构的误差累计。

本文针对以上 SFM 框架中的两个步骤进行了优化：1. 特征匹配后使用 Featuremetric (深度特征度量)对特征点位置进行优化；2. 增量重建过程中通过类似的 Featuremetric 进行 BA（重投影误差变为 Featuremetric 误差）。本文算法通过大量实验验证，其在三角化/ SFM 等任务中的表现非常优秀。

3. 关键技术点

总览：本文的优化框架可在任何基于局部特征点的 SFM 流程中使用，首先使用 CNN 提取图像特征图(dense features)，根据稀疏的特征匹配得到初始的 tracks(一个track是指，同一个3D点在不同图像中的2D观测)，调整每一个 track 对应的特征点在图像中的位置；根据调整后的位置进行 SFM 重建，重建过程中的 BA 优化残差由重投影误差变为 Featuremetric 误差。

输入：张 SFM 建图图像

输出：场景地图，包括 3D 点，相机位姿，相机内参

3.1. 特征位置调整

图像表征：图像的像素强度表示对视角/光照等因素的变化较为敏感，本文采用了 CNN feature 的方式表示一张图像。具体的，对于图像，使用S2DNet^[3]提取到一个维特征图。注：特征图在通道上做了归一化以提高泛化性，特征图的长宽与原图相同。

目标函数：对于每一个 track，调整它包含的 2D 特征点的位置，构建如下 featurematric 误差：

其中表示特征点与之间的关联置信度，该置信度可由特征描述子的余弦距离表示。可以看到，该过程对于每一个 track 是独立进行的，计算效率非常高。另外，为了保证例如视觉定位的性能，需要保持特征点复检率不发生较大改变，此时需要限制特征优化的最大变动距离，其中为未调整的原始位置，表示特征点位置调整的最大像素距离，实验中设为 8（pixels）。

3.2. BA 优化

上述过程完成了特征点位置的优化，随后进行几何校验以及增量或者全局重建。对于重建过程，本文设计了如下BA残差：

其中为 Huber 核函数，是某个固定的参考向量，它被定义为距离 track 观测均值特征最近点那个向量。

4. 实验

实验平台：8 CPU cores (Intel Xeon E5-2630v4) and one NVIDIA RTX 1080 Ti。

4.1. 3D 三角化

在给定相机内参与位姿的情况下评价本文算法的生成的地图点精度。上述表格中 Accuracy 表示 3D 点满足不同阈值的比例，Completeness 表示 3D 点被成功三角化并满足阈值的比例（占总3D点的比例）（类似于召回率）。本文算法相比于 Patch Flow[4]，能够提升在严格阈值下的精度与完整度，且均比未优化的精度与完整度高。

4.2. 相机位姿估计

上述表格展示了平移量的 AUC 精度曲线，本文算法相比于未优化与 Patch Flow[4] 均有很大优势，SuperPoint 特征相比于其他特征点提取器提升力度明显。

4.3. SFM 性能

本文算法在两个任务中获得显著的性能提升，其中 stereo 任务评价的是图像之间的相对位姿精度，这对于全局 SFM 的位姿初值计算尤为重要；multi-view 任务是针对包含张图像的集合进行增量位姿优化，该任务评价的是该集合内部相机的相对位姿。

下图是算法优化前后特征点位置的分布，可以看到本文方法得到的特征点位置(绿点)在不同视角间是保持一致的，而原始的特征点(蓝点)容易受到提取噪声的干扰，导致了 SFM 重投影的 2D 点(红点)出现了不一致性（错位）。

4.4. 其他

4.4.1. 消融实验

4.4.2. 耗时

上图展示了本文算法进行 SFM 的耗时统计，相比 Patch Flow，本文算法耗时大幅度降低；在 Aachen Day-Night v1.1 数据集测试，7K 图像规模耗时小于 2 小时。

结论

提供了一种用于优化 SFM 建图精度的方案，能够大幅度提升建图精度与后续的视觉定位精度。
本文算法在进行 BA 时需要占用较大的运行内存空间(feature maps)，特别是面对大规模场景重建时，具体使用时需权衡计算量与精度。

参考资料

[1] Paul‑Edouard Sarlin 主页: https://psarlin.com
[2] hloc: https://github.com/cvg/Hierarchical-Localization
[3] S2DNet: Learning accurate correspondences for sparse-todense feature matching, ECCV 2020, https://github.com/germain-hug/S2DNet-Minimal

[4] Patch Flow: Mihai Dusmanu, Johannes L. Schonberger, and Marc Pollefeys. Multi-View Optimization of Local Feature Geometry. ECCV, 2020, https://github.com/mihaidusmanu/local-feature-refinement

独家重磅课程！

1、VIO课程：VIO灭霸：ORB-SLAM3源码详解，震撼上线！

2、图像三维重建课程（第2期）：视觉几何三维重建教程（第2期）：稠密重建，曲面重建，点云融合，纹理贴图

3、重磅来袭！基于LiDAR的多传感器融合SLAM 系列教程：LOAM、LeGO-LOAM、LIO-SAM

4、系统全面的相机标定课程：单目/鱼眼/双目/阵列相机标定：原理与实战

5、视觉SLAM必备基础（第2期）：视觉SLAM必学基础：ORB-SLAM2源码详解

6、深度学习三维重建课程：基于深度学习的三维重建学习路线

7、激光定位+建图课程：激光SLAM怎么学？手把手教你Cartographer从入门到精通！

全国最棒的SLAM、三维视觉学习社区↓

技术交流微信群

【学术论文】高帧频视觉实时目标检测系统

摘要为了实现高速场景下的智能实时目标检测,设计了一种基于ZYNQ7000系列FPGA的高速相机平台,并利用该平台进行目标检测算法实现,形成了一套高帧频实时目标检测系统样机. 该系统将高速CMOS图像 ...
VO视觉里程计

VO视觉里程计
基于深度学习的较复杂背景下桥梁裂缝检测

杨杰文1,章光1,陈西江1,班亚2 (1. 武汉理工大学安全与应急管理学院,湖北武汉 430079:2. 重庆市计量质量检测研究院,重庆 404100) 摘要:桥梁的定期裂缝检测对于确保桥梁的安 ...
机器学习在遥感影像分类中的应用

随着遥感仪器性能的不断发展,我们所能获取的遥感图像数量激增,且光谱特征维数不断增加,有必要利用机器学习对图像进行自动处理. 本文概述了机器学习的主要方法及其在遥感影像的主要应用方向,并通过应用实例说明 ...
深度学习

人工智能技术与咨询 4天前本文来自<系统工程与电子技术>,作者周龙等摘要:针对传统雷达图像目标检测方法在海杂波及多种干扰物组成的复杂背景下目标分类识别率低.虚警率高的问题,提出将当前 ...
高达82 fps的实时文本检测，华科AAAI2020提出可微分二值化模块

今天跟大家分享一篇近几天公布的关于实时场景文本检测的论文Real-time Scene Text Detection with Differentiable Binarization,出自华科白翔老师 ...
三维重建系列之COLMAP: Structure-from-Motion Revisited

干货第一时间送达今天要介绍的是J. L. Sconberger等人于2016年发表在CVPR的文章.本文针对增量式SFM中三角化/BA等步骤进行了改进,能够比较明显地提升SFM的精确率/鲁棒性以及重 ...
【学术论文】基于DFFT-WT-BP的光伏系统谐波检测

摘要: 现有的FFT-WT(Fast Fourier Transform-Wavelet Transform)算法与FFT-BP(Fast Fourier Transform-Back Propaga ...
高精地图构建与SLAM感知优化建图策略

高精度地图对自动驾驶系统功能研发的影响已经越来越明显,整体上来讲主要包含但不仅限于提升车端感知性能.拓展自动驾驶新功能.动态建图等相关应用.具体体现在如下几个重要方面: 应用总述提升车端感知性能拓 ...
一图速览 | 河北省《2021年优化营商环境工作要点》

来源:河北省发展和改革委员会
2021年怎样建栋最潮农村别墅，5款时尚现代风，建完就是农村最靓的崽

现代别墅以极简的装饰,流畅的线条,很受年轻建房者的欢迎.现代风格农村别墅,外立面使用了很多金属质感的建筑材料,来彰显时尚感和现代感,比如铁艺.玻璃.木材.陶艺等.现代风格农村别墅,注重的不仅是外观,室 ...
2021年3月\图学习\综述论文，19页pdf概述图信号处理、矩阵分解、随机游走和深度学习算法

点击上方蓝字关注我们声明:本文转自专知微信公众号图是连接数据网络结构的一种常用表示形式.图数据可以在广泛的应用领域中找到,如社会系统.生态系统.生物网络.知识图谱和信息系统.随着人工智能技术的不 ...
2021年九宫飞星图及风水布局牛年九宫飞星图详解和化解

2021年九宫飞星图详解九宫飞星图是一个关于吉星方位的图, 若能知道九宫飞星飞临的方向,则能利用其改善运势.每一年的九宫飞星图都在变化,随着时间的迁移,每颗飞星飞临的方位也会有所改变,若能布置得当 ...
苏民峰2021年九宫飞星图及风水布局详解

2021牛年风水吉凶方位古语有云:「一命.二运.三风水--」,由此可知命运与风水是息息相关的:倘若运好而又配上当旺方位,便可收锦上添花之效!即使运不逢时,但若能配上当旺的方位,亦可对改善流年运程大有 ...
牙科管理：2021劳动节团建活动感悟，这两点值得深思

与前两次公司的团建活动相比,本次公司组织的劳动节团结活动对我感触最深的有两点,分别是阅历的提升.与家人关系的提升.可以说,本次团建活动为很多牙科老板树立了很好的案例,一同参与团建的几位牙科老板也受益匪 ...
2021最新显卡天梯图

显卡天梯图2021最新版高清图分享给大家,进入2021年之前,NVIDIA(英伟达)和AMD(超威半导体)都发布了多款旗舰级显卡,比如RTX30系列,RX6000系列.不同型号显卡性能各有差异,所以在 ...
【通达信指标】2021寻底-副图选股指标公式 - 掌上指标资源网和另外 1 个页面 - 用户配置 1

[通达信指标]2021寻底-副图选股指标公式 1.尾盘收盘前3分钟左右信号确定介入或者出信号后第二天回调逢低介入. 2.操作资金仓位建议3-4成左右,或根据手上资金及自己平常仓位操作习惯操作. 3.止 ...