基于双目事件相机的视觉里程计

2024-08-02 05:51:53

作者：Kehan

来源：公众号@3D视觉工坊

论文标题：Zhou, Yi, Guillermo Gallego, and Shaojie Shen. 'Event-based Stereo Visual Odometry.' arXiv preprint arXiv:2007.15548 (2020).

论文地址：在公众号「3D视觉工坊」，后台回复「双目事件相机」，即可直接下载。

'Event-based Stereo Visual Odometry' 是港科大沈劭劼老师组的一篇新工作。其基于双目的 Event Camera 来实现 Visual Odometry。

本文仅作分享，如有不当之处请多多指正！

Overview

文章主要贡献：

一个基于双目 Event Camera 的 Visual Odometry，同时实现 semi-dense 的建图。
提出一种新的基于优化的方法来实现逆深度的估计，基于 event 的 spatio-temporal 一致性。
基于估计出的逆深度的概率分布，提出一种 fusion 的方式，来提升三维重建的密度和精度。
通过 3D-2D 进行 registration 来进行 tracking。

系统概述：

系统流程：

下面从几个主要模块来进行梳理。

Event Representation

使用 Time-surface map (TS) 来表征 events，从而将时间信息加入了考虑。示意图如下：

即选一个时间点，离当前时刻越近，越亮。计算公式如下：

可知，其区间为，然后将其归一化到区间。

一个 TS 图示例如下：

Mapping: Stereo Depth Estimation

Mapping 部分的描述，首先描述了如何对 Event 进行逆深度估计，然后描述了如何进行完整的 semi-dense 的建图。

按照一定的时间频率合成 TS 图，计算每一个 TS 的时间内每一个 event 的逆深度（local depth map），然后选取一个窗口进行合成 semi-dense 的地图。其中，作者提到在实现时，TS 图的合成频率为 100Hz，窗口大小为20。

Inverse Depth Estimation for an Event

首先，如何对一个 Event 进行深度估计的几何示意图：

构造一个 objective function（基于一个event在两个相机中触发时的时间一致性）：

然后对其优化即可。这个优化过程论文中还提到了很多细节，如如何给一个初始化的逆深度等，具体请见论文。也就是说，进行逆深度估计的算法流程为：

Semi-Dense Reconstruction

作者首先拟合出前面步骤估计出的逆深度的概率分布，然后推导出一种两个概率分布 fusion 后进行更新的方式，最后提出 fusion 的策略。

首先，根据上文通过优化方式计算出逆深度的过程，以及根据实验数据，拟合出逆深度服从 Student's t-distribution。一些详细的数学解释请见原论文。

在一些数据集中，拟合出的参数：

有了上述的概率分布，这个时候就可以在前面的逆深度估计的优化函数中再加入一些 tricks，以来增强其鲁棒性质，具体请见原论文与引用。

有了概率分布，就可以进行两个之间的 fusion 了。见论文公式12a-12d。

有了以上的基础，为了得到更为稠密的地图，将多个已估计出逆深度的 TS 进行 fusion 的操作。Fusion 的策略如下图所示：

Camera Tracking

进行 Tracking 部分的主要思想是，首先每一个 event 对应的 camera 的 pose 都可能是不同的，但其实无需在这个时间分辨率上做，按照 TS 的频率来即可。然后通过将 TS 与深度图进行 align 即可。

Experimental

作者做了丰富大量的实验，以及算法中是否加一些 trick 的对比。这里截取一些：

本文仅做学术分享，如有侵权，请联系删文。

赞 (0)

双目立体放大！谷歌刚刚开源的这篇论文可能会成为手机双摄的新玩法

摄像头和计算机视觉技术已经成为智能手机技术创新的重要战场. 苹果上个月发布的iPhone XS中计算机视觉技术可谓其重要亮点(详见:iPhone Xs发布会其实是苹果计算机视觉技术发布会!),昨天谷歌 ...
NeurIPS2019|首篇单目无监督深度估计与视觉里程计，效果超越双目算法，已开源

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...
2021年数据科学家面试：4个基本SQL窗口函数介绍以及示例

墨墨导读:在数据科学家岗位的面试中,窗口函数(WINDOW function)是SQL函数家族中经常会被问到的主题.在本文中,我会根据面试的问题,问题模式和解决问题的基本策略向你展示一些典型的窗口函数 ...
治疗双目视物不清

双目视物不清病机多会从肝肾亏虚考虑,而本文将其诊为"水气上冲",予苓桂术甘汤治疗,获得痊愈.
自动驾驶中车辆的如何使用点云定位？

标题:Review on 3D Lidar Localization for Autonomous Driving Cars 作者:Mahdi Elhousni and Xinming Huang 翻 ...
基于深度学习的三维重建算法：MVSNet、RMVSNet、PointMVSNet、Cascade系列...

MVSNet:香港科技大学的权龙教授团队的MVSNet(2018年ECCV)开启了学习深度做多视图三维重建的先河.2019.2020年又有多篇改进:RMVSNet(CVPR2019),PointMVS ...
【泡泡一分钟】超越光度一致性：基于梯度差异改进视觉里程计和立体匹配

每天一分钟,带你读遍机器人顶级会议文章标题:Beyond Photometric Consistency: Gradient-based Dissimilarity for Improving Vi ...
VO视觉里程计

VO视觉里程计
视觉里程计

视觉/图像重磅干货,第一时间送达新机器视觉最前沿的机器视觉与计算机视觉技术206篇原创内容公众号来源 | ADAS视觉里程计(Visual Odometry)在机器人学与计算机视觉领域,视觉里程计 ...
【泡泡一分钟】挑战性光照条件下的视觉里程计多模态跟踪框架

每天一分钟,带你读遍机器人顶级会议文章标题:Multimodal tracking framework for visual odometry in challenging illumination ...
【点云论文速读】基于优化的视觉惯导里程计与GPS的紧耦合的融合方案

标题:Tightly-coupled Fusion of Global Positional Measurements in Optimization based Visual-Inertial Od ...
基于点线特征的激光雷达+单目视觉里程计

标题:Lidar-Monocular Visual Odometry using Point and Line Features 作者:Shi-Sheng Huang1, Ze-Yu Ma1, Tai ...
LIC Fusion 2.0：滑动窗口法平面特征跟踪的激光雷达惯性相机里程计

标题:LIC-Fusion 2.0: LiDAR-Inertial-Camera Odometry with Sliding-Window Plane-Feature Tracking 作者:Xing ...
基于点云描述子的立体视觉里程计快速鲁棒的位置识别方法

文章:A Fast and Robust Place Recognition Approach for Stereo Visual Odometry Using LiDAR Descriptors 作 ...