ECCV18 Oral | MVSNet: 非结构化多视点三维重建网络（高精度高效率，代码已开源）

2024-02-25 17:07:12

编者按：本文来自ECCV2018选为Oral的论文，来自香港科技大学和Altizure公司的研究团队提出了一种既高精度又高效率的三维重建网络，非常值得参考，52CV强烈推荐。代码已经开源，欢迎Star。

作者信息：

项目地址：

https://github.com/YoYo000/MVSNet

多视点三维重建（Mult-view Stereo）的挑战：

如何从图像中恢复物体的三维信息是计算机视觉研究的一个核心问题。Multi-view Stereo (MVS)的方法即为给定从不同视角拍摄的图像以及其对应的相机几何，通过稠密匹配的方式恢复出物体以及场景的三维结构。传统的MVS算法（例如PMVS，COLMAP）基于handcrafted像素匹配算法具有相当高的重建准确度（accuracy），但对于纹理稀疏、非漫反射的物体表面难以得到令人满意的重建效果。因此，MVS算法的重建完整度（completeness）还有很大的提升空间。

MVSNet：

本文提出了一个端到端的深度神经网络MVSNet来进行多视点三维重建，由于问题的输入为图像与多视角相机几何，如何将相机几何与深度学习神经网络相结合是MVSNet设计的重点。本文提出通过可微单应映射（Differentiable Homography）操作将相机几何嵌入深度神经网络中。这一操作连接了2D图像特征网络与3D空间正规化网络，使得多视点三维重建的端到端训练成为了可能。此外，MVSNet的另一难点在于如何处理不定数目的图像输入。我们设计了一个基于方差的多视点匹配代价计算准则，将任意数量的像素特征向量映射为一个匹配代价向量，从而使得同一网络适用于任意数目的图像输入。

MVSNet的网络结果如上图所示，输入图像将经过特征提取网络得到深度图像特征，并通过可微单应映射在参考图像的可视空间中构建cost volume；该cost volume将经过一个多尺度的三位卷积网络优化得到一个三维概率空间，并通过深度期望的方式得到参考图像的初始深度图以及对应的概率图（用于深度图去噪）；接下来参考图像以及其深度图将作为输入传入深度图优化网络，得到优化后的深度图作为MVSNet的输出。最后，我们可以通过深度图融合以及去噪的方法得到图像对应的三维点云模型。

实验结果：

DTU dataset：相较于传统的MVS算法，我们的方法在保持了重建准确度的同时，极大地提高了模型的重建完整度。MVSNet在DTU数据集上获得了远超其他方法的结果；

Tanks and Temples benchmark：MVSNet在未重新微调训练的情况下，在室外场景Tanks and Temple榜单中排名第一（before April 18）。此外，MVSNet的运行速度也数倍快于之前的state-of-the-arts。

论文链接：

https://arxiv.org/abs/1804.02505

论文&代码下载：

转发本文到朋友圈，然后在“我爱计算机视觉”公众号对话界面输入mvsnet，即可收到该文及代码的百度云下载地址。

TUM大牛组最新工作：不需要3D包围盒，单目实现3D车辆检测！

快速获得最新干货 Learning Monocular 3D Vehicle Detection without 3D Bounding Box Labels Technical University ...
【杂谈】如何从数据准备，模型设计与调优，训练到部署完成整个深度学习算法流程

对于一个深度学习算法工程师来说,拥有丰富的项目经历当然是重要的,但是拥有完成整个从数据准备到模型上线的能力更加重要.这意味着可以独立承担项目,也是全栈工程师那么招人爱的原因了. 这个完整流程属于有三A ...
全球独家首发，720°云观航展！四维时代联合第13届中国航展发布“云上航展”

9月28日上午,第13届中国国际航空航天博览会(简称"第13届中国航展")在珠海国际航展中心开幕,众多高新装备闪耀亮相.为满足观众通过远程线上看航展的需求,四维时代联手第13届中国 ...
ECCV 2020 | 基于分割一致性的单目自监督三维重建

概述本文主要从二维图像及其轮廓的集合中,学习一个自监督的.单视图的三维重建模型,预测目标物体的3D网格形状.纹理和相机位姿.提出的方法不需要3D监督.注释的关键点.物体的多视图或者一个先验的网格模板 ...
CoCoNets：连续对比的3D场景再现

点击上方"深度学习爱好者",选择加"星标"或"置顶" 重磅干货,第一时间送达小黑导读论文是学术研究的精华和未来发展的明灯.小黑决心每天为 ...
基于深度图估计的oct血管造影三维血管重建

重磅干货,第一时间送达小白导读论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容.个人能力有限,理解难免出现偏差,建议对文章 ...
ECCV | Pixel2Mesh：单目彩色相机重建三维模型

重磅干货,第一时间送达该paper是由普林斯顿大学3个英特尔实验室4个复旦大学数据科学学院以及5个腾讯人工智能实验室研究员合作的.来自于复旦大学计算机科学学院上海市智能信息处理重点实验室.该论文已经 ...
最全综述：基于深度学习的三维重建算法

前言目前,三维重建技术已在游戏.电影.测绘.定位.导航.自动驾驶.VR/AR.工业制造以及消费品领域等方面得到了广泛的应用.方法同样也层出不穷,我们将这些方法依据原理分为两类: 基于传统多视图几何的 ...
开源｜AAAI‘21杰出论文-三维重建新探索：解决数据依赖问题，让自监督信号更可靠！

作者丨许鸿斌来源丨极市平台编辑丨极市平台极市导读现有的方法都是假设不同视图之间的对应点具有相同的颜色,这在实践中并不总是正确的.这可能导致不可靠的自监督信号,并损害最终的重建性能.为了解决这个 ...
基于深度学习的三维重建算法：MVSNet、RMVSNet、PointMVSNet、Cascade系列...

MVSNet:香港科技大学的权龙教授团队的MVSNet(2018年ECCV)开启了学习深度做多视图三维重建的先河.2019.2020年又有多篇改进:RMVSNet(CVPR2019),PointMVS ...
ECCV 2020 | PHOSA：一种基于单目图像的人-物重建方法

概述作者提出了一种能够推断出人类和物体的形状和空间排列的方法,只需要一张在自然环境中捕捉的图像,且不需要任何带有3D监督的数据集.该方法的主要观点是,将人类和物体结合起来考虑,这样会产生" ...
【视频课】一课彻底掌握深度学习人脸图像算法，长期更新

课程介绍人脸图像在计算机视觉领域中研究方向非常广,覆盖底层图像特征,目标检测与跟踪,图像分类和检索,图像滤波,图像分割,三维重建,风格迁移等方向. 在商业界应用落地也有非常多的软件产品和硬件产品. ...
有三AI“夏季划”出炉，今夏进阶中级CV算法工程师

春季划结束已经10天了,今天有三AI夏季划正式出炉,这一次的报名周期将是6.10-9-30,历时110余天,这也可能是我们最后一次纯CV的季划,夏日炎炎,不如学习. 文/编辑 | 言有三什么是夏季划 ...

ECCV18 Oral | MVSNet: 非结构化多视点三维重建网络（高精度高效率，代码已开源）

相关推荐