使用3D卷积神经网络进行次优视图回归

2024-07-31 14:37:18

点击上方“深度学习爱好者”，选择加"星标"或“置顶”

重磅干货，第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享，旨在帮助各位读者快速了解论文内容。个人能力有限，理解难免出现偏差，建议对文章内容感兴趣的读者，一定要下载原文，了解具体内容。

摘要

自动三维(3D)对象重建是通过感知其表面来构建一个物理对象的几何表示的任务。虽然新的单视图重建技术可以预测表面，但它们导致不完整的模型，特别是对于非公共对象，如古董对象或艺术雕塑。因此，为了实现任务的目标，必须自动确定传感器将放置的位置，使表面将被完全观察到。这个问题被称为次最佳视角问题。在本文中，作者提出了一种数据驱动的方法来解决这个问题。所提出的方法用先前的重建来训练一个3D卷积神经网络(3D CNN)，以便回归次最佳视图的位置。据作者所知，这是使用数据驱动的方法在三维物体重建任务中直接推断连续空间中次佳视图的第一批作品之一。通过两组实验，作者验证了所提出的方法。在第一组中，分析了提议的体系结构的几个变体。预测的下一个最佳视图被观察到是接近地面真相的位置。在第二组实验中，作者要求所提出的方法重建几个看不见的物体，即在训练和验证过程中3D CNN没有考虑到的物体。观察到的覆盖率高达90%。与当前最先进的方法相比，本文提出的方法提高了以前的次优视图分类方法的性能，并且在运行时间上非常快(3帧每秒)，因为它不需要计算以前信息度量所需的昂贵射线追踪。

论文主要贡献

本文的研究进展如下:

1.而本文解决了一个回归问题。主要的含义是，在这项工作中，一个人不限于离散的预定义的传感位置;相反，NBV是由连续体决定的。

2. 本文就网络结构中的层数问题进行了分析。这样的分析在[25]中并不存在。

3.这项工作也提出了关于dropout存在的分析。

4. 对预测的nvs进行了定性和定量分析，并将其与实际情况进行了比较。

5. 作者测试了13个新对象，这些对象既不包括在[24]训练数据集中，也不包括在[25]中。

框架结构

次优视图规划的整体回归方法

NBV-net 4 - 5架构

数字4-5代表4个特征提取层和5个完全连通的层。

实验结果

数据集中几个对象的预测下一个最佳视图与地面真相的比较。蓝色体素表示测量表面。黄色体素表示未知空间。预测的次最佳视图用红色表示。仅次于最佳视图的地面真相用绿色表示。

模型

测试结果

结论

作者提出了一种基于深度学习的次优视图回归方法。在这种方法中，作者解决了连续空间中次优视图预测。所提议的网络架构是为特定的问题而设计的，它已经经过训练和验证。作者的实验表明，提出的方法可以很好地概括出在训练和验证过程中没有被网络看到的物体形状。该方法的快速响应是其优点之一，因为它消除了昂贵的射线追踪所需的国家最先进的方法。作者将本文提出的方法与其他两种相关方法进行了比较。作者可以得出结论，本文提出的方法在物体重建的百分比和计算次优视图所需的处理时间之间取得了良好的平衡。对于未来的研究，作者将研究新的损失函数以及在大型建筑重建中的应用。最后，计划继续扩展包括其他对象在内的训练和验证数据集。

论文链接：https://arxiv.org/pdf/2101.09397.pdf

每日坚持论文分享不易，如果喜欢我们的内容，希望可以推荐或者转发给周围的同学。

- END -

CVPR 2020｜开源实时“人手-物体”姿态估计算法HOPE-Net

向大家安利一篇CVPR 2020的论文 HOPE-Net: A Graph-based Model for Hand-Object Pose Estimation,基于自适应图卷积技术,作者提出了一种 ...
CAV 之往事可追忆

19 号,第 32 届 CAV (Computer Aided Verification)会议正式于线上举行,会议致力于硬件和软件系统的计算机辅助形式化分析方法的理论和实践的进步,涵盖从实用的验证工具 ...
CVPR 2020 | 用于点云中3D对象检测的图神经网络

论文原文:Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud 论文地址:https://www.amine ...
实时稀疏点云分割

在基于激光的自动驾驶或者移动机器人的应用中,在移动场景中提取单个对象的能力是十分重要的.因为这样的系统需要在动态的感知环境中感知到周围发生变化或者移动的对象,在感知系统中,将图像或者点云数据预处理成单 ...
自动驾驶中的三维目标检测综述

文章:3D Object Detection for Autonomous Driving: A Survey 作者:Rui Qian, Xin Lai, and Xirong Li 编译:点云PCL ...
ECCV2020|基于关键点的单目3D目标检测

论文原文:RTM3D:Real-timeMonocular3DDetectionfromObject KeypointsforAutonomousDriving 论文地址: https://www.a ...
两个作者并排署名的要求和方法

不管是发表论文还是出版出书,都会安排作者署名.尤其是多名作者署名时,要考虑位次,甚至可能还会出现并排署名作者的情况.那么,两个作者怎么并排署名? 两个作者并排署名,是指两个作者的署名排列在一条线上,不 ...
R语言实现CNN（卷积神经网络）模型进行回归数据分析

原文链接:http://tecdat.cn/?p=18149 当我们将CNN(卷积神经网络)模型用于训练多维类型的数据(例如图像)时,它们非常有用.我们还可以实现CNN模型进行回归数据分析.我们之前使 ...
DL之CNN：卷积神经网络算法简介之原理简介——CNN网络的3D可视化(LeNet-5为例可视化)

DL之CNN:卷积神经网络算法简介之原理简介--CNN网络的3D可视化(LeNet-5为例可视化) CNN网络的3D可视化 3D可视化地址:http://scs.ryerson.ca/~aharley ...
带动画效果的卷积神经网络的讲解.pptx

刚在学习深度学习的时候,对卷积神经网络还比较模糊,后来发现一位黄海广老师的卷积神经网络课件,带很多动画,把卷积神经网络讲得很清楚.值得推荐. 文末提供原版的ppt的下载方式,ppt效果见下图: 下载方 ...
卷积神经网络是如何实现不变性特征提取的？

转载于 :OpenCV学堂图像特征传统的图像特征提取(特征工程)主要是基于各种先验模型,通过提取图像关键点.生成描述子特征数据.进行数据匹配或者机器学习方法对特征数据二分类/多分类实现图像的对象检 ...
深度信号处理：利用卷积神经网络测量距离

在信号处理中,有时需要测量信号某些特征(例如峰)之间的水平距离. 一个很好的例子就是解释心电图(ECG),这在很大程度上取决于测量距离. 我们将考虑下图中只有两个峰的平滑信号的一个样例. 解决这个问题 ...
【时间序列】时间卷积神经网络

在深度学习的知识宝库中,除了前面文章中介绍的RNN,还有一个重要的分支:卷积神经网络(CNN),其广泛应用于视觉,视频等二维或者多维的图像领域.卷积网络具有深度,可并行等多种特性,这种技术是否可以应用 ...
总结 | 卷积神经网络必读的40篇经典论文，包含检测/识别/分类/分割多个领域

转载于 :极市平台作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉等领域上取得了当前最好的效果. 1998 年,Yann L ...
【隐创118期】基于卷积神经网络的海面目标检测方法研究（节选二）

编者按: 深度学习算法已被证明是图像与视频处理的强大工具,广泛应用于国防安全之中.在海洋环境中,光电传感器数据与人类智能技术的融合对于应对安全问题具有重要作用.例如,态势感知可以通过一个自动系统来增强 ...
个性化癌症治疗再进一步！科学家通过图卷积神经网络技术发现165个新的致癌基因

作者:刘芳编审:王新凯.寇建超排版:王落尘作为对人类健康造成最重大威胁的疾病之一,癌症一直是各国科学家们重点研究的对象.据世界卫生组织国际癌症研究署(IAR)发布的全球最新癌症预估数据显示,20 ...

使用3D卷积神经网络进行次优视图回归

相关推荐