不用激光雷达,照样又快又准!3D目标检测之SMOKE
向大家介绍一篇CVPR 2020 Workshop的文章:SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation。
2.1 Backbone
2.2 关键点检测分支
2.3 回归分支
表示深度偏移; 和对下采样产生的量化误差进行补偿; 、、分别表示高、宽、长的残差(residual dimensions); 和用于确定角度。
根据深度偏移量可以求得目标的深度值,公式如下:
3.1 关键点分类损失
3.2 回归损失
、、,根据以及预定义的和可以求出深度值,根据深度值、、以及从标注数据中得到的3D框中心点在图像平面上的投影,可以得到目标3D框中心点在相机坐标系下的坐标; 、,根据和可以得到,从标注数据中得到目标3D框中心点在相机坐标系下的坐标,可以得到航向角; 、、,根据这三个值以及预定义的可以得到目标3D框的长、宽、高。
4.1 实验配置
4.2 性能
直接通过单阶段网络预测3D框的属性,而不是先检测2D框,再利用2D框的信息生成3D框; 在构造回归分支的损失函数时,将多个属性对损失函数的贡献解耦,加速模型收敛; 模型结构简单,推理时间为30ms,具有实时性。
源码:https://github.com/lzccccc/SMOKE
END
赞 (0)