【泡泡一分钟】基于学习的地下环境自主探索路径规划
每天一分钟,带你读遍机器人顶级会议文章
标题:Learning-based Path Planning for Autonomous Exploration of Subterranean Environments
作者:Russell Reinhart, Tung Dang, Emily Hand, Christos Papachristos, and Kostas Alexis
来源:2020 IEEE International Conference on Robotics and Automation (ICRA)
编译:魏春雨
审核:柴毅,王靖淇
这是泡泡一分钟推送的第 684 篇文章,欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权
摘要
在这项工作中,我们提出了一种基于学习的路径规划的新方法,该方法用于使用空中机器人自主探索地下环境。利用最近提出的基于图形的路径规划器作为“培训专家”,并遵循一种依赖于模仿学习概念的方法,我们得出了能够指导机器人自主探索地下矿山巷道和隧道的受训策略。该算法仅利用从机载LiDAR采样的一小段距离数据,就可实现与培训专家类似的探索性行为,并在计算成本上降低了多个数量级,同时放松了保持一致且持续的需求,在线重建环境的地图。在与地下矿山的自主勘探有关的现场测试中,在模拟和实验中都对经过训练的路径规划策略进行了广泛的评估。
图1.地下矿场部署的一个实例,在此实例的基础上呈现了基于学习的路径规划策略结果。
算法1. 借助DAGGER专家进行模仿学习
图2.基于学习的探索计划器的网络架构
图3. 在提出的勘探方向的范围内,通过组织专家解决方案借助八分圆来生成训练数据。
图4. LBPlanner和GBPlanner在测试模拟环境中提出的勘探方向比较。在所示的每个点都触发了两个规划程序,但是执行了LBPlanner路径。每个规划器迭代的颜色代码由每个计划者建议的勘探方向之间的点积确定。子图a)显示了在所有点上建议的勘探方向之间的高度相关性(平均19°绝对角差)。子图b)显示了GBPlanner在LBPlanner(5)之前确定了死角(4),以及LBPlanner无法探索其他分支
图5. LBPlanner a)和GBPlanner b)的轨迹对应于表I中的勘探速率结果。从视觉上观察,路径非常相似,这表明LBPlanner模仿其训练专家的能力
图6:我们的空中地下机器人侦察员的系统概述
图7:展示了基于学习的勘探规划器从主门开始导航,在地下矿山运行170m的漂移情况。LBPlanner在隧道和交叉点开始处确定可行方向(与预测分数成比例的箭头长度),以及相应的局部点云,范围图像和车载摄像头捕获的图像(子图a-b)。在另一种情况下,对提出的规划器进行了评估,该情形是机器人从T型接头的底部启动;因此规划器必须安全地引导机器人进入路口,然后继续向左或向右分支探索。如子图c)所示,规划器正确地提出了向右分支的安全且高勘探收益的路径
图8.卢塞恩矿山中两个规划器的勘探率
Abstract
In this work we present a new methodology on learning-based path planning for autonomous exploration of subterranean environments using aerial robots. Utilizing a recently proposed graph-based path planner as a “training expert” and following an approach relying on the concepts of imitation learning, we derive a trained policy capable of guiding the robot to autonomously explore underground mine drifts and tunnels. The algorithm utilizes only a short window of range data sampled from the onboard LiDAR and achieves an exploratory behavior similar to that of the training expert with a more than an order of magnitude reduction in computational cost, while simultaneously relaxing the need to maintain a consistent and online reconstructed map of the environment. The trained path planning policy is extensively evaluated both in simulation and experimentally within field tests relating to the autonomous exploration of underground mines.