Nature重磅:深度强化学习“落地”高空,全自动环境监测或成现实

在电影《飞屋环游记》中,男主人公用一大堆气球将自己的小木屋带上天空,并通过增减气球、手动施力来改变气球的飞行方向,去实现他未曾实现的梦想......

当然,电影世界具有一定的幻想色彩。但是,如今还真有这样一种巨型气球,它虽然不能带着小木屋飞上天空,却更加智能、用处更大——让全自动环境实时监测成为可能。

平流层气球(stratospheric balloon),又称高空气球,可以在大气平流层中自主飞行数月,具有低成本、高效益的特点,这使其成为通信、地球观测、收集气象数据和许多其他应用的宠儿。但是,如何实现高空气球的自主导航,一直是科学研究的一个难题。
近日,来自谷歌研究院(Google Research )和 Alphabet 旗下公司 Loon 的研究人员组成的科研团队,成功开发出的一种基于深度强化学习的高性能人工智能控制器,能让高空气球一连数周待在原地,并根据环境因素进行实时决策并实现自主导航。这一研究结果提高了全自动环境监测成为现实的可能性,代表深度强化学习向现实世界应用迈进了非常重要的一步。
该研究成果以“Autonomous navigation of stratospheric balloons using reinforcement learning”为题,于 12 月 3 日在线发表在顶级期刊 Nature 上。
(来源:Nature
续航瓶颈,无法满足需求

高空气球中应用最广泛的当属“超压”气球,气球内填充氦气,常被用来在高层大气开展实验。这些气球遇到气流风时,往往会偏离航道,之后便只能返回地面驻点。而此次研究所采用的深度强化学习方法,可以训练人工智能系统进行实时决策。对于超压气球来说,这些决策包括采取哪些行动来保持其在空中的位置不变。
Loon 超压气球是谷歌于 2013 年成立的高空气球项目的成果之一,旨在将其作为通信中继平台,为还未接入互联网的偏远地区提供一种相对廉价的通信服务。传统上,Loon 的上下垂直飞行通过泵出固定体积的气囊来实现,而左右水平运动则由气球所处位置的风向所决定。因此,为了实现导航目的,飞行控制器必须通过上升和下降的方式,以找到并跟随对其有利的气流。
(来源:Loon)
然而,这种简单的导航方式无法满足气球长时间(有时长达几个月)控制的目标。例如,传统“控位法”(Station-keeping)需要将气球固定在某个地面位置的正上方。为了完成这一任务,气球就必须不断地通过风场变化采取间接飞行路径,以保证位置不变。
图|通过“控位法”保持超压气球位置。a) 超压气球在风场航行的原理图。气球通过不断移动来保持在离驻点较近的地方。其高度范围用上下虚线表示;b) 气球飞行路径平面示意图。蓝色区域表示驻点方圆 50 公里范围。阴影箭头代表风场。风场不断变化,要求气球实时规划路线。(来源:Nature
不仅如此,气球还需要在昼夜交替中管理自身电力,由于气球下降时会使用存储在电池中的太阳能,一旦电力不够,气球也就无法再自主控制飞行。另外,一个好的飞行控制器必须能够权衡收集目标观测结果的性价比。因此,上述传统控制技术本身非智能化的性质就限制了其最终表现。
AI 赋能,带来质的飞跃
为提高超压气球的续航能力,论文作者之一、谷歌研究院科学家 Marc Bellemare 及其合作者训练了一种人工智能控制器,这种控制器能根据风的历史记录、预报、局部风向观测以及氦气损失和电池疲劳等其他因素,来实时决定气球是否需要移动。
首先,研究人员将 StationSeeker 算法用于这一人工智能控制器中。该算法为控制器提供了较好的“洞察力”,StationSeeker 会凭借风向与驻点形成的锐角来跟踪风向,只要气球处于驻点范围内,它就会主动去寻找移动较为缓慢的气流。
而后,研究人员对该控制器进行了模拟训练,在模拟试验中使用强化学习来训练飞行控制器。强化学习擅长自动产生控制策略,可以处理高维度的异质数据,并在需要长期观测时优化对应的控制策略。
为了获得最先进的控制器,研究人员结合了深度强化学习领域的最新进展,即强调在学习过程中使用深度神经网络。该控制器使用的神经网络分为 7 层、每层具有 600 个校正线性单元,而且试验证明,使用较小的网络或非分布算法会使得性能降低。
图|神经网络规模对 TWR50(气球位于驻点 50 公里以内范围时节省的时间)的影响(来源:Nature
此次模拟试验包括对超压气球控制器在一个固定的位置上进行两天模拟,在此期间,控制器以 3 分钟的间隔接收输入数据和发出命令。因此,飞行控制器能够置身于昼夜循环场景中,这意味着气球必须从艰难的夜间条件中恢复工作,且最终产生的飞行路径则会接近真实场景。
最后,作者将该技术应用到分布于全球各地的 Loon 气球上,包括一项在太平洋上空进行的为期 39 天的受控实验(共 2884 飞行小时)。分析结果证明,受到 StationSeeker 控制的气球能够成功实现自主导航,一旦被吹偏航道,它们能以比传统控制器控制的气球更快的速度回到驻点。
其中,控制器最佳表现达到 55.1% TWR50。要知道,1% 的性能提升相当于节省 14.4 分钟的返回时间,因此,这一差异相当于每 24 小时内的返回时间平均减少 3.5 小时。
毫无疑问,此次研究成功将人工智能强化学习方法应用到了超压气球与环境的实时交互之中,拓宽了其在现实科学研究中的应用。
正如牛津大学物理系教授 Scott Osprey 所说:“Marc Bellemare 和同事的成果代表了强化学习在现实世界应用的一次巨大进步。”
参考资料:
https://www.nature.com/articles/s41586-020-2939-8
(0)

相关推荐

  • NASA数次推迟超压气球的发射

    NASA在4月8日(新西兰时间)星期六的上午2点,宣布推迟了从新西兰瓦纳卡发射超压气球的计划日程,理由是平流层的气象状况不满足放飞条件. 这张图显示了33.5Km(11万英尺)高度的平流层风速和风向, ...

  • JAXA宣布在2017年首次发放气球

        日本北海道大树町(Taiki,日本地名). 前些日子,空间日本宇航航空研究开发机构(JAXA)下属的宇宙科学研究所(ISAS)宣布在2017年将实现第一批平流层气球的发放. 发放活动将在Tai ...

  • 中科院光电院研制的超压气球实现国内临近空间首飞

    2017年9月10日,由中科院光电院研制的超压气球在内蒙古首飞取得圆满成功. 本次飞行的超压气球球体体积约7000立方米,设计升限25公里,载重能力约150公斤.球体构型采用"南北型&quo ...

  • NASA的超压气球在新西兰起飞

    新西兰当地时间4月25日上午10点50分,NASA在瓦纳卡机场成功发放了它的重载超压气球,该气球尺寸有足球场那么大.该超压气球的飞行任务是在南半球中纬度地区33.5公里高度持续飞行100天以上来进行科 ...

  • Stratéole 2 超压气球计划及进展

    法国和美国科学家联合进行的"Stratéole 2"计划原定于2018年11月开始发放高空气球.气球将携带仪器设备进入平流层并环绕世界,详细观察空气和风的特性.这些测量结果将推动我 ...

  • “海豹突击队第6分队"任务:制作超压气球

    '海豹突击队第6分队'正在制作超压气球 德克萨斯州硫磺泉市Raven Aerostar公司的生产基地内,工人们在超压气球生产过程中重新摆放好气球. NASA最新的超压气球(super pressure ...

  • 2017年全球浮空器圈十大新闻

    忙碌的2017年已经接近尾声,在小小的浮空器圈子里面(即使放眼全世界,浮空器依然是小众飞行器,2017年可圈可点的大事件也是屈指可数的),2017年发生了哪些令人难忘的事情呢?浮空飞行器公众号应该没有 ...

  • 2019年浮空圈十大新闻盘点

         今天是大年三十,浮空君在这里给各位读者拜年了,2019年的新闻盘点早就应该写了,但是没办法,实在是太懒了,一直拖到了大年三十,眼看再不写就过期了,所以古人说的好,deadline就是第一生产 ...

  • Stratéole 2计划:高空超压气球84天环游地球

    法国和美国科学家联合进行的"Stratéole 2"计划预计2018年11月开始发放高空气球.气球将携带仪器设备进入平流层并环绕世界,详细观察空气和风的特性. 为了准备Straté ...

  • NASA超压气球环球旅行即将再次开启!

    中断了三年之后,NASA的"科学气球计划"将重返新西兰的瓦纳卡发射场,希望完善其超压气球(super pressure balloon)技术,以支持更长飞行时间的科学任务(驻空时长 ...

  • 谷歌的Loon气球是如何利用深度强化学习有效穿越平流层的?

    作者:Salvatore Candido Loon和Google AI如何实现世界上第一次在量产航空航天系统(a production aerospace system)中应用强化学习算法. 驱动一个 ...

  • RAVEN AEROSTAR和Persistent公司合作开展平流层气球网络通信演示验证

    微波中继(Wave Relay)®移动自组织网络(MANET)支持的平流层气球可以实现快速反应和远程任务.GPS拒止环境操作和击落飞行员营救任务. 移动自组网解决方案的领导者Persistent与浮空 ...

  • 气球在行星探测中的应用及发展

    气球在行星探测中的应用及发展*张航悦*1,2,杨燕初1,2(1.中国科学院大学,北京 100190:2.中国科学院光电研究院,北京 100094)摘要:行星气球探测方案是一项正在发展的地外探测技术.本 ...

  • NASA竟然让女科学家干这活儿……

    NASA竟然让女科学家干这活儿--真是太不懂得怜香惜玉了--废话少说,视频为证: NASA的科学家都是人中龙凤,国之栋梁,肩负着维护世界和平的神圣使命,怎么能让他们干这种体力活呢,尤其还是女科学家,我 ...

  • NASA超压气球告急

    在气球到达指定漂浮高度109,000英尺后的几个小时里,美国宇航局利用安装在吊篮顶上的机载摄影机,对气球表面进行了仔细的检查.然后实时地将拍摄到的图像能过测控链路传输给地面,并没有发现任何问题. 气球 ...

  • 超压气球放飞对气象条件有什么样的要求?

    3月30日,美国宇航局哥伦比亚科学气球研究中心的气象专家Chris Schwantes在新西兰瓦纳卡机场为超压气球试验团队介绍当天的气象状况. NASA发放的所有飞行器中,没有任何一种像科学气球这样对 ...

  • loon的超压气球是如何使用人工智能飞行的?

    来源:Nature news 一个人工智能控制器可以在不完全了解周围风的情况下,一次让一个平流层气球停留数周,为无人的环境监测开辟了前景. 图1 |平流层中的无人驾驶气球.Loon项目正在使用这样的气 ...

  • 零压,超压,重载,傻傻分不清楚 | 高空科学气球到底有几种?

    听说高空科学气球有很多分类,什么零压气球,过压气球,超压气球,重载气球,超高空气球,红外气球,作为非浮空器专业人士,表示完全分不清楚!! 这个问题引起了我深深的思考,嗯,是时候给大家一个解释了. 高空 ...

  • 用八个气球环游世界

    CNES超压气球正在充气,版权所有:Ph.Cockrez,CNES Strateole-2是由欧空局支持的一个法国-美国项目,它利用CNES超压气球在全球各地漂流,研究热带对流层顶层(TTL)和平流层 ...