深度 | 揭秘自监督学习 + 超算中心,加速自动驾驶的生产力工具

先从一个有趣的话题聊起:小麦是如何驯化人类的?
这是《人类简史》中一个很有意思的观点。一万八千年前,小麦只是新月沃地普通植物,而经过漫长地对人类的驯化,它成为了地球上最广泛种植的作物。这种驯化包括,改变人类此前的狩猎采集生活,迫使人类进行播种、除草、施肥等农业劳动,甚至建立更有效的社会体系去扩大种植范围。
随着生产力提升,这种小麦统治被工业文明所终结,但取而代之的是机器对人类的奴役。工业革命后,机器展开了对人类的控制,推翻这一统治的是人工智能。有多少人工,才有多少智能,人工智能顺利登上统治位。
现阶段人工智能,需要大量的场景采集、数据分拣、人工标注。这种劳动,有一个更好听的名词,叫做“监督学习”。想要改朝换代,必须要有生产力的革新,这就要提到今天想聊得重点,“自监督学习”和超级计算机,加速变革的下一代生产力工具。

自监督学习摆脱人工标注成本束缚

自监督学习是相较于监督学习、弱监督学习而言的概念。简单理解,监督学习依靠人工对所有数据进行标注。弱监督学习如同“授人以渔”,用部分标注好的数据来让系统“举一反三”。自监督学习则完全不依赖人工标注,
对自动驾驶而言,数据标注费时费力,随着传感器增加和路测里程增加,面对海量数据,自监督学习成了各家企业都努力的方向。例如特斯拉,其目前在全球有大约120万辆汽车在帮助收集真实道路信息,依靠庞大的数据量依靠人工标注,成本高利用率也非常低,必须依靠自监督学习才能处理如此海量的数据。
目前关于特斯拉在自监督学习上进展的信息很少,所以我们无从得知,但近期国内自动驾驶公司轻舟智航关于自监督学习的论文被CVPR 收录,我们可以由此去理解什么是自监督学习。
自监督学习最普遍场景是给黑白照片上色,模型训练的做法是,给定黑白照片输入,用对应的正确彩色图片做学习的标签,经过大量学习,模型就可以理解黑白照片中对应的位置该填充为怎样的颜色。可以理解为上学时,偷看数学题的答案,试着倒推出解题过程,这种事做多了,也就能够理解不同的数学题的类型,该套用怎样的解题过程。
轻舟智航的研究有些如此类似。我们先看结果,通过视频可以看出,轻舟智航的车辆能够对道路上激光雷达采集到到的同一运动物不同点云打包为一个规则的运动物体,并预测其运动轨迹,此前对于这类素材,需要人工将其中的几个点框起来并标注上“公交车”,而现在这项工作通过自监督学习自动完成。
轻舟智航的做法是用相机信息,为激光雷达的点云信息做自监督学习的引导,简单理解,相机信息给到的画面就是参考答案,激光雷达点云对着参考答案,去倒推如何将点云的运动,理解为环境中对应道路参与者的移动。
受制于人工标注的成本,现阶段多数自动驾驶测试数据都无法发挥价值,利用自监督学习解决标注问题,将极大提高人工智能的发展速度。

超算中心是自监督学习下的加速器

一家商业公司投资建设超算中心,还顺便超越了中美日三大国的国家级超算中心,这种事也只能发生在特斯拉。据马斯克此前透露透露,特斯拉超算命名为 Dojo, 浮点运算能力达每秒100亿亿次。而目前全球超算排行榜第一的日本Fugaku(富岳)峰值每秒运算44.2亿亿次,排名第四的中国“神威太湖之光”,峰值每秒运算9.3亿亿次。
不过,为了人工智能训练建设计算中心,特斯拉并不是唯一的。今年的Google I/O开发者大会上,谷歌发布了由 4096 个TPU v4单芯片组成的TPU v4 Pod,单个算力 100 亿亿次,和Dojo齐平,且同样也服务于人工智能训练。国内,商汤科技在上海浦东投资40亿建设超级计算中心,具体算力未知,国内包括华为、百度、阿里巴巴等科技公司,也都有部署有人工智能计算中心。
现阶段由于监督学习下,人工标注的效率和成本限制,算法模型训练对算力的需求并不急迫,虚拟仿真也借助第三方服务商运行。但随着自监督学习摆脱对人工标注的束缚,自有大算力平台将对自动驾驶训练速度产生立竿见影的效果,自动驾驶企业间的差距也将愈发明显。
自监督学习和专为人工智能训练使用的超算中心,将是拉开技术差距的生产力工具,属于自动驾驶的“军备竞赛”才刚刚打响,而这场战火也将掀起真正的人工智能革命。

谢谢那么好看的你读完了全文,再给辛苦写作的小编点个“在看”吧!

END

(0)

相关推荐