像FIFA一样踢球的AI，比打游戏更强吗？ / 四六文摘

还记得被阿尔法狗支配的恐惧吗？最新的“AI恐怖故事”，是谷歌教AI踢足球，打造“AI版贝克汉姆”。

其实，这个足球人工智慧研究专案Google Research Football，早在今年6月就出现在了谷歌报告上，而更早一些时间，就在Github上以开源的形式发布了足球环境游戏的测试版代码。

以谷歌“AI界顶流”的咖位，加上当今的资讯效率，现在才突然一波走红，反射弧委实有点过长了。难道是媒体们集体不蹭热点，改成冷饭热炒了？

答案或许处在“下一代AI”这个充满遐想的泛滥标题里，用一个上古时期的互联网话术来说，就是听起来很性感。

此前在《星际争霸》《DOTA2》里超越人类电竞队伍的AI，都没能获此殊荣，踢个足球就引领未来，AI和AI的差别咋就这么大呢？

这一代AI的上升空间还有多大？

大众已经越来越明白，AI不能变魔术了。然而将时间倒回到2016年，相信绝大部分人都不会否认，担心工作被AI替代，被机器人网红索菲亚吓得瑟瑟发抖，觉得《终结者》《黑客帝国》《西部世界》早晚要来，都是切身体会过的心路历程。

传统的“AI恐怖故事”宣告破产，一方面得益于各路技术大牛日积月累地科（怼）普（人），同时也跟建立在深度学习基础上的技术上限有关。

比如建立在庞大的数据运算基础上，训练AI玩电子游戏往往就需要花费数十万美元；比如黑箱性，没有一个深度学习结构(卷积、RNN、LSTM、GAN 等)可以解释自己的决策，暗搓搓地搞歧视、骂人、发明新语种之类的事情层出不穷；再比如只会做“填空题”，面对需要引用常识、共识、推理等问题的时候就会表现的像个智障，容易被糊弄，比如将打印的人脸识别成真的，要么就是智商不及预期，医疗诊断、机器人、自动驾驶等始终进展缓慢……一贯反骨的马斯克，前不久就推出了基于计算机视觉感知的无人驾驶新方案。

总体来说，深度学习真正能成功做到的，还是在给定大量人为标注数据的情况下，实现两个空间事物之间的映射。距离人们预想中的AGI强人工智能真是“事倍功半”，极其遥远。

所以，著名的“唱衰AI”专家 Filip Piekniewski声称将“AI寒冬”的锅甩给了深度学习，虽然有些耸人听闻，也未尝不是指出了一个切实而严峻的问题——如果以深度学习为基础的AI应用不再继续提升，那么相关产业走到“穷途末路”（尤其是那些to VC项目），也是早晚的事~

DL不是终极算法，不妨继续沉迷游戏

既然都这样了，那还怎么做AI？理论上有两个角度：一是深度学习的自我进化，在原有的基础上引入新技术弥补一些先天不足；另一个则是寻找“备胎”，扶持AI领域的其他流派上位。

目前看来，科技企业也确实都极其渴盼变量出现，不过他们更青睐于做温和的“改良派”，毕竟“彻底推翻腐朽政权”还需要一个漫长的培养接班人的过程。

以谷歌Football Engine为例，就让智能体借助奖励机制来自己get动态策略，从而学会规则与踢球技能（强化学习）。

不过，要称之为“下一代AI”未免有点拔苗助长。

首先，“可玩性足球”（Gameplay Football）并没有完全摆脱深度学习的窠臼。系统根据对手的实力不同，提出了简单、终极、困难这三个版本的基准问题，其中简单级别的比赛应用单一机器算法，而困难级别则是由分布式深度学习算法来处理的。

而且，系统所采用的训练方式（即强化学习），与OpenAI Five在游戏Dota 2中击败了世界级电子竞技队OG，deepmind在《魔兽争霸》人机对战中获胜时所采用的训练方式，并没有本质上的区别，都是让智能体在复杂的即时战略游戏中学会与环境交互，并解决复杂的任务。

同时，作为机器学习的一个分支，强化学习之于AGI依然遥远。深度学习三巨头的Yann LeCun 和Hinton都认为，当前用来实现“人工智能效果”的技术，对实现（真正的）人工智能是行不通的。就像怎么优化马车的核心技术，也无法造出汽车一样。

更何况，类似的弥补深度学习不足的机器学习方法还有很多。

比如小样本学习、无监督学习就摆脱了对大规模数据集和人类专家监督的需求，提升自主训练效率；元学习解决了深度学习训练出的智能体技能单一、缺乏常识的问题。深度学习大神Hinton在2015年还提出了一个黑科技——知识蒸馏（Knowledge Distillation），通过迁移知识，借助训练好的大模型得到更加适合推理的小模型，从而提升深度学习在大规模计算集群上的训练表现。

总而言之，所谓的“下一代AI”，核心还是弥补深度学习在理解能力、多模态仿生、应用性价比等方面的不足。作为过渡型方案，这种“深度学习+”估计还会持续很长时间。不过距离真正实现AGI的预期，依然相去甚远。

追寻下一代AI，

或许要走向更宽广的技术海域

今日我们看到的大多数AI产品思路，都是以DL(Deep Learning) + GOFAI (Good Old Fashioned AI) 的模式建立起来的。也就是将深度学习与其他算法相结合，让“AI”走向千行万业。

不过也有不少科学家是彻底的“革命派”，想了不少帮助AI的新办法，其中或许也隐藏着破局的可行性。

比如Hinton就试图通过胶囊网络Capsule Networks来颠覆传统的深度学习算法，用神经元向量代替传统神经网络的单个神经元节点，让不同的神经元携带不同属性的信息传导到下一层运算，已经证明可以像人类的视觉系统一样，自动将学到的知识推广到不同的新场景中，这被认为是未来让AI被赋予常识推理的关键技术。

还有的专家坚持基于逻辑规则的符号系统能够实现AI推理，一些学者和创业公司就正在用Prolog(一种基于符号学的编程语言)开发新工具。理论上可以通过非常少的数据来进行训练，自己处理事实和概念，然后自动生成事实推论。

但总体而言，其他分支的AI流派想要撼动“深度学习2.0”的主流地位，仍然比较困难。除了产业端正在大举投入对深度学习及衍生技术的应用之外，美国国防高级研究计划局DARPA甚至筹备了一个名为“机器常识(Machine Common Sense)”的计划，旨在推进和分享模拟人类常识性推理的技术创意，总投资预计约为6000万美元。

作为标杆的深度学习及延伸技术，其商业化潜力，即使“靠山吃山”，也有数年的好光景可以期待。但必须承认，面对其自身的瓶颈，大众的肾上腺素与技术期待也开始回归正常值，甚至有点审美疲劳。技术专家们再不搞个大事件，热爱“AI鬼故事”的科技编辑们都要被逼秃头了……

值得探索的下一代产业AI方向会在哪里，恐怕与我们的现有认知都相去甚远。毕竟世界上每一次巨大的变革，总是开始于某一些被忽视的技术角落。除了继续挑战技术的穹顶，谷歌们似乎别无选择。

像FIFA一样踢球的AI，比打游戏更强吗？

相关推荐