天云大数据CEO雷涛:人类如何与机器共生?
现如今,人工智能时代到来,我们进入到一个信息过载的世界,面对越来越多的智能化机器,我们人类的角色也在发生着改变。在由中欧国际商学院和数据猿共同主办的“中欧微论坛”上,天云大数据CEO雷涛就以“人类如何与机器共生”为题发表了精彩演讲。
作者 | 雷涛
2017年2月16日,由数据猿、中欧商学院、腾讯直播共同举办的《中欧微论坛|数据猿·超声波》活动在中欧商学院北京校区圆满落幕。此次活动大咖云集,共吸引了600+人报名,并最终筛选出300+观众莅临现场,更有超过20000名观众收看了在线直播,开启了一场大数据、人工智能领域的头脑风暴,台上台下、线上线下共同畅想科技引领下的商业未来!
作为数据猿推出的主题为《大数据的2016,我的2016》2016—2017年度大型策划活动的一部分,在2016年底征稿期,活动就受到了100+大数据领域内知名企业的高度关注,收到了36位业内领袖的投稿,并入驻成为数据猿专栏专家。
以下是“天云大数据CEO雷涛”的精彩文字版演讲内容:
分享长度为4000字,建议阅读8分钟
今天我希望利用接下来的20分钟时间与大家讨论一个问题,就是“人类如何与机器共生”。我来自天云大数据,天云是一家提供分布式AI技术设施的大数据公司。在上这个舞台之前,我一直很难找到一个题材跟大家汇报,因为我们更多是在做底层的基础设施结构替代机器的工作,距离用分布式计算的方式来替代人类工作还很遥远。
当然还有一些小众的项目,比如原来高精尖的分析师都是靠人工解读每年大量的上市公告,大家知道股市繁荣的一塌糊涂,上市公司的公告每年也多达20多万份,对人类而言阅读起来是很困难的,所以我们用一个小的自然语言处理程序,替代了他们原本7个人为1小组的工作团队。但是他们并没有失业,他们更多还是从事了更高精尖的分析工作。
今天我要讨论的问题并不是机器将会替代哪些领域?而是机器既然存在,那它是用什么样的思维方式在做这件事情的?只有了解了它的思维方式之后,我们才能更好地驾驭它。
下面我将会围绕三个方面展开讨论:
第一点,AI时代到来,我们是拒绝还是拥抱。因为AI这个题目如今已经被泛滥得很厉害了,因此,当我们进入到这个世界的时候,我们有必要去了解它,而我们的决策又会因此发生什么变化?
第二点,我们怎么去看待AI,AI本质上在用什么样的方式帮我们提高智力和认知?
第三点,作为一线的行业从业者,我们在努力做什么?我们在改变什么?我们用什么样的途径在这场运动当中给大家做铺垫。
从BI到AI的变化
我们正在经历一场从BI到AI的变化。什么是BI呢?商业智能,在座的中欧同学相信在各自公司也都扮演着领导者的身份,你们每天要面临大量的信息做决策,这中间都存在商业智能的身影。事实上,商业智能系统不是一个新鲜的事物,已经运作了几十年了。
今天我们获取了一些什么样新的智力,这个智力跟以前的智力又存在怎样的变化呢?其实驾驭信息的能力我们人类一直都有,只不过去控制、提取、分析和做决策,这些都是少数人的专利,由高级的社会等级控制。印刷术的出现带来了一场工业革命的爆发,使信息得以扩散,进而到了无与伦比的程度。
很快进入到互联网和移动互联网时代,它们带来了一个巨大的信息生产和消费过程,在这场过程里头,我们驾驭信息的角度、方法完全变化了,原来我们是驾驭稀缺的信息资源,然后将其保护起来,刻在石头上,而现在我们陷入的是一个过载的世界,也就是以前讲的天上一天,人间一年。
我们曾做过调研,2013年1月份的所有中文版信息的阅览时长是一万零四百多年,所以任何一个分析师无法用有生之年去阅读完一个月的信息。在这过程当中,我们就开始思考我们的变化,并且与以前驾驭信息的角度相对比。这场变化引发了我们的思考,我们是不是还要继续像以前那样,也就是所谓的洞察。
面对大量的信息,我们人类一直认为自己是上帝,自己做主观决策,你把信息交给我,我来控制,然后进行判断,因此在这过程中衍生出了无数的大师和专家。那么经验和专家给我们的是什么呢,是一系列的报表。你能看到这个月的销售数字、销量等一系列的内容,然后依据这些数字做决策。
我们经常提到一个例子,啤酒和尿布。那么它是不是一个真实的决策呢?是把啤酒和尿布放在一起,所以提高了啤酒的销量?还是像我这样的人好不容易去一趟超市去买尿不湿,所以我一定要买罐啤酒。所以大家看到决策是见仁见智的,看到同样的信息,可能会得到不同的结论,当我们判断获得的结论正确与否的时候,这里面还存在很多执行方法的问题。
在这过程当中,经验所传导的一些简单规律性的价值是不是有效?这些事实是不是真正能够印证我们的主观假设?从洞察之中得到了主观的决策是不是正确等等。
事实上,AI也开始出现了一些变化,早期的AI也试图想找到一些规律,比如我们在信用卡里普遍使用的评分体系,到底是三千块钱额度还是三万块钱额度?但是我们越来越不再依赖于简单地表达事物,而是依赖于复杂性,依赖于数字的表达方式。
比如在座有很多美女,大家都用淘宝,事实上在你每次购物选择的时候,你身上基于你之前的购物点击流以及跟你类似的人群相应的选择,这些选择将被构建在一个很好的知识体系里面,其他人的点击将决定你这次的购物选择,没有任何一个淘宝小号或者是专家在后面替你进行BI的决策。这时候AI就开始出现了。
大家可以看到刚才的故事,数据没有面向人,也没有人对你的数据做决策,决策的过程是机器。所以我们开始出现了一个新的思考,到底数据是面向人还是面向机器的?我们对于机器而言,到底是一个参与者还是一个旁观者?或是一个设计者?
卓别林在生产线上重复机械地拧这个螺丝,他并不关注拧完螺丝之后,那个产品会在生产线的另一头做些什么。同样我们在做BI决策的时候,我们也看不到决策之后会产生什么样的结论。
但是AI不同,AI像一个上帝一样,我们在设计好一个精巧的算法引擎之前,先把它扔到生产线上,然后再去规划这个引擎本身的设计。甚至我们可以像三千年前的罗马竞技场一样,让两个深度学习的怪兽,自己彼此PK,得到一个结果。
所以这就是我们要回答的第一个问题,人类和机器的角色。因为AI的介入我们的角色提升了,我们不再是一个简单的参与者,在生产线上重复的工作者,我们更多地从事一些高精尖的工作。今天我们有经验、有能力去驾驭一个更高尖的方法,就是去设计这种决策。
我们怎么去看待AI?
第二个,我们怎么去看待AI?AI到底还原了什么?我们怎么去构建一个全新的认知体系?在这场认知体系之下,AI还原了我们对整个世界把握的复杂性的理解。
这里有一棵树,当人类看到这棵树的时候,更习惯于进行抽象思维,不管它是什么颜色的,有多少个枝杈等等,我理解的,这就是一棵树。但当机器看到这棵树时,会捕捉到它的所有细节,机器更容易表达的是复杂性。
这两者的区别是什么呢,现如今我们人类已经习惯于这种简单的思维,牛顿为我们抽象了这个世界,苹果为什么掉下来,潮汐为什么有涨落?它将其抽象成一个很简单的公式,用规律性的思路来回答我们身边参照系的问题。而机器则利用了其大量的计算能力和它特有的描述方法在刻画这个世界。
大家可能觉得这很枯燥,但请看一下上面这张图。俄罗斯的一个美女画家画了右边的这张图,大家觉得这张图很美,像自然界的花朵一样,但事实上它是完全由分形数学构成的图形,复杂也有它的美丽。
左边这个蒲公英视图,看起来也很美,但对于我们而言,它拥有巨大的商业价值,因为它是我们帮助一家保险公司做的如何获取客源的一张视图。它告诉我们如何在网络里面找到需要激励的达人,用谷歌6年前最出名的一个算法来做定价和驱动。可以看到,机器捕捉到了所有的细节,捕捉到了这些复杂网络的描述,所以它可以还原这个世界。
那么在这世界里头,我们现在还有哪些问题需要被还原?事实上大量的问题我们没办法抽象出来简单的规律,比如像我们现在大量使用的视觉计算,我们怎么才能让图片去认知这是一只猫或者一只狗呢?我们所描述的图片信息是很有限的,这些有限的元素是无法还原复杂的内容的。同样,我们怎样利用Alphgo把16万棋手的大局观、棋风都抽象描述出来,我们人类的语言是黔驴技穷的。
当我们在做银行内容的时候,比如像欺诈的事件,广东有一个村子存在许多极端性的犯罪,那么我们该怎样用信息去描述这些情况呢?没有这样的规则,如果说我们从地域歧视入手,但因为他的流动性非常强,我们无法实现。这时候如果利用机器学习去表达,将会是一件很容易的事情。
1640年笛卡尔贡献给牛顿一个非常好的基础,牛顿在他24岁的时候,就能够找到一个规律性的答案。而今天的深度学习无疑给了我们一个描述复杂世界的方法,用一套复杂的数学体系和分布式计算能力去应对,同时深度学习也给我们找到了一个认知地图和拼接地图的方法。用复杂应对复杂,人类有了新的方法获取更广泛的认知。
理解了这个,大家就知道AI可以作用在任何一个场合,AI不仅仅可以作用在聊天对话、无人驾驶,还可以作用到你的生产线上残次品的发现等等,所有的内容它都可以反馈。在金融科技领域,深度学习网络定义了金融欺诈特征;在公共安全领域,可以预测罪犯能否有效抓捕……
AI的民主化
当我们拥有了一个广泛应用的时候,就要看一个新的主题,AI民主化。《未来简史》向我们描述了一个很恐怖的未来,我们人类可能会面临一大批的无用阶层和少数的神人。这少数的神人是掌控AI算法的人,而大部分人变成了无用之人,因为它的决策交给了机器。
究竟是不是这个样子呢?就我个人经历而言,在2002年我经历了一个很类似的变化,就是移动互联网爆发之前,当时我们公司所服务的企业都是巨无霸的通信巨头,因为只有大型巨头才能开发出像贪吃蛇、俄罗斯方块这样的手机游戏。当时那个年代,我们使用的都是非智能机,只有用一些很复杂程序化的控制,才能让手机上出现这些游戏。
但是两年之内,一个四人小团队开发出了安卓系统,它屏蔽了底层的复杂性,屏蔽了你对硬件的驱动,使这个市场彻底打开了,使上百万的开发者在你的移动生态里使用你的移动开发能力,这就是安卓与IOS带来的区别。
今天我们面对的是三个诉求的变化,以及数据资源的爆发:
第一个我们的行为,我们的工作方式被数字化了,这样大量产生的信息,可穿戴式计算、物联网等等构成了一个核心的生产要素。
第二个是底层流动的深度学习这种算法本身已经非常开放,而且也被成熟地应用了。
第三个就是计算资源现在非常廉价。
但是怎么把三种要素联合在一起,做一个融合呢?AI最难的部分不是AI本身,是融合,融合生成一个新的平台,这是所有产业界里头大家所面临的同一个问题。
2016年4月份,谷歌发布了它的第一款AI平台,该平台让大家可以轻量地在平台上完成,以前只有高端的昂贵的实验室才能操作的工作。我们很多国内外的企业也加入到了这个平台上,这样做的目的是什么呢?就是推动AI的轻量化和民主化的工作。
世界上是不是真的有智人和所谓的神人存在?德奇有一个调查显示,98%的数据科学的成员已经被谷歌、Facebook、LinkedIn招走了。我们希望通过AI的平台化,民主化的运用,让移动互联网的发生重现在人工智能这一页。
活 动 预 告
本次活动其他演讲嘉宾:
中欧国际工商学院经济学与决策科学教授 方跃
京东万象总经理 杜宇甫
360大数据中心副总经理 傅志华
TalkingData首席布道师 鲍忠铁
商汤科技联合创始人 徐冰
注:以上所有内容由数据猿编辑整理并发布,更多内容请关注数据猿获取实时动态。
获取演讲嘉宾干货PPT请在公众号后台回复关键词“雷涛”即可。
后续数据猿将推出《中欧微论坛|数据猿·超声波》精剪版视频演讲,敬请各位期待!
— 活动宣传片欣赏 —