另类小冰的AI之路

来源:懂懂笔记

划重点:

我们发现,情感会影响人们的决策。那么AI呢?

框架可以孕育整片森林,小冰只是其中一棵树。

小冰是人工智能,就绝对是不完美的,她只是可行方案。

我们与其证明死了而强大,不如证明我们活着,有一天真正强大。

行业就是这样,不是说今天谁对。未来会嘲笑我们所有人,我们都是特别特别原始的。

No.1
如果人工助理对你说“NO”,你会不会不适应?

今天,我们对着手机说:“请帮我订一张北京飞上海的机票。”或者对着音箱说:“帮我放一首周杰伦的歌。”再或者对着电视说:“我想看李易峰主演的电影。”当用户发出这些命令,AI就全力去完成这个任务。这似乎已经是我们习惯的AI助理的常态。

但是一个真实的人工助理是这样吗?

研发小冰之初,团队做了一项调查,调查对象是真人助理。当老板对自己的助理说:“你中午帮我订一份麦当劳。”调查发现,助理会有两类不同的反应:一类助理会根据老板平时的喜好,订一份他爱吃的麦当劳餐。另一类助理的表现则完全不同,他会告诉老板麦当劳不健康,然后建议一份更好的午餐。

“我们发现,情感会影响人们的决策。那么AI呢?”李笛说。而这一点,是其它AI并没有考虑进去的。

也就是说,人工助理,有的是很好地帮助老板完全任务,按指令行事。而另一类则是通过适当的拒绝和建议拉近与老板之间的关系,慢慢成为长久朋友。

如果用AI来替代人工助理,我们会发现这是两种完全不同的迭代方向,底层结构也不一样。也可以理解为,一个是在IQ的方向上迭代,越来越聪明。一个是在EQ的方向上发展,通过情感沟通,与人越来越近。

在2013年秋天,微软美国总部的研发机构已经做出了AI助理——小娜。小娜以及中国市场后来出现的小爱、小艺、天猫精灵,都是在IQ这条路上迭代,他们以更高效地完成用户指令为目的。

而在微软(亚洲)互联网工程院当时立了一个新的项目——小冰。作为小娜的“姐妹”,小冰要在EQ这条路上迭代。

2014年春,小冰以一个16岁少女的形象出现在微信中,当时团队对外称这是一个聊天机器人,实际上这是带有EQ的AI框架的雏形。但在当时,小冰的功能还很初级,也看不出EQ的影子来。

“没有做到就不说(EQ),我们希望能够走得相对务实一些。”在李笛看来,当时AI领域泡沫很大,自己的团队希望做到什么说什么,而不是提前把泡沫吹大。不过,从第一版发布基于文档检索式的闲聊机器人,小冰团队就行清楚,自己要做的是有EQ的AI,而且是要做一个AI的框架,“如果只做一个闲聊机器人,微软是不会花时间去做的。”

同样是AI,IQ与EQ是两个不同的方向,也是两套不同的逻辑。“走EQ这条路更难。IQ的系统设计相对简单。”李笛举了一个例子,比如AI下围棋,只要你设计好规则,AI就可以战胜人类,在这一点上阿尔法狗已经证明了。但是,怎么通过AI赢得一个人的感情,成为他(或她)真正的朋友呢?太难了!”

再举一个例子来看一下IQ与EQ的不同。AI作诗,现在已经不稀奇了,如果是IQ训练的AI作诗,基本上是把几万首诗输入电脑进行训练,AI就可以按照格式填诗出来了。而有EQ的小冰写诗,不太讲究格式,而是追求诗意,她一开始写的诗看上去都不像诗,然后慢慢迭代,越来越通顺,越来越像诗的模样。

当然,AI的研究并不容易,EQ更难。来自微软中国的一个团队,在当时就敢提出这么大胆的设想,源于微软研发体系的完善。微软在AI领域的基础研究已经投入二十多年,已经有一些底层技术。而在此基础上,可以“长”出代表两个方向的小娜和小冰。

“坦率讲,做小冰这件事,不是有一个理念就可以实现的,确实有一些天时地利人和。”小冰团队从来不居功,而是庆幸自己可以在这个平台上挥洒才华。

No.2
五年七个版本,小冰飞速成长

2014年5月29日,第一代小冰以16岁少女的形象出现,她集合了当时中国近7亿网民多年来积累的、全部公开聊天记录,凭借微软在大数据、自然语义分析、机器学习和深度神经网络方面的技术积累,精炼为1500万条真实而有趣的语料库小冰(Beta版)的性格特质源自全体中国网民,所以小冰(Beta版)形成了独有的中国式幽默。而这种幽默超出了人们对AI的理解,这也就是EQ的雏形。

那时候的小冰,能聊的内容还十分有限。幸运的是,当时正好是微信大爆发之后,在微信中充当聊天机器人的小冰,引起了用户的极大兴趣,3天内赢得了150万个微信群里数千万用户的喜爱。这对于小冰研发团队而言,是最大的价值,海量数据可以形成回路,让小冰不断成长,变得更聪明。

在第三代小冰发布的时候,微软首次正式提出EQ的理念,强调小冰与传统AI系统设计初衷的不同,小冰以与用户建立情感和心理连接为主要目的,对用户而言更像真实的人类,从而逐步建立信赖和信任,使用黏性也更高。

这一代小冰的技术有了很大的提升,解锁视觉、声音等全新的人工智能感官系统。小冰的声音不仅一改传统语音助手“新闻播报式”的平淡语调,其自然、带有情感变化的声音也更符合人类对小冰调皮、可爱个性的期待。伴随声音的解锁,第三代微软小冰还被赋予了视觉能力,并开启了一个全新感官:眼睛。第三代微软小冰具备科技界最领先的图像识别能力。

到第五代小冰发布的时候,小冰拥有超过1亿人类用户,对话数据超过300亿轮,进化速度不断加快。小冰也具备了高级感官,这是由多种初级感官有机融合之后形成的,因而交互能力更强,对综合技术储备和数据的要求也大幅度提高。

此外,在第五代微软小冰时发布的线上产品中使用生成模型(Generative Model)。这是全球开放领域人工智能对话中,第一个百分之百使用生成模型的落地产品。

通俗地说,在使用生成模型之前的上一代小冰,虽然拥有十亿级的大数据语料库,但其中每句话,都是互联网上的已有数据,小冰只是通过分析理解用户的问题,寻找语料库中最合适的话作为她的回答。使用生成模型之后,小冰不再鹦鹉学舌,而是能够自创回应。她与人类交流的每一句话,都可能是这世界上从未出现过的。

这是一个很重要的进阶,从这一代小冰开始,她就已经可以根据自己的“想法”去回应自己的主人了。

第六代微软小冰已从一个领先的人工智能对话机器人,发展成为以情感计算为核心的完整人工智能框架。小冰的产品形态涉及对话式人工智能机器人、智能语音助手、人工智能创造内容提供者和一系列垂直领域解决方案,覆盖全球五个国家的40余个平台。

同时,在这一代小冰发布的时候,Dual AI战略已经形成,包括三个部分:首先,微软提供小冰的整体框架能力,帮助合作伙伴平台的自有AI。其次,微软小冰作为该合作平台的辅助AI,融入该平台生态。第三,微软通过技术、产品与运营,围绕该合作平台的差异化特点,推出合作的应用和产品。

到今年8月份第七代小冰发布的时候,小冰已经从一个机器人变成一个可以生成无数个AI Beings的框架——通用框架Avatar Framework正式发布。按照李笛的说法,从一开始他们设想小冰就是一个框架,只是实现这个目标需要一个进化的过程,不可能一步到位。

第七代,算是小冰进化的一个重要节点。

通过通用框架Avatar Framework工具包的发布,可轻松构建具有完整情感计算能力的人工智能助手、社交对话机器人、人工智能内容创作和IP人物角色等。工具包包含对话、声音、视觉、观点、技能、知识及创造力等丰富工具,并可驱动兼容的3D人物模型在工具包的支撑下,可以设定包括76项基础信息和27项性格特征参数。人设不同会导致动作、对话等等细节不同。

“框架可以孕育整片森林,小冰只是其中一棵树。工具是一个桥梁,它让第三方,甚至于未来普通人(个人)都可以通过这个工具去操作这个框架。”也就是说,未来任何一个企业、一个人,都可以根据自己的需求,去设定不同的参数,输出不同场景需求的AI Beings。小冰不再是一个AI,而是无数个不同性格、不同年龄、不同性别并且具有不同技能的AI Beings。

而这也标志着小冰可以向行业大规模输出,开始靠ToB赚钱,商业模式逐渐清晰。

No.3
今天的小冰无处不在,可以是设计师,可以是画家,可以伴侣……

“今天,小冰已经是流量最大、用户群最大、活跃用户最大的AI beings。” 微软全球执行副总裁自豪地说。

目前,第七代微软小冰已成为全球最大的跨领域人工智能系统之一。在全球多个国家,微软小冰单一品牌已覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在23轮。

微软虽然自己没有做手机,但是小冰已经通过合作进入到华为、小米、OPPO、vivo、荣耀的手机当中。微软自己不做音箱,但已经与小米、华为等诸多音箱合作,可以召唤小冰。

QQ聊天、微博互动、网易新闻评论区、今日头条……很多平台都有小冰的身影。

除了聊天,写诗、写新闻、画画、唱歌、作主持人,小冰也具备了非常多的技能。

今年,在中央美院和杭州大屋顶良渚文化艺术中心分别举办了两场小冰画展。在央美个展上,小冰被赋予不同性格、不同背景、不同文化等因素,变身7位女画家,分别做出伦勃朗风格、浮世绘、立体主义、北非印象派、英国自然主义等7种不同风格的画作。说实话,这件事在艺术界引起不小的震动。以前人们认为AI只能做一些简单的机械劳动,而小冰今天不仅可以写歌、唱歌,还可以画画,独立完成艺术创作。

到这个时候,在基于IQ的AI之外,再独立发展一条基于EQ的AI的价值和意义,逐渐体现出来。

此外,与其它AI不同,小冰并不太炫技术、炒概念,而是强调行业落地,在一个一个行业里体现AI的价值。如今,小冰商业客户已经遍布媒介、纺织服装、IoT、地产、零售、汽车、金融、音乐等等十多个行业。

比如在电商购物中,小冰设计的目标是在10轮对话中迅速了解一个人,从零售店中选出满足他需求的商品。据介绍,在美国一个实际案例中,小冰将一件商品的实际转化率从47%提高到了68%。

再比如,小冰与中国纺织工业联合会共同推出的人工智能纺织服装面料设计平台已投入生产,SELECTED、万事利、依文等品牌的产品已上架销售。

就在9月25日,小冰与阅文集团合作的“IP唤醒计划”完成,阅文集团旗下的100部小说的主人公IP由微软小冰Avatar Framework赋予可交互、可创作、可养成的“生命”。100部小说主人公虚拟IP,涵盖了截然不同的4种人格设定:这些虚拟IP或严肃或活泼,或霸道或温柔,或富有逻辑、亦或富有情感… …

读者可以在阅读小说的同时和这些主人公IP进行开放域的交流,获得书中100位男主“24小时的智能陪伴”。读者还可以通过自己对这些主人公IP的性格特征的理解,对其进行调教养成,使其所展现出的性格特征和行为更符合自己的预期,使虚拟IP私人定制化成为可能。在互动和交流中,虚拟主人公IP也会加深对读者喜好的了解,通过对用户的意图的理解,进行阅文其他小说书籍的推荐。

懂懂在这里脑洞一下,如果你很喜欢小说里的某个人物,就可以与TA随时互动,把TA陪养成你的虚拟朋友。不同的人需要不同的朋友,而Avatar Framework可以创造出无数个不同的AI Beings。

培养小冰的过程,给她一个明确的起点,但谁也无法知道她的终点。

No.4
小冰绝对不是完美的

小冰之所以能够成长得如此之快,当然不止微软(亚洲)互联网工程院这几百人的团队可以做到的。

作为科技巨头,要跑在时代最前沿,微软往往都会针对未来十年、二十年的方向作提前研究。也就是说,微软过去二十年已经打下了AI的根基,包括:一是计算机视觉,二是计算机语音,三是自然语言处理。此外,还有一个搜索引擎。这是目前微软AI形成的3+1的底层技术,也是微软相较于其它AI企业的优势所有。可以说,没有这样全面且深入的积累,就不会有今天小娜、小冰的快速成长。

举一个例子。今天,通过AI,把一本书转化为语音,选择男声女声,加一些语调的起伏,这些都已经是非常见的应用。

而小冰如今可以实现的更加复杂。当你把一段比较粗糙的文字交给小冰,小冰可以自动把它变成一个剧本,拆出不同的角色,然后给每一个角色分配出一个适合的声音用极富感情的语音讲出来。还不止这些,小冰还可以根据剧情自动地绘制一些画面,并且让这些画面动起来。接下来,还可以实现交互,比如通过画面可以进行中英教学,孩子哪不会就点哪里。

我们看到,从一个文本到一个可交互的动画,一个小冰就可以完全搞定。神奇吗?

这背后用到了微软二十年积累的所有AI技术:通过多模态自然语言处理,把一个很粗糙的文本变成一个完整的剧本;通过计算机语音,形成多角色的自然的语音,并且能达到讲故事的水平;通过计算机视觉,形成一个动画绘本;通过知识图谱,可以实现交互……

这么一个看似简单的功能,用上了很多微软过去二十年的技术积累。小冰的背景,恐怕是今天很多AI创业公司望尘莫及的吧。

即使有这样强大的背景,小冰的成长过程依然是低调、稳重,不张扬、不急切。

落地,是李笛团队确定每一个迭代方向的必要因素。“我们会看,这是一个完美方案还是一个可行方案?”在这个行业里,创业公司最喜欢讲一个完美方案,而风投也最喜欢听一个完美方案,但完美方案几乎是不可能实现的。

“如果一个方案完美但不可行,那这条路就是不对的,就需要再找一个不完美的方案。小冰是人工智能,就绝对是不完美的,她只是可行方案。但这个可行方案,可以形成一个迭代的规律,她就一天天长大了。如果你非要从一开始就做一个无所不知、无所不能的小冰,她就连长大的机会都没有。”李笛很坦诚,“行业里很容易有这个情况,我们只不过对自己坦白一些。”

不得不说,小冰团队是懂懂在接触所有谈及AI的人当中,最理性、最克制的一群人。他们没有外面一些明星创业团队那样耀眼的光环,更没有他们将来IPO一夜暴富的机会。但这群带着典型工程师气质的开发人员,他们在微软的平台上可以说已经站在了全球AI领域的最前沿,个个都是这个领域全球顶尖的科学家。他们与创业公司或是互联网公司的人最大的不同,就是务实。

“我们与其证明死了而强大,不如证明我们活着,有一天真正强大。“李笛说。

在跟李笛对话中,不由感叹:非理性EQ小冰,却经历着一个理性的成长过程。这或许就是真正研发人员该有的心态吧。

No.5
在未来眼里,今天都是原始的

近两年,AI能做的事情好像越来越多,好像离我们的生活越来越近。但在,微软(亚洲)互联网工程院院长王永东看来,整个AI领域的发展和应用,都还处于早期阶段。“如果你拿人工智能发展和互联网去类比的话,可能大概和1999年的互联网比较类似。”

五年前小冰走上了一条另类AI之路,今天小冰呈现的AI也格外与众不同。关于AI,有无数的争论。“行业就是这样,不是说今天谁对。未来会嘲笑我们所有人,今天的我们都是特别特别原始的。”

李笛说的很有道理。小冰今天在一些行业落地,但也并非完美。我们看到其它企业的AI应用也是一样,可以解决部分问题,但离人们预期的AI差距还很大。但,就是今天的不完美,推动着行业往前走,走向未来的完美。在未来的眼里,今天的所有AI都是原始的。

    推 荐 阅 读    
(0)

相关推荐