百度机器人实况解说NBA,背后用到了什么黑科技?

2016年,互联网巨头都在秀人工智能的肌肉。继Google AlphaGo下棋赢得人类之后,今天百度又有一个人工智能应用曝光了:度秘实况解说NBA总决赛。据一位百度工程师朋友圈照片显示,在今天上午勇士对骑士的比赛中,度秘模拟人工解说员对比赛进行了实时讲解,同时提供新闻速递和经典回顾。除此之外,度秘还支持互动,能够回答关于比赛的各种问题,比如“库里得了多少分”。

这让我想到了不久之前在谷歌I/O大会上发布的Duo信息应用,这个应用使用了谷歌的人工智能技术,能智能回复信息,比如看到朋友发来的一张图片,它可以识别其中的物体,回复类似于“喔,这只小狗很可爱”这样的信息,还能根据信息内容推荐最适合的快捷回复词汇。度秘和谷歌Duo,都是基于人工智能的“聊天”应用,不同之处在于,度秘是面向NBA比赛的,智能化程度更高一些,它不只是识别某个句子,而是去理解整场比赛,像人一样进行专业解说。

度秘背后的原理是怎样的?据我观察,度秘暂时还未能做到直接看NBA视频来理解比赛,而是通过抓取各种相关的新闻资讯、网友聊天,来实现“实况解说”的,它能够回答用户问题,也是基于对文字的理解。可见,度秘背后最关键的技术,是自然语言处理技术,即NLP。

自然语言处理技术主要是语义理解,比语音识别更加复杂,背后需要以深度学习为基础的人工智能技术。自然语言处理技术是Siri等语音助手变得聪明好用的关键所在,用户说话习惯、断句方式、说话场景不同,背后往往有不同的意图,机器要理解并不容易。基于传统的规则算法是不可能穷举各种表达方式的,只有基于统计的深度学习才能不断提高语义理解的准确度。度秘的应用表明,自然语言处理技术不只是可以用来更好地理解用户的语言,还能更好地理解网络内容,并再次组织,形成以假乱真的“直播解说”。

百度的自然语言处理技术尤其是中文处理技术,经验还是比较丰富的。百度过去一直在做的就是解析用户自然语言形式的搜索请求,并在海量网络内容中寻求答案,而后者同样是自然语言形式。百度不断在尝试去理解人类的语言,以及不同的文字,另一个典型应用是百度翻译,它能够理解不同语言的文章,进行机器翻译,已经达到实用水平,获得国家科技进步二等奖。自然语言处理,一方面需要海量语料、词库的积累,为统计算法提供基础;另一方面,需要模拟神经网络的深度学习算法,这是一个被人类研究了几十年的技术,最近一年实现从量变到质变的突破,不论是AlphaGo还是度秘还是Siri,背后均是类似技术。

AlphaGo战胜人类之后,人工智能这一技术性概念,被全世界熟知,相关应用越来越多,谷歌Home、谷歌Duo、Amazon Alexa、Siri、度秘等等典型应用愈发被人们接受。不管是基于语音还是文字,这些应用的背后,均会用到一个关键技术“自然语言处理”,通过这个技术机器可以理解人类、与人类对话、还有学习世界上的文字去变得更聪明。

在今年百度联盟峰会上李彦宏的演讲主题是人工智能是“下一幕”,所展示的“智能识图”,需要机器去理解人类的问题;此前度秘还进入了上海KFC的一家餐厅,像服务员一样接收人类指令去订餐,这也用到了自然语言处理技术;之前传得很火的机器写稿,背后也是自然语言处理技术,将网络上的文字和数据再次组织起来,跟度秘做的事情很相似。

毫不夸张地说,没有自然语言处理,大部分人工智能应用形同虚设。

“度秘直播解说员”眼下还在内测,很可能会在今年奥运会期间对外开放,为大家解说不同的比赛。相对于传统解说员而言,度秘的解说在生动性上可能会有差距,著名的解说员如黄健翔、柯凡、杨毅们,都有自己的风格,引经据典、旁征博引,还有幽默之类的情感因素,机器短期内是做不到的。不过,机器的好处就是它不知疲倦,可为你解说每一场比赛,并且还能进行个性化定制,每个人都可拥有属于自己风格的解说员,解说员还可以随时回答你的问题。未来度秘与语音合成技术结合起来,就可以做林志玲版、范冰冰版或者你老婆版的比赛解说了,这会让比赛解说变得更加有趣。

除了解说比赛之外,度秘背后的自然语言处理技术,有着许多应用空间。这几年人工智能技术的发展实现了从量变到质变,相关应用将会成为实际,而不是停留在想象或概念阶段,具体来说,以下领域会因为自然语言处理技术的成熟而率先爆发:

1、家庭机器人:家庭机器人需要“能说、会听、会动”,会动就是能做饭倒茶拖地按摩,这一点,是机器人公司在做的事情;而“能说会听”就是人工智能的事情了,需要自然语言处理能力,在语音识别之后,去理解人类的命令,与人类对话。因此自然语言处理技术成熟之后,家庭机器人将会普及,尤其是陪聊类的,例如儿童、老人、单身男陪伴类的,你可以定制一个林志玲回家陪你聊天。

2、客服机器人:不论是电商系统的在线咨询,还是客服电话的在线咨询,现在的体验都很糟糕,主要是要排队等待,很多互联网公司的客服电话,能打进去算是中大奖了,但这些公司又不可能大幅扩张客服队伍,人力成本实在是太高了。有了人工智能的客服机器人,它就可以去理解用户的问题,文字、语音均可,并与用户进行对话,就像真人一样。这将大幅提升客服体验并节省人力成本。

3、助理式搜索:美国曾有一个“人工搜索”引擎,你提出一个问题,有专人去帮你找答案,需要付费。印度的justdial、中国移动12580以及中国电信114热线,同样是基于免费电话的搜索服务,背后有专员给你找答案。这样的搜索服务体验有好的地方,就是个性化的助理,可给你准确的答案或安排你的行程,不过使用成本太高,基于电话不够方便,又费时间又花钱,并未普及。现在自然语言技术成熟,其与搜索结合起来,就可给每个用户提供一个免费的私人搜索助理,基于文字或语音均可。

人工智能是一个很泛的概念,语音识别、图像识别、语义理解、自然语言处理、机器翻译诸多技术均可归为其中,自然语言处理技术则是人工智能普及的基础。在过去,它是人工智能普及最大的瓶颈,现在从谷歌、苹果和百度等公司的动作来看,这个瓶颈很快就被消除了。家庭机器人、客服机器人、助理式搜索、定制化解说,很快就会成为现实。

(0)

相关推荐