王小川,做AI不容易
新小萌很漂亮,端坐在直播台前播报两会新闻,她代表新华社。如果你看到她,会过目不忘。
她读起新闻声情并茂——除了“声”还有一点生硬和人工智能的感觉,其她看起来并无疏漏。
她其实是个AI,制造她的是搜狗。新小萌能声情并茂地读出句子,是因为运用了一套“AI合成系统”。
这系统极其复杂,不过令搜狗CEO王小川感到很自豪,用技术和新华社合作,这是实力的展现。
今年2月,在发布完2018年Q4财报后,王小川在公司的内部信中写道:日后将强化以语言为核心的AI技术的积累和探索,保持搜狗技术领先性的核心优势。
将未来交给AI,但也依旧维护当下各方面业绩。并且大环境的变化太快,搜狗努力想把人工智能的故事讲好,但并不那么容易。
1.
AI合成主播不是真人,也不是虚拟形象。
搜狗管这项技术叫“分身”。她模拟人类主播进行新闻播报。新小萌的原型是新华社主播屈萌。
在以前,所谓的AI主播只会用声音去念稿子。新的技术赋予新小萌对应声音的唇形和面部表情,在镜头前,她看起来和真人没什么区别。
这个看似简单的“技巧”,实际上突破了技术的屏障。
如果展开想象,新小萌可以是任何人,比如爱讲故事的奶奶,或在屏幕前为你讲述过去的某个逝者。技术可以惟妙惟肖地“复活”他们。
不过搜狗似乎想的更多。在一篇介绍性的文章中,搜狗认为分身技术还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域。
实际上,新小萌所携带的语言技术,并不是第一次“亮相”。在2017年第四届世界互联网大会上,搜狗就曾展示过类似的技术。
当时搜狗拿出的是唇语识别机器——面对摄像机时,系统可以通过分析唇部运动来“读取”听不到的语音,即只动嘴不出声,机器就知道你想表达的意思。
更早的时候,2016年世界互联网大会上,搜狗展示了同声传译,那时候搜狗还没有上市,但专注于完善语言处理技能已经成为其未来战略之一。
搜狗的掌门人王小川,曾在2017年世界互联网大会上对媒体说:“现在很多人认为,语音搜索已经足够方便了,但这还不够智能。”
眼下通过研发,搜狗的AI产品比当时智能很多,但玩转AI对搜狗来说依然是件吃力的事情。
2.
如果说新小萌是搜狗AI领域的答卷。能交出这张答卷,搜狗不容易。
前面横着百度,最前面是更难追赶的谷歌,中间还有无数垂直领域中专攻AI的小公司。
目前搜狗的策略是走“自然交互+知识计算”之路,这听起来很酷,但搜狗在研发方面的投入并不理想。
看看数据,在2015到2018年这四年间,搜狗的研发投入分别为1.31亿美元、1.38亿美元、7130万美元和2亿美元。
而百度仅在2016年就投入了15亿美元在研发上。
按照搜狗的策略,搜索+输入法又要涵盖AI,虽说其2018年的业绩还不错——去年全年财报显示,搜狗总营收首次突破10亿美元,达到11.2亿美元,同比增长24%。但一个问题是,在接下来的寒冬里保持旺盛的生命力,绝非容易的事情。
所以新小萌的出现就绝非是念念新闻稿而已。这位美女主播背后的技术被寄予厚望,搜狗希望在未来将AI语音合成这项技术个性化,比如上文提到的,为AI语音赋予各种形象和场景。
之前,搜狗用输入法、浏览器、搜索组成了“三级火箭模式”,让其自身流量在2018年出现了百分之四五十的增长,并摆脱了盈利上的尴尬。但这种增长能否持续很久并不好说。
因此,搜狗必须将发展战略延伸到应用场景更广的人工智能领域,但仍是以搜狗擅长的语言为核心。
这一点上,王小川曾说:“在AI领域,搜狗在技术和应用层面均取得丰厚成果,奠定了在语音、计算机视觉、机器翻译和问答等多个赛道上的领先地位。展望2019,我们会将AI技术与业务深度融合,持续提升核心竞争力。”
3.
2018年5月,王小川当了一把微商,在朋友圈售卖自家的AI产品。
产品叫搜狗录音翻译笔,通过小程序即可下单,马化腾在朋友圈表示“下了单买个支持下”,这则朋友圈下,张小龙还点了赞。而之前搜狗就卖过旅行翻译宝,加上录音翻译,这实际上是搜狗以语言为核心的AI战略落地。
在搜狗内部,对于语言硬件产品非常重视。就连王小川上许知远的节目《十三邀》,都让许在搜狗的总部亲自试了试AI翻译硬件。
除了说这位大明星CEO用心良苦,有评论也认为搜狗在寒冬中有非常强烈的求生欲。
但大形势并不是十分友好。虽然搜狗2018年全年财报中的数字很美丽,但同期发布的2018年Q4财报却暴露了其求生中的焦虑。
Q4财报上这样说,搜狗Q4营收成本为1.861亿美元,年同比增长39%,其中主要为流量获取成本,为1.499亿美元,年同比增长69%,占到总营收的50.3%。然而,2017年同期流量获取成本仅占总营收的32%。
对于搜狗来说,营收成本不断上升,运营利润无明显增长,AI业务也并没有长足的进步,研发投入又不如对手,搜狗的前路充满荆棘。
毕竟,在搜狗2018年上市的时候,招股书中曾写“我们的使命是让表达和获取信息变得简单。”可是目前看来,搜狗正在经历更为复杂的局面。
王小川当然是着急的。在今年新浪财经发起的拜年视频里,王小川在55秒内花了40秒给搜狗做了一次全方位的广告——这被看作是老板带队突围。
而AI合成主播亮相的时候,王小川也出面接受了腾讯科技的采访。那又是一个“打广告”式的问答,王小川淋漓尽致地介绍了自家的AI、搜狗号和其他业务后,记者问他:
当搜狗新开一项业务的时候,什么是取决于这个业务要不要开,最大的思考维度是什么?
王小川回答:第一个,我们知道未来趋势是什么,这个得知道,这是一个源头。但是第二个事情为什么是我们做,我们在做这事的时候,跟我们价值观也好,跟我们的能力也好,跟我们当前的状态也好,有什么样的关系。为什么是我,这个事情也是很严肃的事。这个事最好有全局的使命,如果这是在趋势里,在你的使命里,你会努力去做。