科大讯飞和微信输入法 $科大讯飞(SZ002230)$ 今天正巧读了讯飞的历史公告,发现不少朋友都很...
今天正巧读了讯飞的历史公告,发现不少朋友都很关心这家企业。在此分享下自己公众号写的一篇对微信输入法的分析,供关注讯飞的朋友们参考。(如有兴趣,也欢迎关注本人公众号:时间的蛛丝马迹)
==========《未来的微信输入法的未来》-2021年2月22日=========
今天晚间读ARK的报告《ARK-invest bigideas 2021》,开篇提到深度学习的广泛应用,介绍了2020年全球语音交互指令达1000亿次,较2019年增长75%。
我想到贝索斯、王兴、谢家华等人在其创业中,都非常关注行业的核心数据,比如电商的增速,这样的数据代表了行业的发展方向,同时给予他们强大的信心。因此我基于语音交互指令的迅速增长,和友人Y君展开讨论,产生以下这篇文章。
2019年我使用科大讯飞的输入法产品——“讯飞输入法”,它提供了语音翻译的功能,当时翻译的准确度在85-90%,差之毫厘谬以千里,导致该功能可用性非常低。
2021年我换手机后再次安装“讯飞输入法”,惊讶的发现它的翻译准确度在92-95%水平,已经可以把我与朋友间的日常交流较为准确的翻译过来。产品的可用性、用户体验堪称10倍的改善。我惊讶于这种表现。
由于人的口语本身与打字输入的文本内容之间存在显著的距离(这种距离是想和说之间的差异,需要大脑的二次修饰),因此讯飞采取的方式是将语音内容上传至云端,通过数据处理(人为介入的自动化处理)将其翻译为人们想表达的正确内容。这样的一款输入法,悄然间已经从一款工具产品,升级为集语音AI、语义分析、大数据、云、深度学习为一体的智能产品。
那么,如果讯飞语记在此基础上继续改进呢?是否可能出现AI时代的升级产品,替代掉ios的备忘录、有道云笔记。额外说下,有道云笔记真是款垃圾产品,出现至今数年,仍然是一款在线txt。如果讯飞基于语音转译能力,改变交互的形式(从手工输入到语音输入),是否可能替代掉有道云笔记而成为移动、智能时代的产品呢?
2021年1月19号,微信创始人张小龙发表了题为《微信十年的产品思考》的演讲。在会中也提到了微信首次亮相的输入法。
张小龙透露,会经常受到投诉,说刚刚在微信里聊到什么,就在其他app里看到这个东西的广告,是不是微信在出卖我的聊天记录给广告主。
“其实并不会。我们从来不会去分析用户的聊天记录,即便因此损失了很多广告收入。”
他强调,微信输入法的目标不是一下子获取多少用户。因为输入法是文字表达的入口,并且输入法必然越来越智能,可能出现新的输入形态,所以还是值得投入去做的。
我在思考这样的讯飞输入法和微信之间的关系,以及为什么微信要做输入法:
此前的输入法,其功能运算主要在app内,虽然用户向网络世界的信息输入100%通过它,但产品自身几乎不沉淀有效数据,因此它长期扮演着工具的作用,企业也很难从输入法向其他产品发展过渡。搜狗的产品:输入法、搜索之间的巨大隔阂就是如此。
但倘若输入法成为语音交互的产品,用户向网络世界输入的内容,都是通过语音形式,经由输入法云处理转译后进入,这款工具类产品就开始大量沉淀数据,而这个沉淀数据的技术平台可以帮助企业实现横向的产品开发。以微信为例,我们可以说用户价值有一部分被输入法产品截流。如果考虑到讯飞输入法本身也有账号,这种用户价值的截取之大可能超乎想象。
我常说90后及此前的人,因为我们接触PC的时代(2000年-2010年),由于硬件功能的限制,向PC、网络输入信息,只能通过键盘,而没有语音输入的基础。所以我们习惯打字、文字。这类群体中的很多人对微信通话、语音、抖音视频存在着抗拒心理。
但观察00后,这样生于移动时代的用户,他们活跃在直播间、微信通话、视频里,因为从接触产品开始,他们就自然的使用视频、语音功能。同样,更晚入网的老年群体,我们的父母,他们习惯在微信群里语音、在抖音发视频,也是如此。他们没有精力打字,同时接触移动时代,是这一代人正式融入信息时代的开始。
那么我们思考当讯飞输入法的语音翻译功能以革命性的体验出现会带来哪些变化呢?以我本人为例,我相当多的和朋友的聊天,直接由它来语音输入,这种摆脱键盘打字的便利性,以至于我甚至提高了语音微信、微信通话的次数。
这是我理解为什么微信决心做微信输入法的最重要原因,因为它可能撼动微信的用户价值根基,同时它是属于下一个时代的产品。
如果微信做出这样的一款输入法,会带来哪些可能性?
由于微信聊天的场景中,内容是口语化的、交互为主的。可以发现,在这种场景下的产品训练、深度学习具备极高质量的爆炸式的训练环境。
siri、小爱音箱,这些产品已经出现5-6年,但进步缓慢,其中有一个非常大的原因是由于早期产品交互能力弱,无法与用户形成持续式对话,同时由于用户直接手动操作app更为直接高效,所以沦落为大量的输入本身就是指令式的,输入的指令量也增长缓慢,可以说siri、小爱始终没有在高质量的环境下训练。
而反观这样的微信输入法呢?借助其得天独厚的场景,可以百倍、千倍高效训练。我们是否可以展望微信能够凭借微信输入法,更早地进入到语音交互的世界?
那么微信如果推出一款微信音箱产品呢?你是否同意在家中,你对着它说请打给XX、给XX留言以下内容,这样的交互是更加自然的,是云时代的交互。反观当下,对siri说打给XX,仍然是指令式的发起一款20年前出现的通话功能,是多么的落后。
这真是非常美妙的畅想,人们都意识到云时代、语音交互、深度学习的重要性,但多数企业都在盲目的扑向未来风口,然而奇妙的是,只有当一款自然解决痛点的产品出现在那个地方时,人们才发现下一个时代是到来了,但不是当初认定的那个企业,就像互联网来了,电商、QQ活下来,但.com死了一堆。
相比起阿里、百度们僵化地推广天猫精灵、小度音箱,是否会发现腾讯悄无声息地切入到语音交互的时代里?
今天人们同样认识到智能汽车、自动驾驶的重要性,正如乔布斯所说,货车在50年后仍然存在,只是50年前只有货车,50年后道路上跑的都是轿车,货车只在乡村里。所有的智能手机厂商同样担忧,用户进入信息世界的入口,可能不再只有智能手机,还会在智能汽车里、在智能家居里。
但简单的扑向某个入口是很难成功的。正如当年阿里、亚马逊、facebook盲目的扑向智能手机、OS中,顶尖的企业在新兴技术面前也不见得能把握住机会,因为这些新兴行业本身空间巨大、存在极大的发展空间,所以需要极高、极长远的专注门槛。只有在其中专注于技术迭代、产品开发的企业,才能把握一二。
因此,今天苹果、小米也绝非轻易就能成功进入智能汽车市场,用一句绕口令来说,如果你想成为特斯拉,那你必须变成特斯拉。我强调的是企业内部、产品开发等各个层面的。
我更偏好张小龙式的看待新兴技术。微信在智能手机中的载体形式—【app】可能不再重要,但社交的服务、熟人社交的关系链、互动价值永远存在,如何利用好新兴技术,在下一个场景中顺利过渡,这本身就是极为困难的事情,需要敏锐的判断、专注的产品开发。
不能不说,张小龙真是产品与技术的天才,他能够敏锐的看出技术发展的趋势,同时又非常专注于微信自身的核心价值,基于这两者,在每个阶段他只专注于一款产品/一个功能的开发,他崇尚解决痛点的、有价值的产品,能够自然的增长,当产品证明其功能成功后再介入推广等手段。
以视频号为例,当初期抄袭抖音,只有推荐时,我几乎不怎么打开视频号。但晓龙一定深入思考过同样是视频流,微信和抖音的区别在哪?
抖音的每个用户都是独立的,而微信具备熟人的关系链。你可能拥有1000个微信好友,但微信最大的价值在于你高频社交范围内的10个好友的全部交互都发生在微信内。微信的价值不简单是通讯软件,而是好友的聊天内容、文件传输、朋友圈,而视频号的朋友推荐则是熟人兴趣/价值观的沉淀,这类视频在用户心中的权重是显著高于茫茫人海中作为一个独立用户被推荐的权重。而微信只通过一个朋友在看,看似非常简单的功能,就抓住了至为关键。这就是张晓龙厉害的地方。
以上,是我对微信团队正在开发的输入法的想法。