局部战争还是全面入侵?如何看待搜狗录音翻译笔?
科技产品的更新换代频率之快,差不多是每个人都能感受到的。但在极速迭代的硬件大潮中,有没有产品技术陷入停滞,仅仅依靠市场刚需维持增长速度的电子产品呢?其实仔细找找就会发现,这样的产品还非常多。比如说我们的媒体同行、商务人士和学生党的标配,走到哪都要带着的录音笔,就是这样一个例子。
我们能看到的是,中国市场的录音笔每年保持着百万台级别的销售量,但录音笔本身的功能更新却近乎空白,新产品仅仅依靠价格、待机时间、收音效果来保持增长。这种不用快跑也能生存的硬件市场之所以存在,是因为刚需直接催生了市场份额。录音笔产品虽然看似不大,但却是很多生活、工作、学习场景所中不可替代的工具。无论是记者采访、秘书整理会议纪要,还是学生完成学业工作,都无法用其他工具来代替录音笔。久而久之,就把这个重要但不起眼的市场变成了真空地带,以至于大家似乎都忘记了录音笔这东西也是能进行科技创新的——但AI并没有忘记它。
刚刚,搜狗推出了录音翻译笔,这款产品刚一面世就引来了巨大关注。其原因很容易理解,因为搜狗的录音翻译笔,在价格与其他录音笔持平甚至更低价的前提下,居然增加了速记、翻译、同传这些原本非常昂贵的新功能。知乎上有用户说,这简直直接推翻了购买传统录音笔的必要性,就连马化腾都在第一时间下单抢购了一台。
但在一个产品之外,我们似乎可以看到更多。录音笔仅仅是个小的硬件场景,或者说只是个开始。AI带来的机器翻译、语音识别等功能,会不会将在完成AI+录音笔后,进行模式复制,一个又一个地去推翻我们熟悉的场景,走入更智能的时代?
这么看来,搜狗录音翻译笔的背后,或许不仅是一场单一科技硬件的局部战争,更隐藏着一场山雨欲来的AI全面入侵。这就很有可以开脑洞的地方了…
推翻已有产品的全部价值,
才能创建新入口:录音笔的闪点狙击
在进行录音笔的推理前,我们不妨思考这样一个问题:今天大家还能看到带按键、连蓝牙的“智能音箱”吗?好像不太现实,即使路边摊扫码就送的音箱,如今也基本是语音交互的AI音箱了。从亚马逊推出Echo,到国内BAT、京东等公司争相进入音箱市场,再到华强北数千家工厂开工做AI音箱,短时间对话式交互、能够指挥智能家居、连接电商的音箱产品笼罩了整个中国。之所以会出现这种现象,是因为在AI带来的交互改变面前,传统蓝牙音箱已经失去了所有价值:价格不便宜、音质都一样、功能不及新音箱的十分之一。这种情况下,谁还会留恋此前的音箱产品呢?整个产业也瞬间抛弃了过去。
同样的颠覆故事,今天似乎开始在录音笔身上上演。我们知道,大多数录音笔的功能仅仅是录音和播放,稍微智能点的也就是加上上传到云端。这功能确实寡淡,但也无法被手机等硬件取代。不能取代,却不代表无法颠覆。假如新的硬件形态保留了原有硬件的价格和功能,又加入了全新的功能,岂不是马上“改朝换代”?尤其是在新功能足够重要的情况下。
比如说,同时具有速记、翻译和同传能力的录音笔。搜狗的录音翻译笔的价值就在于此。基于搜狗AI带来的语音识别、NLP和机器翻译能力,这款产品集成了速记、同传等十分重要,但录音笔无法实现的功能。
比如说,搜狗录音翻译笔支持同声传译 3 秒上屏显示。将录音翻译笔与手机连接,即可在手机端 APP 查看实时的语音识别结果与翻译结果,并可直接保存和分享录音及同传文件。
换句话说,在用录音笔收到一段英文之后,用户可以马上就得到三件东西:录音、这段录音的文字整理、这段录音的翻译结果。
如果时间倒回到不久之前,一名记者采访了位外国人。整个从整理文档到翻译内容需要多久呢?大约是一个通宵,而在搜狗录音翻译笔出现后,大约不需要时间。据了解,目前搜狗录音翻译笔支持中英与英中同传,语音识别准确率中文 97%,英文 95%。基于搜狗的神经网络机器翻译技术,同传翻译准确率达 90%,基本可以支持跨语种实时对话的需要。而其将录音转化成文字,最快可以支持400 字每分钟,也可以说是非常高效。人工同传和同传设备的价格之昂贵,是大家都知道的。商用的机器同传也只是企业们能用得起。而搜狗这次竟然推出了价格398元的完全面向普通消费者的录音笔。毫无疑问,用户在新购买一只录音笔的时候,已经不需要做什么选择了。要知道,录音笔从前仅仅提供的是一种工具,而在可以完成速记识别、录音翻译和同声传译功能之后,录音笔更多是在为用户提供此前必须依靠人力才能获得的服务。AI的奇妙之处或许正在于此。通过将经验和识别能力压缩成硬件能力,一场录音笔市场的闪点狙击就此完成。
但在录音笔战役之外,或许我们能看到这场战争还远远没有结束。
翻译是硬件的命门所在:
搜狗的区域战争
通过搜狗翻译录音笔的产品功能,我们会发现这样一个现象:可搭载在硬件上,快速准确的翻译能力成为了产品的一个价值驱动点。在全球化的今天,人们对跨语言表达和获取信息的需求也越来越高,产品的翻译能力会成为影响用户消费的重要因素。
而且,翻译能力是一个办公、社交、商务、旅行场景中会反复用到的能力,用户对翻译的需求往往是随时随地产生的。而传统的硬件系统中,因为受限于语音识别和机器翻译技术的准确率,加上硬件研发的不配套,我们很少能够在硬件上看到翻译、甚至同传这类的能力方案。但从搜狗此前推出的旅行翻译宝,再到如今的搜狗翻译录音笔,我们可以看到搜狗的“翻译+硬件”正在形成一个赋能公式,一个个打开垂直硬件生态的新商业空间。在世界化飞快演进的今天,对泛在化翻译的渴求很快会变成科技产品的命门。从搜狗的硬件思路中,我们可以看到翻译能力成为了其硬件的枢纽和市场通行证,把底层的AI技术和尖部的硬件场景联系到一起,组成了完整可复制的硬件解决方案。再观察搜狗从文字翻译、对话翻译、图像翻译到首家实现同传在消费级产品上的落地,搜狗的翻译之路正越走越快。
或许有理由相信,接下来占据“翻译+”这个优势的搜狗,会进驻和颠覆更多硬件独立场景。完成从软件到硬件的区域战争,将AI技术落地带到更多战场上。而隐藏在“机器翻译方案+硬件生态”背后的,是搜狗AI技术壁垒的不断加固与转化。
作为能源的AI,
可能准备好了打一场世界大战
抽离到更高层级,我们可以看到硬件和软件的产品之上,是搜狗正在基于机器翻译、语音识别、NLP、知识图谱等世界领先的技术积累,源源不断构建垂直解决方案,将能力输送到一个又一个硬件和软件场景中。在这背后,是技术壁垒的红利持续发酵。
举例来说,搜狗语音输入日频次高达3.6亿次,其基于T级海量输入法文本数据使用神经网络进行建模,语音识别率高达97%,保持着目前的世界记录。而在机器翻译领域,搜狗在去年的AI顶级赛事WMT2017中获得了中英机器翻译冠军,并获得主要机器指标BLEU第一名。
对AI技术的持续探索和积累,尤其是基于语音与语言的AI技术体系,比如NLP、语音识别、机器翻译、词意分割等等,正在构成相互间紧密联系的AI技术引擎。更重要的是,在AI渗透到各垂直市场的档口,由于搜狗掌握了整个技术到产品的IP流程,不需要支付高昂的使用费用,这也让搜狗可以快速以消费级姿态切入各细分场景。以AI作为能源,调用多种能力组合创造新物种,可以看做这个时代的一场无限迭代。而搜狗已经开始了这场面向未来的探索。整个社会都在讲AI作为能源,而从录音笔从工具到服务的个案上可以看出,搜狗已经启动了AI作为能源的垂直场景进驻之旅。
下一个被颠覆的硬件是什么,或许才是我们今天应该感兴趣的话题。