一家道系AI公司的非典型逻辑
AI创业到底怎么启动?这是个有趣的问题。
随着基于AI而崛起的创业公司越来越多。大家都开始有这样一个疑问:AI公司,是不是只能有一个模型?
一般来说,我们知道的AI公司,基本公式就是在语音、图像、芯片三者中选一条路、开发算法、打国际比赛获得名次、得到大量B端订单、成为独角兽。似乎芸芸AI莫不如此。
是否有可能,AI公司可以换一个发展逻辑?一点点织成不一样的发展轨迹呢?不久前,我在杭州探访了一家名为Rokid的AI公司。它在刚刚所说的“AI创业公式”面前,可谓一家绝对的另类。
不少朋友知道这家以“若琪”音箱而闻名的公司,而且往往是因为其产品的设计感非常出色。可是如果回到AI层面,我们却能发现这家公司在几个基本层面是“反常识”的。
比如说:
1、在音箱产品恨不得免费的时候,他们的音箱却并不便宜。
2、很少听说过一家AI创业公司,不仅做产品,做B端解决方案,甚至连芯片和OS都一起做的。
3、在AR眼镜一片萧条下,似乎以音箱为主的Rokid却做了AR眼镜。
究竟是这家公司故意搞噱头,还是确实有某种逻辑支撑起了这些“非典型”举动?在探访Rokid之后,我的感受是在大家都在热络讨论“佛系公司”的时候,Rokid的思考方式却是道系的。它在AI变局中立足的核心要义,是《庄子》所说的“外化而内不化”。
为什么这么说?我们需要从Rokid的诞生开始说起。
轻拥AI,于深度学习的晨曦
2014年,AI在中国还只是媒体偶尔会讨论的概念,在社交网络上出现,基本都来自科幻电影。
然而如果回溯整个AI发展史,却会发现这个时间节点,是深度学习技术真正爆发出力量的那个刹那。当时刚刚走出阿里,想要再次创业的Misa祝铭明,带领伙伴在杭州成立了Rokid。从创业伊始,Rokid的目标就定位于要做人机交互。
为什么确立这条赛道?同Misa一起创业、现任Rokid副总裁的向文杰回忆说,当时最主要的动力,是看到了深度学习的广阔想象力。
对于技术从业者来说,AI在当时虽然还是个冷门行业,但并不是一个全新议题。但在深度学习出现前,AI在理论到现实中的转化能力始终不尽如人意。然而随着深度学习技术体系的确认,并且在机器翻译、语音识别、语义理解等几个领域超乎预料的好用,Rokid的创始班底开始看到,AI这东西真的有明天。
然而以深度学习为代表的新一轮AI技术,最能改变的是什么呢?在Misa等人看来,无论是语言还是视觉,最根本被改变的必然是人机交互形态。这是AI的终局,也是Rokid的无限目标。
随后,Rokid尝试从语音交互为起点,逐步探索人机交互入口的硬件产品形态。回头看5年前,AI在当时的状态并不被市场看好。但是真正懂得的人,却会发现其终点是那么和光同尘。这大概就是道家所说“守无明”的状态,每一家长线发展的公司,都会有这样一段旅程。
音箱的锤炼与匠致
接下来,以人机交互为目标的Rokid在外界看来产品形态同样是做音箱。然而在推出第一款产品到今天的几年间,Rokid与大多数AI音箱公司,实质上已经走向了基础理念影响下的岔路。
虽然成立于2014年,但直到2016年他们才推出了第一款产品智能家居机器人Rokid Alien。这款能投屏、能摄像、能语音交互的机器人,虽然售价达到5000+,但在今天看来也依旧是非常新锐的产品方案。而后2017年,Rokid又推出了高端音箱Rokid Pebble,这款产品斩获了智能硬件和工业设计类的许多大奖,也是众多用户认识 Rokid的起点。
2018年,Rokid终于迎来了新品的“爆发期”,推出了Rokid Panda、Rokid Me、Rokid Mini三款语音交互产品。
(Rokid第一代智能音箱Alien)
然而即使是这一年的三款产品,数量也远低于其他AI音箱公司的发布频率。并且在AI音箱已经恨不得免费的时候,Rokid的新一代产品“Rokid Me”依旧售价达到了799元。而且与同行努力刷新品的战略不同,Rokid令人“大跌眼镜”地先后发布了AR眼镜、语音芯片和OS系统。
回到音箱的差异化上,Rokid的基础面貌是贵和少,这与业内同行的成本战、补贴战、新品数量战截然不同。这或许就是战略目标推演下来的行动分化——既然Rokid的目标是做人机交互,那么这一阶段他们的目标就不是最快速占领市场,而是要把语言交互做精致、做完整,让产品成为真正用户购买后时时想要触发的AI入口,而不是一个尝鲜期的摆设。
于是,Rokid做了完整的唤醒、交互与语义理解解决方案,首创了双音节唤醒词。并且在工业设计和产品工程能力上,与业界平均水准拉开了清晰的分界线——这是让音箱自证AI人机交互存在价值的阶段。
与此同时,精雕细琢的音箱产品,还为Rokid锻造了三个它证:
1、不断提升的机械设计和工程能力,为品牌输出B端解决方案建立了差异化优势。
2、语音交互体验的完整性和部署能力,让Rokid可以适配广阔的音箱解决方案需求。
3、在不同目标客户群中建立了市场口碑,为下一阶段开启人机交互升级与融合提供了基础。
至此,我们可以尝试回答第一个问题,虽然Rokid的硬件产品看起来是小众的,但是如果它走补贴和廉价路线,这三个根本能力也就荡然无存。
不急不徐地积累了产品,虽然挺慢但是没有浪费产业资源,并且逐渐完善了人才与技术生态。在高速变化的AI产业中,足够的积累,是能谈论下一步的底牌。
而下一步的高速发展窗口,对于Rokid来说,其实出现于B端市场。
B端市场的风与海
在语音硬件发展的历史上看,2018年可以看作一个关键节点。
对行业来说,经历了疯狂的“智障音箱”淘洗之后,市场还是转向接受高品质、高可用性的音箱产品。与此同时,随着AIoT概念的打开,不少厂商都意识到音箱产品作为家庭AI场景中枢、音频内容输出口,以及生活服务接驳点的价值。
所以虽然低成本音箱肆虐于2017,但到2018以后,音箱产品整体却未冷反热,良币开始呈现出更高的市场接受度。
借助这个节点,在自有硬件市场建立了基础的Rokid,开始建立和验证了一个2C2B的逻辑。这个逻辑的要点,用道家的理论说,叫做“难易相形”。由于Rokid已经在C端硬件领域建立起了足够“难”的技术与工程壁垒,此时打开B端解决方案市场就会顺势而为,从容停当。
于是我们看到,大量厂商开始选择Rokid作为自身音箱产品的合作伙伴,使用其解决方案来构筑自己的音箱产品。
比如说,在今年3月,360推出了自己的音箱产品。其背后从前期方案设计、定制开发,到量产期间的品质把控,Rokid都提供了全程的技术支持。Rokid不仅为其提供了双唤醒词的定制化功能,还为其定制了声纹识别功能,让家人拥有“声音密码”。
(Rokid成为360语音战略合作伙伴)
据了解,仅仅在2019 第一季度,Rokid 的语音技术已先后服务于涂鸦、荣事达、哈曼卡顿和 360 等多个厂商的音箱新品,TCL、创维小湃的电视和儿童故事机产品,其合作品牌已达到100家以上。
而在在音箱之战的下半场,另一个价值独特的B端市场来自三大运营商。由于运营商拥有流量、用户基数、内容等多种优势,并且家庭AI已经成为了运营商目前注意的进攻方向,因此其推出AI音箱的市场愿望也就在今天逐步清晰。
然而客观上来说,运营商在技术能力和AI人才储备上显然是较AI企业相对落后的。这种情况下,运营商的AI音箱需求,也就成为了AI语音交互供应商新的蓝海。
这也是Rokid抓住的一缕风。今年4月,Rokid 与联通沃音乐达成战略合作。联通沃音乐还发布了由 Rokid 提供全链路语音方案的新款智能音箱 A2。而此前中国移动已经推出了由Rokid提供语音解决方案的音箱产品“和家小荷”;去年,四川电信也与Rokid达成了深度合作。至此,三大运营商都选择了Rokid作为音箱产品解决方案提供商,这可是绝对的罕见。
究其原因,Rokid进入这一市场,所依赖的核心优势叫做“完整”。
(Rokid与联通沃音乐战略合作签约仪式)
这包括从软件到硬件层的布局完整,也包括从芯片到OS再到算法层的全栈部署完整性,还包括整个Home场景的完整性。就企业用户而言,Rokid一方面提供了最大的解决方案可选择性,另一方面也让用户可以最大限度解除AI门槛。从核心算法,到工程化能力,第三方接入体验,以及内容、技能、IoT接入的能力,Rokid提供了一个非常完整且高性价比的方案,企业用户不需要太多修改就打造更好的AI语音硬件。
非常复杂的企业市场,Rokid能够最大程度进行兼容的核心优势在哪里?其根本原因或许就在于其“慢”的C端技术能力积累,变成了“快”的B端能力升级。
这不仅是关于技术和能力的积累,也包括组织架构对B端市场的准备和适应。Rokid就进行了技术中台化,打造中重中台、小前端的架构。如此可以灵活适应B端市场的高定制化需求。从开始进入B端市场到现在,Rokid已经将产品整合周期从6个月缩短了3个月。
在B端市场进一步打开的情况下,Rokid也同时迎来了新的变化。芯片、OS、AR眼镜,这些绝对不像一家AI语音公司应该具备的产品,接二连三“生长”了出来。
从芯片到OS,顺势而为的创造与突破
B端市场的旺盛生长,以及Rokid站立其中的逻辑,也可以反过来回答另一个问题:为什么Rokid要做芯片这么重的东西?
原三星半导体(中国)研究所长、在2018年4月入职Rokid、出任副总裁负责基础平台相关业务的周军博士给我的答案,是在需要的时候,自然而然就选择去做了这些。
以Rokid推出的语音芯片KAMINO 18为例。在音箱产品中,国内高端音箱产品一般是使用通用CPU进行计算。但问题是CPU并不适应针对性的语音计算,容易造成大量算力浪费和高昂成本。而一些物联网芯片,却无法支撑复杂的语音交互,尤其是音箱+通话的需求。这种情况下,Rokid看到了需求和机会,于是在自身芯片人才团队的积累下,基于产业合作打造了自己的AI 芯片 KAMINO18。而其对B端市场的直接影响在于,给客户提供了更低功耗、低成本的芯片解决方案,完善了全栈能力。
(Rokid自研AI专用芯片KAMINO 18)
而YodaOS也是如此,由于AI语音软件在硬件上部署缺乏平台化接口,企业用户和开发者想要定义自己的语音交互解决方案十分不便。这个痛点的存在,让Rokid开发了YodaOS。这样B端合作者将可以更自由灵活定义自身的产品形态,而Rokid也收获了自己的开发生态基础。
做好人才与平台准备,随时发现需求与变化,积极进行回应,是Rokid做出这么多看似奇特产品的基本逻辑。而这样是思考方式也影响了其接下来的产品走向——视觉。
去年的发布会上,Rokid拿出了研发和投入已久的 AR眼镜产品Rokid Glass,这在今天的行业状况来说是很奇怪的。然而出于对人机交互的探索来思考,那么AR眼镜就处在接下来“自然而然”的产品地位。另一方面,虽然AR眼镜今天依旧处在初级阶段,然而其需要路径却是清晰的,当风口真正打开时,已经具备产品能力和技术优势的Rokid希望自己处在更有利的位置。
追寻基本常识,是我们看到Rokid拿出全栈产品的逻辑支撑。这个逻辑也挺“道家”的,所谓自然而然,应有则有。
道系AI公司的逻辑
向文杰认为,Rokid作为一家AI创业公司,最大的体会是要“站在终局,保持变化”。
站在终局的不动,与保持变化的随时动,这看似矛盾的概念,正好构成了Rokid很有道系味道的产业逻辑。
在他们看来,是AI将要改变人类的交互方式,其中蕴藏着巨大的机会,这是需要内不化的东西。而外部随时出现的技术变化、产业变化,则是一个如流水般的环境结构,必须实时外化。比如说运营商的音箱产品解决方案需求,这就是一个其实并不小但却是在激荡的产业效率里被突然挤压出来的市场机遇。
而只有内固外化,才能保持始终的方向和对产业需求的实时捕捉, 不断夯实看到的东西,见缝插针组织自己的技术壁垒和产业生态。
(Rokid Glass)
Rokid与AI独角兽和大公司的区别也在于此。大公司的团队庞大,捕捉一线实时机遇的效率某种程度上来说不如小公司,同时面临营收和市场的巨大压力,大公司和独角兽也很难保持对一件事的专注不动摇。
从Rokid背后,我们可以看到一个关于AI创业方案的辩论:一般意义上我们认识中的AI创业公司,都希望自己变成石头。在某一个算法、某一个行业快速完成卡位,然后不断拓展石头的边缘,堵在那里动也不动。然而在AI产业升级不断进行战略进化的时候,清晰的某一领域AI壁垒是很容易被大公司举起重资源冲破的。而Rokid则让我们看到了,AI创业可以不像一块石头,而是像水。核心的流向不变,不断在几个水域里勾勒自己的渠脉,最终它的产业价值将是弹性与自循环的。
是之谓,道法自然。