直播带货的敲锣打鼓声和4982亿的历史性战绩背后,是后疫情时代商家纷纷转战线上的新消费形态。以线上销售为主要模式的商品成为转型中的受益者,其中,就包括线上销量占总销量95%的智能音箱。2020年上半年,智能音箱的全球出货量已达到4576万台,中国市场的销量则达到了1908.6万台,同比增长22.7%。从市场规模上看,这个诞生于2014年11月的新秀[1],仅在2015~2019年期间,在中国市场的销量就由2万台增长至4589万台——划出了一条陡峭的弧线。
但另一方面,细看今日的销量增长和市场格局,并没有完全实现此前入局者的期待。2017年时,乐观派曾认为:语音将会是新时代的交互方式,而智能音箱也将会跑出一条如iPhone一样的商业模式和增长曲线。阿里巴巴集团副总裁,A.I.Labs前总经理陈丽娟曾在2018年告诉「甲子光年」,“智能音箱和iPhone的相似性在于它们都可以同时被视为过去产品的升级或一种全新的品类,而那些看到了机会的人,是理解了其‘新品类’本质的人。”这个“新品类”的本质,就是物联网的入口,智能音箱将成为各公司进入物联网场景的关键硬件。其中,有互联网科技巨头,如BAT、京东、小米;有大型科技公司,如华为、科大讯飞;有以内容生态见长的公司,如喜马拉雅、酷狗;也有成长期的科技公司,如思必驰、出门问问、Rokid……到2017年下半年,国内做智能音箱的企业已近50家。但在销量上,至少到现在为止,智能音箱并没有创造当年“智能手机”的爆发式增长。
在天猫精灵2019春季新品发布会上,天猫精灵公布了一组数据:截至2019年1月11日,天猫精灵累计销量突破1000万台,相比于2017年同比增长700%,重绘了10年前iPhone的增长奇迹。半年全球4576万的成绩虽然亮眼,但如果把今年6岁的智能音箱和同样诞生6年时的智能手机相比,后者在2013年上半年的全球销量已经达到4.5亿台,光苹果单品牌就卖出了8500万台;即使考虑到疫情的原因,这个差距也很显著。与同期的另一消费电子产品TWS(无线蓝牙耳机)相比,舆论热度在2016~2017年前后远高于TWS的智能音箱如今销量和声量都落在了后面:仅今年第一季度,全球TWS销量就突破了9620万台,比智能音箱半年的销量还多一倍。
同时,从市场份额来看,如今智能音箱已是科技大公司的寡头游戏,此前试图抓住这一机会的成长期公司几乎都已无功而返。据Strategy Analytics 的数据,2019年Q3,小度音箱、天猫精灵、小米小爱同学三巨头的总市场份额已超过了95%。2018年,中国智能音箱的全年销量达到2200万时,「甲子光年」曾分析这一市场的发展路径(详见《智能音箱2200万:是开始还是结束?》)[2],时隔两年,当智能音箱的销量来到4576万时,这一市场正同时经历着舆论热度回落,销量数据亮眼和市场格局初定,这正是一个回顾和展望的好时机:从2014年诞生,再到2016年中国玩家入局,一个被期待成为“未来物联网入口”的赛道到底跑出了一条怎样的成长轨迹?目前走到了哪里,又将去往何方?站在当前的时间点上回看,智能音箱市场的神奇之处在于,尽管发展路径和之前的预期有不吻合之处,但不妨碍其销量涨势喜人。与乐观派最初的预期相比,智能音箱的发展有三重“意外”,它们形塑了这个市场如今的格局。第一重意外是使用方式上的“错位”,或者说是消费者自己的再发明。回到2014年,亚马逊刚刚发明智能音箱新品类时,贝佐斯看到的机会并不是一个“智能化了的音箱”,而是一个面向智能家居场景的硬件入口。比这个硬件载体更重要的是躯壳里的ghost(灵魂),也就是“语音助手”软件。这背后的一个市场判断是:语音是人机交互最自然的方式之一,就像被触屏交互定义的智能手机成为了移动互联网的入口,语音也有潜力成为人与物与机器“万物互联”的物联网通用入口。Echo最初一段时间的销量也确实表现不俗:2016年4月初,上市17个月的初版Echo就已卖出了300万台[3]。在亚马逊官网上,3.5万人给这款智能音箱打出了平均4.5颗星的评分。但是,实际购买了智能音箱的消费者并没有完全按照产品设计者的设想来使用这款产品,尤其是其中关于智能音箱将成为家庭物联网入口的想象。据易观2019年对智能音箱使用情况的调研,在中国市场,听音频和音乐仍是智能音箱最常被使用的功能,而智能家居相关功能(语音控制智能家居设备)则排在第十名。2019易观对中国智能音箱行业深度发展分析中对用户使用功能的调研为什么在高频使用场景上,最终使用者和产品设计者之间会“缺少默契”?要真正把智能音箱当成智能家居的“中控”和入口,你首先得有控制的对象,所以只购买一台智能音箱远远不够,还需要有消费全套智能家居设备的意愿和能力。对租房一族来说,对整屋做智能改造的意愿不大;对有房一族来说,如果不是新装修的房屋,为了智能音箱把自家已有设备翻新的门槛也不低。此外,行业发展初期,智能音箱功能和语音技术并未成熟,而品牌商又急于开拓市场,这会拉低消费者的使用体验,智能变智障,摆在储藏室里吃灰就成了智能音箱的归宿。一位孩子不到两岁的父亲向「甲子光年」分享了自己的使用体验:“实际使用和最初购买目的完全不一致,总体感觉很鸡肋,而且每次喊‘小爱小爱’时都觉得自己很傻。”他家里已闲置了两台朋友送的智能音箱。其它新闻中也常见智能音箱的“槽点”:比如,在浙江广播电视台的民生新闻节目“1818黄金眼”中,爷爷给孙子买的教育机器人会算出“1+1=1”的神奇答案[4];在社交软件Twitter上,某用户发表了自己的智能音箱会在深夜里忽然发出诡异笑声的经历并引发热议[5];在对智能音箱的测评里,一些博主也发现电视的广告声可能会意外唤醒家里的智能音箱。
最后,品牌商为了达到更好的销量,也会紧跟新的使用方式,不断推出细分新品类,其中有些类型和最初设想的家庭物联网入口、智能家居中控的用途渐渐分叉。其实,初代智能音箱,亚马逊的Echo在2014年刚诞生时,一个相比“前辈”的创新就是将语音能力注入了无屏设备。这里的前辈是指从2011年起前装在iPhone里的Siri。相比Siri,Echo背后的语音助手Alexa的优势在于,它原生于一个以语音为最主要交互方式的产品,避免了给触屏交互做补充的尴尬位置。这种创新也确实反映在了用户活跃度上:根据Verto Analytics 2017年的一份报告,当年5月,Siri的用户同比减少了约4140万,流失了15%,而凭智能音箱杀进智能语音助手市场的新玩家Amazon Alexa的用户则从2016年的80万增长到了260万,增幅达325%。但在2017年,亚马逊却重新拥抱屏幕,推出Echo Show,打响了带屏智能音箱的第一枪。随后,这种尝试也蔓延至中国市场,2018年1月17日,腾讯云小微与数字家园共同打造了人工智能视频音箱腾讯亲见M10,售价2399元,高价位没能让腾讯赢得市场青睐,反而是两个月后,百度以599元推出首款带屏智能音箱小度在家,直接把带屏智能音箱带入了千元以下。据IDC报告显示,2019年第一季度,小度在家出货量达340万台,这个数字基本打平了百度2018年全年的智能音箱销量。较晚发力的百度,也因抓住了带屏的机会,在2019年第一季度反超其他对手,从2018年的市场排名第三站上了中国智能音箱出货量第一的宝座。此后,京东、阿里天猫精灵、小爱同学、Google等相继推出了带屏产品,最初以无屏定位“出道”的智能音箱,又回到了屏幕的战场。“带屏”刚好可以契合消费者的需求。小度团队工作人员告诉「甲子光年」,用户开始习惯于在这块屏幕上刷快手、看B站视频、获取在线教育内容,搭配了屏幕也就意味着具备了语音、触摸、视觉等多模态的交互能力。事实上,2017年1月,百度就曾联合提供智能家庭硬件和服务的小鱼在家发布了全球首款智能屏产品“分身鱼”——一款可通过语音操控的视频通话机器人。此外,结合自身已有服务和生态能力推出特色智能音箱也是各家的常见尝试:比如,天猫精灵就发布过“天猫精灵Queen”智能美妆镜,可完成美妆知识解答、肌肤检测、听音乐、控制家居设备等功能;百度的日本子公司PopIn则推出过带吸顶灯、投影仪功能的“PopIn Aladdin”;狗尾草科技则发布过养成类智能音箱“琥珀小姐姐”等跨界品种。当可以满足的功能变多时,智能音箱就如同哆啦A梦的口袋,总有一个功能可以让消费者掏钱。所以即使总有声音质疑智能音箱用途鸡肋,智能音箱市场却从没停止增长。除了具有成为物联网入口的潜力,亚马逊Echo问世后收获市场关注的原因还有其勾勒的商业模式,而商业模式也正是智能音箱尚未兑现的另一个预期。纪录片《亚马逊帝国》曾提到,Alexa能够在智能音箱市场上占据主导地位是因为它拥有最多的数据。“每次你问Alexa问题时,你都在改进它的算法。”美国研究机构未来今日研究所CEO Amy Webb说,当Alexa进入千家万户时,除了倾听以外,它也在学习。基于大数据的学习和进化能力,正是亚马逊最初设想的商业模式的基础:通过收集数据来改进语音和推荐算法,以提升用户体验,增加用户对智能音箱和亚马逊其他服务的粘性,并实现精准的广告推荐等增值服务。亚马逊也逐步发布了Echo Loop智能戒指、Echo look穿衣助手、Amazon Smart Oven智能烤箱等一些列产品,以让具备语音能力的智能设备多方位地融入人们的生活。Echo的消费者起初不知道的是,当Echo的蓝色灯亮起时,它就开始录音,以尽可能多地搜集语音数据。2019年,亚马逊也被CNN曝出在全球范围内雇佣了大量员工来聆听和转录录音[6]。目前,人们正努力解决大数据搜集与隐私安全之间的矛盾,相应的市场标准正在诞生:比如2019年,ISO和IEC紧跟时代,更新了云计算服务中保护个人隐私安全的协议ISO27018,市面上可见的主流智能音箱目前都已通过了该认证。但更严格的隐私保护也确实对实现部分从业者设想的“更多用户→更多数据→更智能的体验→更多广告、内容分发等服务收入”的闭环造成了阻碍。这种闭环是典型的“羊毛出在猪身上”的互联网广告模式,但在当前的物联网早期阶段,却面临用户基数小,隐私泄露隐患和用户体验不友好的多重挑战。在最初设计的理想商业模式落地遇阻的情况下,当前智能音箱市场也尚未探索出新的主流模式。天猫精灵产品及硬件研发总经理茹忆向「甲子光年」坦言,现在只是智能语音市场的开端,远未到最优商业模式显现的时刻,这就像互联网刚起步时,人们也很难想象今日Google、Facebook的商业模式。目前,天猫精灵在盈利上并没有明确的KPI,他们近期正在尝试向用户推荐阿里的其他服务,比如在蚂蚁森林绿色能量快成熟时,提醒支付宝用户去浇水。这是对智能音箱价值的一种探索:增强用户对阿里服务的整体粘性和使用活跃度。小米从2012年起就开始布局智能家居生态链,在智能音箱和语音交互出现后,他们的IoT战略进一步升级为AIoT战略——相比手机,可以用语音这种更简单的方式与其他设备交互的智能音箱盘活了小米的智能家居生态。2019年11月,小米推出了新战略“1+4+N硬件入口”,1是手机,4是电视、音箱、笔记本和路由器,N则是生态链中的众多产品。这也在小米第三季度财报中得到体现,与去年同期相比,拥有5件及以上连接了小米AIoT平台的设备的用户数已达560万,同比增长了59%;小米AIoT平台连接的设备总量也同比增长了35.8%至2.89亿台。财报发布第二天,雷军在小米企业公众号中提及:截止2020年6月,使用协同唤醒的总用户数已达94.4万。虽然怎么赚钱,还在摸索中,但是对百度、阿里、小米等巨头来说,一个共识是,智能语音及其重要载体智能音箱在打开物联网场景上,具有“钥匙”般的关键性作用。2017年底,天猫精灵和小爱同学都卖出了100万台,但不可否认的是,这个智能音箱的爆发点,实际上是促销的结果。2017年双十一,凭借促销价99元的天猫精灵拿下了100万台的销量;2018年米粉节上,小米商城也大力推广“仅需99的小爱音箱”。随后,阿里、百度、京东分别推出mini款智能音箱,价格被压低到69元。促销、平价在2018年下半年的智能音箱市场变得常态化,价位也基本稳定在89元。相对亲民的价格叠加新鲜感,又使智能音箱成为了热门礼品,荣登归乡伴手礼的优选榜单。在易观于2019年发布的《中国智能音箱行业深度发展分析》报告中,有74.8%的受访人曾把智能音箱作为礼物送给他人。这一定程度上解释了智能音箱近亿的年销量与部分群体对“周围没人用智能音箱”、“智能音箱用不起来”的感受之间的矛盾。也是因为烧钱,中国智能音箱市场迅速从2017年的“百箱大战”走向了如今三足鼎立的“寡头局面”。一些曾经推出过明星产品的成长期智能音箱公司已转移了炮火重点:曾在2017年推出智能音箱的出门问问,今天已将更多的精力转移到了耳机、车载语音服务和智能穿戴设备上;在2016~2018年期间陆续推出Rokid Alien、Rokid Pebble和Rokid Me三款智能音箱的Rokid也在2018年开始探索AR眼镜产品。或许早在天猫、百度、小米以百元级音箱杀入市场时,战场就已经没有给成长期公司留下太多可能性。最后,智能音箱今天面对的第三重“落差”是尚未实现的大C梦想——智能音箱并没有成为下一个智能手机那样的、实现了巨大销量的标配型消费电子产品。相比移动互联网,“物联网+5G”使可联网的设备类型和数量都大大提升,虽然在技术、软件环节的语音助手可能处于相对集中的市场,但落到终端硬件产品上,形态却非常分散——可以是智能音箱、智能台灯、智能电视、智能香薰、智能冰箱等多元品类,难以形成像手机一样的刚需产品和大一统江湖。而非刚需和多样化,再叠加价格战带来的低利润甚至负利润,使中国的智能音箱市场出现了一个现象:to C、to B双重布局。这里又有两种to B,一是在生产链上往上游走,在自己生产终端to C智能音箱的同时也向其他企业提供语音语义算法或模组。出门问问的AI开放平台上,就提供着可应用于可穿戴设备、车载、智能家居、机器人等不同场景的SDK(软件开发工具包)。Rokid也于2017年公布了自己的全栈语音解决方案,开始面向全行业进行技术开放。专注于物联网人工智能的云知声在招股书中披露,其智能音箱所在分类“智能语音交互产品”的收入占比从2017年的97%下滑到现在的28%,现在主要发力方向为智能物联解决方案和人工智能技术服务。其中,语音病例录入系统已在北京协和医院等近百家三甲医院中上线使用。其实,不少技术公司最开始切入智能音箱市场时就更侧重to B路线,比如科大讯飞和思必驰,它们就是天猫精灵、小米小爱同学的供应商,为这些产品提供了麦克风阵列、语音识别、语音合成、回声消噪和语音增强等技术方案。第二种to B则是把智能音箱批量卖给B端客户,比如渗透式覆盖酒店、医院、学校等。今年初,阿里内部就发生了一个关于智能音箱的组织和人事变动:原隶属于阿里巴巴创新业务事业群的天猫精灵业务升级为独立事业部,其汇报对象也从陈丽娟变为库伟,而库伟也同时分管着阿里云IoT事业部。这可能意味着主打家庭、生活IoT的天猫精灵部门将与主打to B的阿里云 IoT业务有更多协同。天猫精灵茹忆告诉「甲子光年」,他们正在和一些地产商合作,将语音能力“前置”地嵌入智能社区的整体方案中。比如,今年8月,阿里就联合地产商旭辉集团打造了“智慧人居”全新解决方案,以天猫精灵为智慧社区的服务终端,并整合了阿里云IoT的开放平台及云服务能力,为居民提供20多种智能生活场景。
在2019年12月的百度AI助盲行动中,小度人工智能音箱也入驻了盲人按摩院。美国西岸最大的健康科学中心西达赛奈医疗中心(Cedars-Sinai)则为100间病房安装了Echo音箱,它能够基于Alexa开发的医患语音助理平台Aiva,帮助患者控制窗帘、病床等设备,并与医护人员互动。从C到B,智能音箱虽暂未实现成为大C的梦想,但也在以条条大路通罗马的方式,保有着智能物联网的远方。半年,4576万,这个销量背后,可以是对多维需求的满足,可以是价格战促销的必然结果,可以是家庭对老人和小孩的关爱,也可以是B端批发的补充。在智能音箱的舆论热度逐渐回落的今天,行业新动向依然没断:两个月前的2020年9月30日,百度宣布旗下智能生活事业群组业务(小度科技)完成独立融资并估值200亿元人民币,这个估值也多少反映了市场对语音赛道份量的掂量。据小度团队工作人员告诉「甲子光年」,小度定义智能屏新品类,也将不断倡导“一屋一屏”的行业理念,并坚持发力于多场景渗透。天猫精灵则依托阿里生态优势,形成了许多联通阿里其他服务的独家能力,能够让用户通过AI来进行还花呗,在盒马上买菜,在饿了么上点餐等操作。同时,为实现嵌入/连接万物的能力,天猫精灵也在和多企业联合,拓展可连接的家居品牌。另外,不只是音箱品类,还发布车载版、超大屏版、美妆镜版等等,要变得“无处不在”。市场占有率第三的小米小爱同学则是小米从2012年起就开始布局的智能家居生态的有机部分,帮雷军讲圆了IoT的故事,把电视、路由器、台灯和近年小米新推出的扫地机、洗衣机、空调、冰箱等生态链上散落的珍珠串到了一起。面向未来,随着年轻人成长为家庭主力,生活家居也将面临更新换代,越来越多的智能家居将会成为新选择。天猫精灵产品及硬件研发总经理茹忆也告诉「甲子光年」,他们自己看到的市场反馈是,从2019年开始,将智能音箱作为智能家居控制设备的使用习惯在不断增长且使用粘性很高。根据阿里自己获得的数据,买过第1台智能家居设备的人就会买第2台,而买了第2台就很有可能会购买到第5台。“最难的部分是从0到1。”茹忆说。在仍在持续投入的公司眼中,它们更看重的是智能音箱背后,尚未证实、也未证伪的“未来物联网入口”。用更广阔的视角来看,智能音箱只是语音市场的冰山一角。在智能化的理想国里,以语音为核心能力之一的智能助手需要做到“听清、听懂、满足”,真正融入人的生活,消散于无形。那时,普通人可能对设备是“无感”的,它不再具有手机这样的明显形态,世界上的低头族们将能够再次抬头行走。这个时代最野心勃勃的想象,终将成为下一世代的平平无奇。
[1]2014年11月,亚马逊推出了一款全新概念的智能音箱:Echo,这款产品最大的亮点是将智能语音交互技术植入到传统音箱中,从而赋予了音箱人工智能的属性。
[2]2018年,「甲子光年」曾探究过智能音箱的发展路径,对智能音箱市场的Tipping point(引爆点)做出预测。当时的预测是,在iPhone第一代发售时,其主要市场是美国,其目标受众是几乎“everyone”,以美国的3亿人口来测算,这个“tipping point”需要达到4800万左右。
[3]数据来自市场研究机构Consumer Intelligence Research Partners。
[4]https://www.bilibili.com/video/av27873689/1818黄金眼-爷爷买了“二蛋” 孙子说是“傻蛋”?
[5]2018年,不少Echo用户表示自己的Echo会发出女性笑声,有的笑声没有缘故,有的笑声因发出指令而起。亚马逊官方解释称,Alexa语音助手可以从“宝宝咯咯笑”到“别有用心的坏笑”的音乐库中,按照用户的指令发出笑声,而Alexa错误地将环境噪音辨别为短语“Alexa,笑一个(Alexa,laugh)”,于是就有了在未做指令或做了其他指令的情况下出现怪笑声。
[6]https://edition.cnn.com/2019/04/11/tech/amazon-alexa-listening/index.html 2019年4月,CNN报道亚马逊雇佣了数以千计的全职员工来听取录音。