再玩天猫精灵CC10

电池升级,场景拓展

这次系统率先升级的主要是三款产品:天猫精灵CC10电池版、天猫精灵CC MINI和IN糖2智能像素屏音箱,我们首先入手的还是把玩过很多次的天猫精灵CC10电池版。比起之前的天猫精灵CC10,天猫精灵CC10电池版家庭智慧屏最大的提升便是植入了一块5000mAh超大电芯,可贵的是,整个体积没有丝毫变化,后仰式L形造型灵动稳重,也非常节省占地空间。电池的植入,让这款智能家居的交互入口不再惧怕停电的困扰,在全屋移动使用的特性也大大扩展了它的应用场景。作为家庭助手,它能够在从书房到卧室的过程中依旧实现全程控制,也可以在厨房或餐桌上成为主妇的最爱,不论何处都能满足全家人的交互所需,而且还具备一定的户外属性。比如在郊外远足或驾车旅行时,借助手机热点,天猫精灵依旧可以全天候地收看丰富的内容资源。而且其大电池的设计完全可以轻松满足数小时的影片观看。

解读多模态交互

在之前的CC10版本上,我们便能通过语音、触控等方式实现交互,如今搭载全新系统的CC10支持“唇动唤醒”、“挥手唤醒”等唤醒方式,而用户则不需再喊出“天猫精灵”的唤醒词便能与其进行直接交互,加上全领域应用的全双工自然对话技术,让人和机器的交流过程全面“拟人化”。

纵观近两年的智能音箱产品,交互方式依旧有限,基本停留在语音、触控之上,而且业界的研究步伐基本上停留在解决视觉、语音等单一模态的交互精准度问题上。形成这样的局面其实很好理解,在一个上升市场上,采用成熟方案便能挣到钱,似乎开发提升用户体验的新功能便不那么必要。但是,在用户体验上能够大胆突破的无一不是行业中的佼佼者——比如拿出iPhone的乔布斯。用过这么多的智能音箱之后,我经常会感受到智能音箱不够聪明。答案其实很简单:在当前的人工智能水准下,单方面提升单一模态的识别准确度并不那么有效,特别是机器学习需要过程,用户使用习惯千差万别的情况下。以语音交互为例,并不是机器的计算力不够,而是机器不知道何时该“听”,何时该“看”,导致无法接收到有效的信息,才会给出“笨拙”的决策和反馈。以往我们总是通过唤醒词来提示机器,这样的交互不仅机械化,而且经常出现我上述提及的尴尬状况。

在天猫精灵之上开启多模态“自然唤醒”的功能后,只需要盯着机器张嘴说话,天猫精灵会自动识别出用户的唇动、眼神朝向、表情动作等视觉信息,对照用户语音便能做出准确的反馈,而不需要唤醒词的帮助。虽然真实生活场景中,还会受到人脸距离、光线等因素的影响,但是它开创了人机交互“自然唤醒”的一个新的里程碑。升级到5.0的AliGenie系统,正是智慧家庭领域的破冰者。这是智能音箱(智慧屏)上首次将唇动、手势、语音语义等多种形态的交互信息融合在一起,通过机器的深度学习和多模态感知的方式来理解用户的交互意图,并及时给出反馈的创举。而这样的创新诞生于阿里旗下其实并不奇怪,“巨大投入+突破性思维”正是阿里巴巴一直以来在各个领域占据高点的基础。应用在天猫精灵CC10电池版上的AliGenie5.0系统,正是业内第一次把“多模态唤醒”从概念落地到了使用场景,也是业内首次应用在消费电子产品上。

唇动唤醒是什么黑科技

在理解了多模态唤醒概念后,我们再来看看天猫精灵CC10电池版所擅长的唇动唤醒功能。其实这个功能已经充分考虑到用户的使用场景,将识别范围分成了“近场、中场、远场”。在1米左右的距离下,适用于唇动识别;在1~1.5米的距离下,适于挥手唤醒,其实也就是模拟人们见面打招呼的形式,挥手即可说话;而在远距离下,还是采用传统的语音唤醒词“天猫精灵”。

还有一点非常有意思的是,用戶还要可以通过手势隔空操控CC10,比如上一个、下一个、暂停、播放、点赞、退出、静音等操作,比如对着机器比划“嘘”的手势,就可以马上让天猫精灵静音,是不是非常人性化!

天猫精灵的团队反馈中提及,融合嘴唇、语音的动态信息识别,在免唤醒的对话情景下,能够帮助机器过滤掉90%以上的环境背景干扰信息,多模态唇动唤醒的整体准确率可在实验场景下达到99%。在实际使用中,只要在光线充分的情况、周围噪声不太大的情况下(测试环境50~60dB的噪声),CC10几乎毫无误差的识别我的每一个语音命令,而以前使用过的智能音箱或多或少会有识别不准的情况。

令人意外的用户反馈

在收到植入了AliGenie5.0的CC10之后,我将其推荐给数位发烧用户。除了一位全职妈妈对其赞不绝口之外,她做设计师的先生也对天猫精灵给予了好评。他的意见是这种有亲和力、高度拟人化的交互产品非常适合手上经常不得空闲的他使用;而另一位理科直男更是询问我能否为公司的会议系统开发这样高效的交互产品,目前使用的会议系统价格不菲,而且交互识别率远远不如天猫精灵。

其实我的感受也与这几位朋友相同,天猫精灵的多模态交互其实远远不止于应用在家庭之中,在商用领域上也有着巨大的应用前景。

(0)

相关推荐