原创|认知技术进展赋能客服体验再升级
解飞
科大讯飞副总裁、智能服务事业部总经理
点击视频观看精彩内容
分享主题
认知技术进展赋能客服体验再升级
内容摘要
今天我分享的主题有一些窄,叫“认知技术进展赋能客服体验的再升级”,这个图可能大家经常看到,一般来讲我们把人工智能应用分为三个阶段,第一个阶段叫运算智能,能存会算,肯定比人厉害,计算机的运算能力、存储能力一定比人强。第二个阶段是过去这三年、五年来AI应用非常普及、非常多的切入点,就是在感知智能领域,感知智能主要的应用方向就是让机器像人一样能听、会说,但是同业者都认为人工智能的巅峰在这里,我们也觉得认知智能是AI的高级阶段,认知能够让我们取得更大应用场景和更大应用价值的关键里程碑,但是可能被我们通用的认知技术进展没有那么快,我今天的分享主要在这两个方向给大家做一下我们这么多年在技术应用上的一些尝试,还有一些理解。
三百六十行行行出状元,这个图可能大家看过,这个图是剑桥两个博士后用两年多的时间研究很多行业调研出的一个数据,是未来对于AI可能会被替代的比例,第一个最高的,比例是99%,叫电话推销员,可能大家已经有所体会了,这虽然是2018年出的,我们今天听到的电话基本上AI或者是机器人的电话已经占了一半以上了,起码我们接的电话一半是机器人,而且惟妙惟肖,要对话超过两轮、三轮才能知道这是机器人。第二个打字员、速记员,可能有些专家、领导、同学们在不同的大会场合下已经能看到科大讯飞做了产品,在会议同屏的状态下能达到每分钟识别450个字,识别的准确率超过90%以上,比传统的速记人员正确率和速度高出不少,所以它未来能替代到98.5%,不知道剩下1.5%是怎么计算的。还有91%是我们客服,客服有91%被AI方式替代到,我们现在行业有1000多万的从业者,也就是说会有1000多万工作被AI的方式换掉。
这个过程不会像速记员那么的快速被直接替代,为什么?因为我们客服涉及到应用的场景、解决的问题比速记员来讲更没法做一个标准的定义,没法描述的那么清楚,所以可能未来一段时间内最适合的方案还是人机耦合的方式,也就是在服务之前,通过AI的方式把最简单的服务内容给过滤掉,在服务当中的时候通过AI的方式能够给予我们客服对它服务进行质量的检验、做质检、做服务支撑的工作,之后通过AI的方式做记录和总结,以及工单流程的处理,帮助客服去减少事后处理的工作,也是我们当前这个阶段走得必由之路。
这里我写了一下客服91%被替代,这是未来的长期目标,现在我们到底能怎么样呢?我列了几个服务的标杆企业,左边第一个是全牌照的某金融集团,这个数据可能要更新,其实现在基本上服务电话数量有100万通,大概能节约1100名坐席,AI上线前和上线后等待时间从68秒到20秒以内,最新应该是23-24秒,覆盖有2000多个业务,我们最早上线是2015年的10月份,那个可以支持1800多个业务,服务解决率在85%,现在有2800多个业务,服务解决率在89-91%之间,是一个持续运营的系统,今天没有展开讲关于AI和运营这块模块,我在以前的分享中特别强调,如果一个AI的系统没有一个非常好的运营体系支撑,那往往应用的价值很难得到体现,这也是为什么有时候我们看到过去几年,只有头部的企业投资非常大、数据非常多、人员非常大的一些机构它的AI机构能力应用得到一些体验,因为AI我们需要的资源可能也是一个比较高的基础数量。
第二个是某通信集团,应该讲这是最大的通信集团了,他们在客服版做集中化运营的专业公司之后,也集中建设了AI的平台,这个平台包括我刚才讲感知的能力,统一的中枢平台,也包括了质检和导航的产品平台,不含业务的,质检导航业务的规则由各个省份公司在上面进行建设的,这样一个IT的系统也是极大提升了效能,他们比前面还要大,他最大一个省每日最大单日并发同行有100万通。
另外一个就是保险电信公司,我们知道电信公司建设不是以集团统建的模式,当然最近也在论证这样的方案,基本每个省独立坚守的方案,我们在其中一个省的标杆项目达到人工分流,现在可以看到,如果有数据支撑最高的标准是到39%左右,他们总共是600多坐席,现在大概比他们前年上线之前的峰值少了200多个。
还有一个政务热线,这是我们最近的探索,我刚才讲我们传统做大的呼叫中心的项目需要有非常大量的数据、有非常强运营理念和支撑的团队,有一个可能像人讲有一定门槛的投资,包括运算能力、包括系统的开发能力,其实政务是一个规模体量比较起来比较小,最近几年增长量非常大,政务增长量在这个上面我们在去年和前年做了一些尝试,应该讲能力覆盖到人事这种常见的项目有1000多个业务类型的情况下,达到正确率在90%以上,大家能分流的政务能力比较少大概12-15%之间,确确实实可能政府的一些知识库的建设、一些流程的建设还是很难以通过AI的方式进行替代的。
这是过去我们做的几个标杆项目的应用情况,我们可以看到离90%的目标还差得很远,核心是什么呢?我觉得可能还是我们认知的方向没有完全达到像今天的人、像坐席这样的智能。我觉得有两个难点,一个难点是在感知技术的难点,感知技术难点在什么呢?如果是一次语音的交互,现在我们碰到第一个问题就是噪音,有些情况比如像我们客户是在开车、在大马路等复杂的场景,就会影响AI服务最基础识别的效果,还有语音合成,大家想语音合成这么逼近自然为什么会有一些影响,合成的自然度无论技术上怎么提升,它的情感很难赋予其中,对客户服务的体验也会有一些影响,也包括方言、多语言的混语,我们90后有二次元的语言,有中文和英文夹杂的语言,也有很多关于夹杂一些粤语中文的语言。
当然这些我觉得已经在逐渐头部行业应用中,我们找到这些应验,也有一些实现的路径解决它,另外还有更大的难点在认知上,认知里面我也列了几个常见的问题,第一个是多轮对话,现在很多知识库,构建是以FIQ的模式建的,知识之间的关系其实很难记录下来,我们在讲服务过程中一个问题解决需要20轮交互,对AI来讲没有一个更好的通用架构解决,还有统一的知识库,如果大家在运营里面做很长时间就会发现我们在一个客服中心,或者在一个企业里面,知识库可能是多个的,营销有知识库、客服有知识库,甚至在线上客服有知识库、语音有知识库,这些知识库的运维有很大的负担,我们很多认知觉得它的识别和技术的进展每次都还不错,真正放到生产场景下就不行了,客户的表述跟我们做学术上的研讨文字的描写是完全不一样的,我们生活的是极为复杂的环境。
这次AI核心底层的机制是通过数据驱动,我们不可能把客户所有的想法完全收集清楚,这是技术上很大的挑战和难题,还有人力协同、挖掘,这是给AI认知技术的应用。但是另外有一个技术有进展,我这里做了一个小样,我们IOT除手机终端之外很好的跟客户接触的渠道,这个虚拟主播、虚拟人物的技术可能会在未来得到一个很好的进展,我请人员播放一下。
这个技术结合的是一个虚拟形象,通过语言、通过模型去驱动它面部的表情和嘴的驱动,另外她是我同事,她本人懂一些英语,中文没问题,但是其他语言肯定不太懂,我们现在通过AI的方式驱动这个形象进行十几种语言的合成和播报,这个技术应该在未来有很大应用的潜力和精神。我们知道同业,某大型商业银行有大厂配合研究做数字人的方案,我觉得可能未来,如果说明年5G建设是主要的红利在基础硬件上面,可能到2021年我们终端的设备有比较大的发展,到2022年前后会有更多虚拟形象技术得到应用。
我今天讲的还是想分享一下关于认知技术和感知技术最新的进展和突破,感知上我们碰到一些问题,其实都有一些实现的路径去进行解决,关于刚才讲的我们会有一个混语的应用场景,它就能解决这个问题,我列了一个实例,这是我们昨天截了一个图,它可以免费下载,这里面我不切换任何语言模型我夹杂中文和英文,甚至非常长的句式,后台这个混语的模型可以自动把语言能够检测出来,这在原来其实是很难做到的,这里面我们其实就引入了多语种统一识别解码的设备,同时在语料加上混语的语料就可以实现,这个极大程度提升我们在应用场景中的应用成效。
在认知这个领域呢?今天想跟大家汇报是认知领域的应用,认知的进展对于呼叫中心、客户联络中心而言至关重要,我最近跟很多行业的专家做交流,大家非常认同我们作为客户服务中心的行业,在大家讲企业在AI应用的转型和变革之中,面对着非常大的机遇,这跟我两年前、三年前跟大家交流的时候感受非常不同,三四年前我们很多从业的精英其实都在从一个客户服务的方向转向营销的方向,觉得在客服的方向总是属于低附加值,好像是一个被替换的产业,为什么这两年,尤其是近一两年发生这样一个变化呢?
我觉得核心原因有三个,第一个核心原因其实就是整个呼叫中心最近过去几年积累企业里面最大的数据,很多企业在业务数据没有办法集中建设,呼叫中心的数据都是集中化的,现在AI的应用其实是对数据的需求,或者说是AI核心的应用,我觉得可能相对于应用场景而言,数据的价值应该等同于石油,可能就是产生的能源。第二个,其实呼叫中心我们掌握很多企业的入口,就是跟客户交互、企业交互的入口。第三个其实就是在我们客服中心里面积累很多数据、很多知识,企业第一个知识库往往在呼叫中心里面,在企业里面最懂整个企业所有知识后台、前台、中台、服务,有可能呼叫中心是把AI应用最深、最好的切入方向,我看今年我们已经有4个国有大行和商业银行把它客服中心改成远程银行,我觉得更应该运行手机银行是一个远程银行,将近有10个银行也把呼叫中心要向前面4个大行学习做成远程银行进行运营。
回到我们观念里面来,如何通过认知更高阶技术把知识盘活、数据盘活,和客户对接的界面、应用场景盘活,可能是我们在座行业者、从业者未来三五年内非常有挑战、也有兴趣的话题,认知技术存在一些困难当前,我来给大家汇报一下,我看看我们所看到的困难。
第一个就是现在的认知技术基本上都是在一个封闭环境下,我们科学家总是跟我们讲,他说我们希望由业务部门把问题定义清晰,我们说每次你只要能用准确的语言把一个问题定义清楚了,离我解决问题就完成了50%,但是我们在实际的业务场景中有办法把问题定义清楚吗?一个科学家像数学题一样可以把问题定义清晰,我相信这个业务系统的适应度、鲁棒性可能就特别差,现在就是科研上面、学术上面要求封闭环境下给出一个结果,是在我们实际环境中的多样性、开放环境下的一个矛盾。
第二个是模式识别和真正的理解,这个好理解,有朋友跟我说翻译机越来越厉害了,我们出国使用确实能听懂我们说的东西,我说你错了,我们第一代翻译机有300万的句对,通过这个训练模型,你在使用这个模型、使用这个服务的时候会从它最优先的策略算一个解播报出来,机器跟人的翻译不一样,我们很多翻译比专业八级翻译水平快,人是理解这句话用其他语言翻译出来,机器不是的,他像一个算术题,最优解是什么就说出来什么,你觉得它懂你的话,其实完全不懂,我们在市场上获得了比较好的反映,我们每天2000万翻译数据持续迭代翻译资源,所以你会感觉越来越准确,会越来越懂你,它并非是真正的理解。
我们并非在所有的场景下都会像翻译有这么好闭环的数据趋动让我们人工智能越来越懂你,刚才讲还是解决不了,因为模式识别的机制,我们解决不了对数据的依赖,举例子来讲,我们一个呼叫中心数据如果只有10万条的话,只能训练一个机械模型,可能要100万的数据才能训练出大家比较满意的数据,10的六次方的模型可以做出超过90%的正确率,但很多客户、很多业务、很多使用场景我们没有那么多数据。
最后是对噪音的敏感,这个噪音当然不是指我们现在讲会场的噪音,这个噪音对于我们把一些差异的数据,会影响数据应用的异常数据称为噪音数据,这些噪音数据通过一定的专家噪音区隔,很难通过机器的方式处理,这会导致你数据处理和使用也会带来很多的门槛。虽然这条路比较难走,但是科大讯飞一直做了很多的探索,过去十几年没有太多的成果,近两三年内我们看到随着数据的提升能够找到实现的路径。
我们2004年做了教育方向的产品,2010年我们在交互类、玩具类做了尝试,那时候比较简单,2012年我们正式在客服做了团队、研究,2014年推出翻译,2015年我们取得技术性的突破就是医疗获得重大的进展,我们通过机器人学习标准做内容,加上40万份开元和1000万份脱敏病例来训练机器人,也是在行业第一次通过国家医师资格考试,超过了97%的学生。在2016年、2015年机器帮助医生,在安徽帮助基层医生辅助看病,也极大降低误诊,我们在司法领域通过AI的方式帮助司法有很大冤假错案的规避,希望未来我们在每一个行业都会有一定的进展。
这是一个交互的体系,底层是数据基础,我们称为数据池,中层是算法,基于底层的技术会构建不同的工作结构、工作任务,上层其实是在应用的一些服务,当然在最顶层的话我们会面向不同的行业会构建认知的中台。最近几年我觉得可能有6个比较大的进展,我后面还会有一些举例,今天时间原因不能说了。
第一个从词短语、句子、篇章知识表达的方式能够建立多维的知识语言表示,我们以前知识图谱可能是描述本体跟本体之间的关系,现在通过多维的表达会让我们对于知识的理解和应用在各种场景下更加信手拈来,会更加的灵活。第二基于语义标签统一业务的表示,如果只有知识抽取来实体的标签,可能在业务场景用得时候也不够灵活,我们基于语音的业务标签,给业务员直接定义,干涉机器的结果这也是人机协同取得比较好的应用成效。中间这两个技术进展一个基于对话的、结构化和非结构化,结构化是指有文字、有标签、有比较明确的索引,非结构化包括图片、包括语音的,这些文档我们能够进行自动的挖掘,而且自动挖掘的成效能够达到50%左右的人标注的效果,等同于半年度数据的分析。
另外基于业务领域知识的积累和复用,过去几年我们做了大型的客服服务项目超过150个,这些经验的沉淀和复用其实是上万个投入和服务。还有基于语义理解的表述,这个大家对它非常认同,这是在语义表示取得非常好的效能,我们在此基础上加了注意力的机制做一些调整,还有基于业务知识图谱,业务知识图谱在知识图谱基础上加上事理图谱,我们本身没有业务流放里面,把事例加进去可以得到更大智能化的技术。
这是多维语义的表达的标签,左边举个例子,这里面第一层维度我们通过实体里面找到理财经营点和万里通的产品名称,这个比较简单,我们从语义抽取都能拿到,还有意图的视频,这是咨询和对话的意图,这是业务推理表达才能获得,否则很容易获得上面两个实体,下面的意图就比较困难,不作解释了,这是基于图谱的对话,这是知识图谱基础上加事例图谱和业务图谱,我把多意图复杂表述给走向知道。
这里也是,这里我介绍一下,通过人人对话中自动来做知识挖掘形成工单的表述是比较困难的,我们目前在有限的场景下,一个场景一个场景做下来,除了技术进展,产品我们也可以进行持续的应用和迭代,这是用的一些成效,后面讲为什么客服能向外延伸。我举了例子,在金融风控产品场景下,我们在一个商业银行应该是国有大行反洗钱场景中,反洗钱会设很多规则,这还属于保密的,可能有200-300个规则之间,传统通过人工规则的角度去做漏检率没那么高,但是检出率会非常高,往往需要检出一个反洗钱的信息规则给你70个、80个这需要人确认,要么检出率非常低漏检率很高,这样的话没法遏制坏账率的产生,我们学习了10万,历时3个月反洗钱的数据,这里有流水和明晰得出一个训练的平台,召回率有85%,提升至少50%,我写的是30%。
我最后讲一下,我基于董事长的话,AI的应用有一个必由之路,价值、语音识别转到认知的革命,只有认知获得突破,可以释放出来行业巨大的潜能,我们也在人机交互、知识管理、推理方面在我们科大讯飞集团会把这几个方向继续做研究和探索,我的分享就是这些。
最后有一个预测,三点,太长时间也看不清楚,第一是无监督、小样本的学习会取得突破,这上面我们投入了5年底层的研究,有一些机会在3年后可以获得突破,这样的话我们在领域知识特点达到使用,虽然不是开放的知识、开放的领域,3年之内达不到。第二个应该有50%以上的业务场景,应用认知技术超过100%的成效,投入成出比是2倍以上,这些AI应用真正驱动产业、驱动客户有机会获得更大的成长。最后一个首先三年内我们头部的客户服务的机构一定会建立一个中台的大脑,由中台的大脑驱动智能化的升级,这个不仅仅限于客户服务的基础上,在营销风控、运营管理、企业更多的获客、更多风险管理上面也有更多的利益。
点击