电话机器人是如何实现对话的?
机器是无法识别声音的,所以第一步是将用户的声音转换成文字,这一步需要依靠语音识别技术。语音识别本身就是一项复杂的技术,需要持续的投入。目前世界上好的只有几个:科大讯飞、谷歌、微软、阿里、百度、腾讯等等。因此,许多国内电话机器人厂商使用的语音识别技术大多是科大和阿里的。
此时用户所说的话已经通过语音识别转化为文字,机器拿到文字后,需要用自然语言理解来识别用户的意图,也就是理解用户在说什么。
这时机器已经识别了用户的意图,所以机器需要决定如何回复用户的问题。例如,我们应该继续遵循正常的对话过程,还是应该先回答用户的问题?还是需要重复刚才说的话?一句话:基于用户的意图,机器决定回复用户的内容。
此时机器已经知道回复用户的具体内容,此时是组织回复的语言。一般来说,这些话术是预先设置好的。当需要这段内容的时候,从这段内容对应的话术中抽取一个来回复就好了。
当然,当机器知道要回答哪个话术时,需要调用这个话术对应的录音。毕竟,我们在打电话。这个时候,为了让营销效果更好,大部分客户都会选择播放真人录音。毕竟效果比较逼真。正因为如此,人工录音的效果很大程度上决定了前端用户接电话时的体验。
赞 (0)