语音识别语义处理系统及其方法技术方案

技术编号:21435553 阅读:37 留言:0更新日期:2019-06-22 12:57
本发明专利技术提供一语音识别语义处理系统和语义处理方法。所述语音识别语义处理系统,适用于一电话机器人,包括一词袋模块,一语义向量转换模块,一语义类别库和一语义确定模块,其中所述语义向量转换模块根据所述语音识别语义处理系统所需词将一语音识别结果向量化,形成一语音识别结果向量化值,其中所述语义确定模块根据所述语音识别结果向量化值,确定所述语音识别结果在所述语义分类库中所述语义类别,形成一语义类别信息,以确定所述语音识别结果的语义,匹配一应答语音。

【技术实现步骤摘要】
语音识别语义处理系统及其方法
本专利技术涉及电话机器人领域,更详而言之地涉及一语音识别语义处理系统及其方法,用于处理电话机器人语音识别结果的谐音,避免错误的语义理解而播放错误的语音,提高电话机器人的智能性。
技术介绍
人工智能是目前新一轮产业变革的核心驱动力,正在对世界的经济、社会的进步和人类的生活产生极其深刻的影响。生活中,人工智能的运用无处不在,例如指纹识别、人脸识别、智能搜索引擎以及语音识别等等。电话机器人也是人工智能的一部分,近年来也越来越被相关企业关注,尤其是电话销售相关的企业。从事电话销售和电话客服的员工压力非常大,无法长时间保持工作热情,也会经常遭遇恶劣的对话,容易产生情绪波动,后期或丧失工作热情,陷入效率低下成本升高的恶性循环。对企业而言,招聘到从事电话销售和电话客服的员工很难,离职率也居高不下,同时市场竞争激烈,业务人数不够,客户难寻,如果采用人工筛选意向客户,时间利用率低,企业投入成本大,且工作效率随众多客观因素而下降,影响到企业销售业绩。所以用电话机器人代替人工从事电话销售和电话客服,可以大大减轻企业和员工的压力,可以做到24小时在线服务,并且无需顾虑恶劣对话对员工带来的影响。市场上,目前所有的电话机器人都采用关键字匹配技术实现对客户语音的语义理解。即将客户的语音通过语音识别成文字后,通过关键字匹配语音库里的语音,并将匹配到的语音播放以实现智能语音回复。但是中国语音语言博大精深,不仅有近义词,同样的意思有不同的表达方式,还有同音不同字,同样的发音却代表了不同的意思。而关键字匹配技术识别较为单一,很容易将语义理解错误,进而匹配了不对应、不合适的语音,导致电话机器人播放的语音并不是对客户语音的合适回答,客户体验感差,智能性不强。举例说明,“感兴趣”和“有兴趣”两个词都表示客户有意向,将这两个词作为关键字匹配所得的录音,是进一步对产品的介绍等(称为录音A)。但是如果客户说的是“不感兴趣”或者“没有兴趣”,表示的是客户并不想进一步了解产品。此时如果电话机器人采用关键字匹配技术,很有可能匹配错误,将“不感兴趣”或者“没有兴趣”的表达与录音A匹配,进而播放录音A,就是对语义理解错误。此外,由于同音字和近义词等谐音,语音识别技术所识别的结果发生错误的概率很大,这对后续语义理解也产生影响。例如客户语音所说的“zhaojingli”有可能会被识别为“找经理”也有可能会被识别为“赵经理”,而关键字匹配技术根据“找经理”和“赵经理”所匹配的录音不同,也就是语义理解会不同。又例如,“公司”和“铺子”是近义词,“地点”和“地方”是近义词,客户语音说的是“铺子的地点”,其想表达的语义意思与“公司地址”相同,而如果关键字匹配技术只是将“公司地址”设为关键字,就无法为“铺子的地点”这个语音匹配到说明具体位置的录音(称为录音B)。也就是说,尽管“铺子的地点”和“公司地址”在实际汉语中所表达的语义相同,逻辑上应该都是匹配录音B,但是对于关键字匹配技术,这两个是不同的两个语义,就有可能匹配不同的录音,“铺子的地点”无法匹配录音B,这并不是智能电话机器人智能性的体现。综上所述,现有的电话机器人无法对语音识别结果的谐音进行处理,且采用的关键字匹配技术有很大的出错率,导致语义理解产生偏差的可能性很大。所以,需要对电话机器人进行改进,提高电话机器人的合理性、逻辑性和智能性。
技术实现思路
本专利技术的一个目的在于提供一语音识别语义处理系统及其方法,其中所述语音识别语义处理系统对语音识别所得一语音识别结果中的同音字或近义词等谐音进行处理,以进行正确的语义理解,降低谐音误导语义理解的可能性。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中所述语音识别语义处理系统基于整体语境理解语音识别结果,并对其中的谐音进行纠正,从而进行正确的语义理解,以保障整体理解的准确性和整个对话的协调性。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中所述语音识别语义处理系统利用词袋模型对语音识别结果进行理解,相比现有技术的关键字匹配技术,可以纵观全局,考虑整体语境。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中所述语音识别语义处理系统利用词袋模型对语音识别结果进行理解,相比现有技术的关键字匹配技术,良好地规避了汉语中文本前后倒置的问题对语音理解的影响,提供识别准确率。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中所述语音识别语义处理系统提供一基础词袋和多个扩展词袋,其中所述扩展词袋是所述基础词袋中的词关联的近义词或同音词等谐音,以使得语义向量转化的过程中,基础词和其关联的扩展词向量化成等值,从而获得相同的语义理解,降低谐音误导语义理解的可能性。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中所述扩展词袋被设置于所述基础词袋内,基础词和其关联的扩展词被设置为“或”关系,从而使得语义向量转化的过程中,基础词和其关联的扩展词向量化成等值。并且,此时所述扩展词袋占用空间小,向量化所用时间较短,效率更高。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中所述扩展词袋是所述基础词袋中的各个基础词和其关联的扩展词的笛卡尔积,以使得语义向量转化的过程中,谐音也可以被正确地理解,从而保证整个对话的协调性。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中所述语音识别语义处理系统提供一语义类别库,用于存储一电话机器人所用领域的常用语和专业用于等话术分类,从而为一语义确定模块,根据语义向量化值确定语义所属分类,进而确定语义理解,匹配对应的回应录音。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中所述语音识别语义处理系统利用贝叶斯和逆文本频率指数,对向量化的语义进一步理解、分析和确定,加强对区别文档最有意义的词语的权重,使得语义理解更加准确和更具协调性。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中扩展词袋与所采用的语音识别技术出错范围相关联,避免盲目地添加扩展词,使得各个基础词和其关联的各个扩展词更具针对性,提高语义理解效率和正确率。本专利技术的另一个目的在于提供一语音识别语义处理系统及其方法,其中所述语音识别语义处理系统可以适用各种语音识别技术,对语音识别技术的并不限定,并可以针对不同的语音识别技术,设定对应的扩展词袋,适用范围更广,更灵活。为了实现以上至少一个目的,依本专利技术的一个方面,本专利技术进一步提供一适用于一语音识别语义处理系统,包括:一词袋模块,用于存储所述语音识别语义处理系统所需词;一语义向量转换模块,其中所述语义向量转换模块根据所述语音识别语义处理系统所需词将一语音识别结果向量化;一语义类别库,包括多个语义类别;以及一语义确定模块,其中所述语义确定模块根据所述语音识别结果的向量化值,确定所述语音识别结果在所述语义类别库中所述语义类别,形成一语义类别信息,以确定所述语音识别结果的语义,匹配一应答语音。根据本专利技术的一个实施例,所述词袋模型包括一基础词袋和至少一扩展词袋,其中所述基础词袋包括多个基础词,所述扩展词包括所述基础词袋包括一基础词谐音关联的至少一扩展词,其中所述语义向量转换模块根据所述基础词袋和所述扩展词袋,使扩展词和基础词向量化为相本文档来自技高网
...

【技术保护点】
1.一语音识别语义处理系统,其特征在于,包括:一词袋模块,用于存储所述语音识别语义处理系统所需词;一语义向量转换模块,其中所述语义向量转换模块根据所述语音识别语义处理系统所需词将一语音识别结果向量化,形成一语音识别结果向量化值;一语义类别库,包括多个语义类别;以及一语义确定模块,其中所述语义确定模块根据所述语音识别结果向量化值,确定所述语音识别结果在所述语义类别库中所属的所述语义类别,形成一语义类别信息,以确定所述语音识别结果的语义,匹配一应答语音。

【技术特征摘要】
1.一语音识别语义处理系统,其特征在于,包括:一词袋模块,用于存储所述语音识别语义处理系统所需词;一语义向量转换模块,其中所述语义向量转换模块根据所述语音识别语义处理系统所需词将一语音识别结果向量化,形成一语音识别结果向量化值;一语义类别库,包括多个语义类别;以及一语义确定模块,其中所述语义确定模块根据所述语音识别结果向量化值,确定所述语音识别结果在所述语义类别库中所属的所述语义类别,形成一语义类别信息,以确定所述语音识别结果的语义,匹配一应答语音。2.根据权利要求1所述的语音识别语义处理系统,其中所述词袋模块包括一基础词袋和至少一扩展词袋,其中所述基础词袋包括多个基础词,所述扩展词包括一所述基础词谐音关联的至少一扩展词,其中所述语义向量转换模块根据所述基础词袋和所述扩展词袋,使扩展词和基础词向量化为相同值。3.根据权利要求2所述的语音识别语义处理系统,其中所述扩展词袋对应地被设置于所述基础词袋内,其中基础词和其关联的扩展词被设置为或关系,从而使扩展词和基础词向量化为相同值。4.根据权利要求2所述的语音识别语义处理系统,其中所述词袋模块是所述基础词袋中的各个基础词和其关联的扩展词的笛卡尔积,从而使扩展词和基础词向量化为相同值。5.根据权利要求2所述的语音识别语义处理系统,其中所述扩展词袋与所述语音识别结果的出错范围相关联。6.根据权利要求1至5任一所述的语音识别语义处理系统,其中所述语义确定模块利用贝叶斯,根据所述语音识别结果的向量化值,确定所述语音识别结果在所述语义类别库中所属的所述语义类别,形成所述语义类别信息。7.根据权利要求1至5任一所述的语音识别语义处理系统,其中所述语义确定模块利用贝叶斯和逆文本频率指数,根据所述语音识别结果的向量化值,确定所述语音识别结果在所述语义类别库中所属的所述语义类别,形成所述语义类别信息。8.根据权利要求1至5任一所述的语音识别语义处理系统,其中所述语义类别库的语义类别对应于所述电话机器人应用领域和行业话术。9.根据权利要求1至5任一所述的语音识别语义处理系统,进一步包括一语音识别模块,其中所述语音识别模块将一客户语音识别成文字,形成所述语音识别结果。10.根据权利要求1至5任一...

【专利技术属性】
技术研发人员:沈悦袁晓茹李闯
申请(专利权)人:上海言通网络科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1