一种智能语音系统拒识方法、装置及计算机设备制造方法及图纸

技术编号:32740674 阅读:8 留言:0更新日期:2022-03-20 08:47
本发明专利技术公开了一种智能语音系统拒识方法、装置及计算机设备,该方法包括,获取待识别音频信息,对音频信心分别进行通用识别和应用领域专用识别;分别对通用识别的结果和应用领域专用的识别结果进行分析得到第一信心分和第二信心分;若第一信心分高于第一预设阈值,将通用识别结果输入到预设拒识模型来判断是否拒识;若不拒识,基于第一规则对第一拒识结果进行规则判断;基于规则判断的结果确定是否对音频信息拒识;和/或若第二信心分高于第二预设阈值,将应用领域专用识别结果输入到预设的拒识模型来判断是否拒识;若不拒识,基于第二规则对第二拒识结果进行规则判断;基于规则判断的结果确定是否对音频信息拒识。断的结果确定是否对音频信息拒识。断的结果确定是否对音频信息拒识。

【技术实现步骤摘要】
一种智能语音系统拒识方法、装置及计算机设备


[0001]本专利技术涉及语音识别
,具体涉及一种智能语音系统拒识方法、装置及计算机设备。

技术介绍

[0002]随着智能语音对话系统应用在越来越多的场景中,人们对交互体验的要求也越来越高,然而在使用智能语音系统处于连续对话的环境中时,常常会出现不是对智能语音系统发出的指令却被识别成某些指令的情况,进而触发智能语音系统做出一些不在预期范围内的动作。这种情况发生在一些特定的场景下时,甚至会造成较为严重的后果。例如,在车载语音系统中,对于误识指令执行动作,可能会危害车辆行驶安全等。因此,亟需一种更加准确的针对语音系统的拒识方案,以规避上述风险。

技术实现思路

[0003]因此,本专利技术要解决的技术问题在于克服现有智能语音系统中不能准确的区分连续对话中的语音是否是对智能语音系统发出的指令,从而导致智能语音系统发生错误识别的缺陷,从而提供一种智能语音系统拒识方法、装置及计算机设备。
[0004]根据第一方面,本专利技术实施例公开了一种智能语音系统拒识方法,该方法包括:获取待识别的音频信息,对所述音频信心分别进行通用识别和应用领域专用识别,得到所述音频信息的通用识别结果和应用领域专用识别结果;分别对所述通用识别结果和应用领域专用识别结果进行分析得到第一信心分和第二信心分;若所述第一信心分高于第一预设阈值,则将所述通用识别结果输入到预设的拒识模型得到第一拒识结果;基于所述第一拒识结果判断是否进行拒识;若不进行拒识,则基于第一规则对所述第一拒识结果进行规则判断;基于所述规则判断的结果确定是否对所述音频信息进行拒识;和/或若所述第二信心分高于第二预设阈值,则将所述应用领域专用识别结果输入到预设的拒识模型得到第二拒识结果;基于所述第二拒识结果判断是否进行拒识;若不进行拒识,则基于第二规则对所述第二拒识结果进行规则判断;基于所述规则判断的结果确定是否对所述音频信息进行拒识。
[0005]可选地,所述方法还包括:若基于所述规则判断的结果确定不对所述音频信息进行拒识,则执行若所诉第二信心分高于第二预设阈值,则将所述通用识别结果输入到预设的拒识模型得到第二拒识结果至基于所述规则判断的结果确定是否对所述音频信息进行拒识的步骤。
[0006]可选地,所述方法还包括:若基于所述规则判断的结果确定不对所述音频信息进行拒识,则执行若所述第一信心分高于第一预设阈值,则将所述应用领域专用识别结果输入到预设的拒识模型得到第一拒识结果至基于所述规则判断的结果确定是否对所述音频信息进行拒识的步骤。
[0007]可选地,所述对所述音频信心分别进行通用识别和应用领域专用识别,得到所述音频信息的通用识别结果和应用领域专用识别结果,包括:将所述音频信息输入到通用声
学模型,得到所述音频信息的通用声学概率;将所述音频信息输入到通用语言模型,得到所述音频信息的通用语言概率;基于解码器对所述通用声学概率和通用语言概率进行解码,得到所述通用识别结果;将所述音频信息输入到应用领域专用声学模型,得到所述音频信息的应用领域专用声学概率;将所述音频信息输入到应用领域专用语言模型,得到所述音频信息的应用领域专用语言概率;基于解码器对所述应用领域专用声学概率和应用领域专用语言概率进行解码,得到所述应用领域专用识别结果。
[0008]可选地,所述对所述音频信心分别进行通用识别和应用领域专用识别,得到所述音频信息的通用识别结果和应用领域专用识别结果,包括:将所述音频信息输入到通用声学模型,得到所述音频信息的通用声学概率;将所述音频信息输入到通用语言模型,得到所述音频信息的通用语言概率;基于解码器对所述通用声学概率和通用语言概率进行解码,得到所述通用识别结果;将所述音频信息输入到应用领域专用声学模型,得到所述音频信息的应用领域专用声学概率;将所述音频信息输入到应用领域专用语言模型,得到所述音频信息的应用领域专用语言概率;基于解码器对所述应用领域专用声学概率和应用领域专用语言概率进行解码,得到所述应用领域专用识别结果。
[0009]可选地,基于第一规则对所述第一拒识结果进行规则判断,基于所述规则判断的结果确定是否对所述音频信息进行拒识的过程,包括:将所述第一拒识结果进行语义分析得到相应的第一领域信息和第一意图信息;判断所述第一领域信息和第一意图信息是否匹配;若所述第一领域信息和第一意图信息匹配,则不需要拒识;否则需要拒识。
[0010]可选地,基于第二规则对所述第二拒识结果进行规则判断,基于所述规则判断的结果确定是否对所述音频信息进行拒识的过程,包括:将所述第二拒识结果进行语义分析得到相应的第二领域信息和第二意图信息;判断所述第二领域信息和第二意图信息是否匹配;若所述第二领域信息和第二意图信息匹配,则不需要拒识;否则需要拒识。
[0011]根据第二方面,本专利技术实施例还公开了一种智能语音系统拒识装置,包括:获取模块,用于获取待识别的音频信息,对所述音频信心分别进行通用识别和应用领域专用识别,得到所述音频信息的通用识别结果和应用领域专用识别结果;信心分评价模块,用于分别对所述通用识别结果和应用领域专用识别结果进行分析得到第一信心分和第二信心分;第一模型识别模块,用于若所述第一信心分高于第一预设阈值,则将所述通用识别结果输入到预设的拒识模型得到第一拒识结果;第一判断模块,用于基于所述第一拒识结果判断是否进行拒识;第一规则识别模块,用于若不进行拒识,则基于第一规则对所述第一拒识结果进行规则判断;第二判断模块,用于基于所述规则判断的结果确定是否对所述音频信息进行拒识;和/或第二模型识别模块,用于若所述第二信心分高于第二预设阈值,则将所述应用领域专用识别结果输入到预设的拒识模型得到第二拒识结果;第三判断模块,用于基于所述第二拒识结果判断是否进行拒识;第二规则识别模块,用于若不进行拒识,则基于第二规则对所述第二拒识结果进行规则判断;第四判断模块,用于基于所述规则判断的结果确定是否对所述音频信息进行拒识。
[0012]根据第三方面,本专利技术实施例还公开了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如第一方面或第一方面任一可选实施方式所述的智能语音系统拒识方法的步骤。
[0013]根据第四方面,本专利技术实施方式还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面任一可选实施方式所述的智能语音系统拒识方法的步骤。
[0014]本专利技术技术方案,具有如下优点:
[0015]本专利技术提供的智能语音系统拒识方法、装置及计算机设备,该方法包括:该方法包括,获取待识别音频信息,对音频信心分别进行通用识别和应用领域专用识别;分别对通用识别的结果和应用领域专用的识别结果进行分析得到第一信心分和第二信心分;若第一信心分高于第一预设阈值,将通用识别结果输入到预设拒识模型来判断是否拒识;若不拒识,基于第一规则对第一拒本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能语音系统拒识方法,其特征在于,包括:获取待识别的音频信息,对所述音频信心分别进行通用识别和应用领域专用识别,得到所述音频信息的通用识别结果和应用领域专用识别结果;分别对所述通用识别结果和应用领域专用识别结果进行分析得到第一信心分和第二信心分;若所述第一信心分高于第一预设阈值,则将所述通用识别结果输入到预设的拒识模型得到第一拒识结果;基于所述第一拒识结果判断是否进行拒识;若不进行拒识,则基于第一规则对所述第一拒识结果进行规则判断;基于所述规则判断的结果确定是否对所述音频信息进行拒识;和/或若所述第二信心分高于第二预设阈值,则将所述应用领域专用识别结果输入到预设的拒识模型得到第二拒识结果;基于所述第二拒识结果判断是否进行拒识;若不进行拒识,则基于第二规则对所述第二拒识结果进行规则判断;基于所述规则判断的结果确定是否对所述音频信息进行拒识。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若基于所述规则判断的结果确定不对所述音频信息进行拒识,则执行若所诉第二信心分高于第二预设阈值,则将所述通用识别结果输入到预设的拒识模型得到第二拒识结果至基于所述规则判断的结果确定是否对所述音频信息进行拒识的步骤。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:若基于所述规则判断的结果确定不对所述音频信息进行拒识,则执行若所述第一信心分高于第一预设阈值,则将所述应用领域专用识别结果输入到预设的拒识模型得到第一拒识结果至基于所述规则判断的结果确定是否对所述音频信息进行拒识的步骤。4.根据权利要求1所述的方法,其特征在于,所述对所述音频信心分别进行通用识别和应用领域专用识别,得到所述音频信息的通用识别结果和应用领域专用识别结果,包括:将所述音频信息输入到通用声学模型,得到所述音频信息的通用声学概率;将所述音频信息输入到通用语言模型,得到所述音频信息的通用语言概率;基于解码器对所述通用声学概率和通用语言概率进行解码,得到所述通用识别结果;将所述音频信息输入到应用领域专用声学模型,得到所述音频信息的应用领域专用声学概率;将所述音频信息输入到应用领域专用语言模型,得到所述音频信息的应用领域专用语言概率;基于解码器对所述应用领域专用声学概率和应用领域专用语言概率进行解码,得到所述应用领域专用识别结果。5.根据权利要求1所述的方法,其特征在于,所述通用识别结果和应用领域专用识别结果分别包括识别结果、解码代价分数以及音频帧数,其中,所述解码代价分数与对应的信心分成反比;所述通用识别结果和应用领域专用识别结果为所述音频信息识别出的语言字数,所述语言字数与所述音频信息的帧数长度的差值与信心分成反比;

【专利技术属性】
技术研发人员:刘紫月
申请(专利权)人:镁佳北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1