一种智能语音系统拒识方法、装置及计算机设备制造方法及图纸

技术编号：32740674 阅读：8 留言：0更新日期：2022-03-20 08:47

本发明专利技术公开了一种智能语音系统拒识方法、装置及计算机设备，该方法包括，获取待识别音频信息，对音频信心分别进行通用识别和应用领域专用识别；分别对通用识别的结果和应用领域专用的识别结果进行分析得到第一信心分和第二信心分；若第一信心分高于第一预设阈值，将通用识别结果输入到预设拒识模型来判断是否拒识；若不拒识，基于第一规则对第一拒识结果进行规则判断；基于规则判断的结果确定是否对音频信息拒识；和/或若第二信心分高于第二预设阈值，将应用领域专用识别结果输入到预设的拒识模型来判断是否拒识；若不拒识，基于第二规则对第二拒识结果进行规则判断；基于规则判断的结果确定是否对音频信息拒识。断的结果确定是否对音频信息拒识。断的结果确定是否对音频信息拒识。

全部详细技术资料下载

【技术实现步骤摘要】
一种智能语音系统拒识方法、装置及计算机设备

[0001]本专利技术涉及语音识别
，具体涉及一种智能语音系统拒识方法、装置及计算机设备。

技术介绍

[0002]随着智能语音对话系统应用在越来越多的场景中，人们对交互体验的要求也越来越高，然而在使用智能语音系统处于连续对话的环境中时，常常会出现不是对智能语音系统发出的指令却被识别成某些指令的情况，进而触发智能语音系统做出一些不在预期范围内的动作。这种情况发生在一些特定的场景下时，甚至会造成较为严重的后果。例如，在车载语音系统中，对于误识指令执行动作，可能会危害车辆行驶安全等。因此，亟需一种更加准确的针对语音系统的拒识方案，以规避上述风险。

技术实现思路

[0003]因此，本专利技术要解决的技术问题在于克服现有智能语音系统中不能准确的区分连续对话中的语音是否是对智能语音系统发出的指令，从而导致智能语音系统发生错误识别的缺陷，从而提供一种智能语音系统拒识方法、装置及计算机设备。
[0004]根据第一方面，本专利技术实施例公开了一种智能语音系统拒识方法，该方法包括：获取待识别的音频信息，对所述音频信心分别进行通用识别和应用领域专用识别，得到所述音频信息的通用识别结果和应用领域专用识别结果；分别对所述通用识别结果和应用领域专用识别结果进行分析得到第一信心分和第二信心分；若所述第一信心分高于第一预设阈值，则将所述通用识别结果输入到预设的拒识模型得到第一拒识结果；基于所述第一拒识结果判断是否进行拒识；若不进行拒识，则基于第一规则对所述第一拒识结果进行规则...

【技术保护点】

【技术特征摘要】
1.一种智能语音系统拒识方法，其特征在于，包括：获取待识别的音频信息，对所述音频信心分别进行通用识别和应用领域专用识别，得到所述音频信息的通用识别结果和应用领域专用识别结果；分别对所述通用识别结果和应用领域专用识别结果进行分析得到第一信心分和第二信心分；若所述第一信心分高于第一预设阈值，则将所述通用识别结果输入到预设的拒识模型得到第一拒识结果；基于所述第一拒识结果判断是否进行拒识；若不进行拒识，则基于第一规则对所述第一拒识结果进行规则判断；基于所述规则判断的结果确定是否对所述音频信息进行拒识；和/或若所述第二信心分高于第二预设阈值，则将所述应用领域专用识别结果输入到预设的拒识模型得到第二拒识结果；基于所述第二拒识结果判断是否进行拒识；若不进行拒识，则基于第二规则对所述第二拒识结果进行规则判断；基于所述规则判断的结果确定是否对所述音频信息进行拒识。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：若基于所述规则判断的结果确定不对所述音频信息进行拒识，则执行若所诉第二信心分高于第二预设阈值，则将所述通用识别结果输入到预设的拒识模型得到第二拒识结果至基于所述规则判断的结果确定是否对所述音频信息进行拒识的步骤。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：若基于所述规则判断的结果确定不对所述音频信息进行拒识，则执行若所述第一信心分高于第一预设阈值，则将所述应用领域专用识别结果输入到预设的拒识模型得到第一拒识结果至基于所述规则判断的结果确定是否对所述音频信息进行拒识的步骤。4.根据权利要求1所述的方法，其特征在于，所述对所述音频信心分别进行通用识别和应用领域专用识别，得到所述音频信息的通用识别结果和应用领域专用识别结果，包括：将所述音频信息输入到通用声学模型，得到所述音频信息的通用声学概率；将所述音频信息输入到通用语言模型，得到所述音频信息的通用语言概率；基于解码器对所述通用声学概率和通用语言概率进行解码，得到所述通用识别结果；将所述音频信息输入到应用领域专用声学模型，得到所述音频信息的应用领域专用声学概率；将所述音频信息输入到应用领域专用语言模型，得到所述音频信息的应用领域专用语言概率；基于解码器对所述应用领域专用声学概率和应用领域专用语言概率进行解码，得到所述应用领域专用识别结果。5.根据权利要求1所述的方法，其特征在于，所述通用识别结果和应用领域专用识别结果分别包括识别结果、解码代价分数以及音频帧数，其中，所述解码代价分数与对应的信心分成反比；所述通用识别结果和应用领域专用识别结果为所述音频信息识别出的语言字数，所述语言字数与所述音频信息的帧数长度的差值与信心分成反比；

【专利技术属性】
技术研发人员：刘紫月，
申请(专利权)人：镁佳北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人