命令词识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：30434902 阅读：24 留言：0更新日期：2021-10-24 17:33

本发明专利技术提供一种命令词识别方法、装置、电子设备和存储介质，所述方法包括：提取待激活语音指令的声学特征；对声学特征进行解码，得到待激活语音指令的解码结果；解码结果包括待激活语音指令中候选命令词的得分和候选命令词的音节参数；基于待激活语音指令的信噪比，以及候选命令词的音节参数，确定候选命令词的激活阈值；若得分小于激活阈值，则确定候选命令词为待激活语音指令的命令词。本发明专利技术的激活阈值能够根据不同场景和不同音节参数动态调整，避免不同场景下携带的噪声以及不同音节参数影响命令词的识别，提高了命令词的召回率，同时避免使用复杂算法识别命令词，降低了计算难度，提高了识别效率。提高了识别效率。提高了识别效率。

全部详细技术资料下载

【技术实现步骤摘要】
命令词识别方法、装置、电子设备和存储介质

[0001]本专利技术涉及语音识别
，尤其涉及一种命令词识别方法、装置、电子设备和存储介质。

技术介绍

[0002]在传统的语音交互场景中，人们通过键盘、鼠标、触摸屏、按钮的方式实现人机交互，而语音作为人机交互最自然的方法，随着AI技术的进一步发展，语音命令词交互技术得到了广泛的应用。
[0003]目前语音命令词识别的交互方式主要有三种：一是通过按键触发命令词检出方法；二是通过语音唤醒触发命令词检出方法；三是非触发式命令词检出方法。然而，上述方法命令词的召回率较低，无法适用于不同的工业制造场景。

技术实现思路

[0004]本专利技术提供一种命令词识别方法、装置、电子设备和存储介质，用以解决现有技术中命令词的召回率较低的缺陷。
[0005]本专利技术提供一种命令词识别方法，包括：
[0006]提取待激活语音指令的声学特征；
[0007]对所述声学特征进行解码，得到所述待激活语音指令的解码结果；所述解码结果包括所述待激活语音指令中候选...

【技术保护点】

【技术特征摘要】
1.一种命令词识别方法，其特征在于，包括：提取待激活语音指令的声学特征；对所述声学特征进行解码，得到所述待激活语音指令的解码结果；所述解码结果包括所述待激活语音指令中候选命令词的得分和所述候选命令词的音节参数；基于所述待激活语音指令的信噪比，以及所述候选命令词的音节参数，确定所述候选命令词的激活阈值；若所述得分小于所述激活阈值，则确定所述候选命令词为所述待激活语音指令的命令词。2.根据权利要求1所述的命令词识别方法，其特征在于，所述对所述声学特征进行解码，得到所述待激活语音指令的解码结果，包括：基于图解码网络，对所述声学特征进行解码，得到所述待激活语音指令的解码结果；其中，所述图解码网络是基于样本命令词的声学特征及其对应的解码结果训练得到的。3.根据权利要求2所述的命令词识别方法，其特征在于，所述样本命令词的声学特征是对原始样本命令词的语音数据进行降噪处理后提取的。4.根据权利要求1至3任一项所述的命令词识别方法，其特征在于，所述基于所述待激活语音指令的信噪比，以及所述候选命令词的音节参数，确定所述候选命令词的激活阈值，包括：基于所述待激活语音指令的信噪比、所述候选命令词的音节参数以及所述候选命令词的激活阈值之间的映射关系，确定所述候选命令词的激活阈值。5.根据权利要求1至3任一项所述的命令词识别方法，其特征在于，所述提取待激活语音指令的声学特征，包括：获取待激活原始语音指令的语音数据；对所述原始语音指令的语音数...

【专利技术属性】
技术研发人员：王江，蒋华晨，奚少亨，
申请(专利权)人：盛景智能科技嘉兴有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人