语音识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：36183169 阅读：86 留言：0更新日期：2022-12-31 20:41

本发明专利技术提供一种语音识别方法、装置、电子设备和存储介质，方法包括：获取待识别语音；基于噪音编码模型，对待识别语音的声学特征进行噪音编码，得到待识别语音的噪音特征，噪音特征用于表征所述待识别语音所携带噪音的特征；基于语音识别模型，应用待识别语音的声学特征和噪音特征进行语音识别，得到待识别语音的语音识别结果；语音识别模型是基于第二样本语音的声学特征和噪音特征，以及第二样本语音的语音识别标签训练得到的。本发明专利技术提供的方法、装置、电子设备和存储介质，结合噪音特征和声学特征进行语音识别，提高了语音识别以及后续语音处理例如语音唤醒的抗噪能力。音处理例如语音唤醒的抗噪能力。音处理例如语音唤醒的抗噪能力。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、电子设备和存储介质

[0001]本专利技术涉及语音处理
，尤其涉及一种语音识别方法、装置、电子设备和存储介质。

技术介绍

[0002]语音唤醒是指用户通过说出唤醒词来唤醒电子设备，使电子设备进入到等待语音指令的状态或使电子设备直接执行预定语音指令。
[0003]为了提高语音唤醒技术的抗噪性能，目前的方案是在干净的唤醒语音中加入噪音，以模拟噪音环境下的说话声，并将加噪后的唤醒语音作为语音唤醒模型训练所用的正例样本。
[0004]但是，由于正例样本中的噪音是人为加入的，与环境真实采集的唤醒语音存在区别，且程序化的加噪方式为唤醒语音带来的共性特征也容易被语音唤醒模型学习到，导致语音唤醒的抗噪效果受到限制。

技术实现思路

[0005]本专利技术提供一种语音识别方法、装置、电子设备和存储介质，用以解决现有技术中语音唤醒抗噪效果受限的缺陷。
[0006]本专利技术提供一种语音识别方法，包括：
[0007]获取待识别语音；
[0008]基于噪音编码模型，对所...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：获取待识别语音；基于噪音编码模型，对所述待识别语音的声学特征进行噪音编码，得到所述待识别语音的噪音特征，所述噪音特征用于表征所述待识别语音所携带噪音的特征；基于语音识别模型，应用所述待识别语音的声学特征和噪音特征进行语音识别，得到所述待识别语音的语音识别结果；所述语音识别模型是基于第二样本语音的声学特征和噪音特征，以及所述第二样本语音的语音识别标签训练得到的。2.根据权利要求1所述的语音识别方法，其特征在于，所述语音识别模型包括降噪特征提取层和分类层；所述基于语音识别模型，应用所述待识别语音的声学特征和噪音特征进行语音识别，得到所述待识别语音的语音识别结果，包括：基于所述降噪特征提取层，提取所述声学特征与所述噪音特征相区别的特征，得到降噪特征；基于所述分类层，应用所述降噪特征进行特征分类，得到所述语音识别结果。3.根据权利要求2所述的语音识别方法，其特征在于，所述降噪特征提取层包括特征转换层、特征合并层和高层提取层；所述基于所述降噪特征提取层，提取所述声学特征与所述噪音特征相区别的特征，得到降噪特征，包括：基于所述特征转换层，对所述声学特征和/或所述噪音特征进行特征转换，得到同一特征空间下的声学转换特征和噪音转换特征；基于所述特征合并层，对所述同一特征空间下的声学转换特征和噪音转换特征进行特征合并，得到合并特征；基于所述高层提取层，对所述合并特征进行高层特征提取，得到所述降噪特征。4.根据权利要求3所述的语音识别方法，其特征在于，所述特征转换层包括声学特征转换层和噪音特征转换层；所述基于所述特征转换层，对所述声学特征和/或所述噪音特征进行特征转换，得到同一特征空间下的声学转换特征和噪音转换特征，包括：基于所述声学特征转换层，对所述声学特征进行特征转换，得到所述声学转换特征；基于所述噪音特征转换层，对所述噪音特征进行特征转换，得到所述噪音转换特征。5.根据权利要求1所述的语音识别方法，其特征在于，所述噪音编码模型与特征分类模型构成语音分类模型，所述语音分类模型是基于第一样本语音的声学特征，以及表征所述第一样本语音是否为带噪语音的噪音标签训练得到的，所述特征分类模型用于基于所述噪音编码模型输出的所述第一样本语音的噪音特征，确定所述第一样本语音是否为带噪语音。6.根据权利要求5所述的语音识别方法，其特征在于，所述噪音编码模型基于如下步骤确定：基于初始分类模型中的初始噪音编码模型，对所述第一样本语音的声学特征进行噪音编码，得到初始噪音特征；基于初始分类模型中的初始特征分类模型，应用所述初始噪音特征...

【专利技术属性】
技术研发人员：王宇剑，李良斌，陈孝良，
申请(专利权)人：北京声智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人