提升带噪语音识别率的网络生成方法、装置、设备及介质制造方法及图纸

技术编号：41209093 阅读：40 留言：0更新日期：2024-05-09 23:31

本申请涉及语音识别技术领域，特别是涉及到一种提升带噪语音识别率的网络生成方法、装置、设备及介质，其中方法包括：对预设的语音数据进行训练得到语音识别模型；基于所述语音识别模型对命令词数据进行迁移训练，得到第一识别网络；将干净语音以及所述干净语音的增强语音输入到所述第一识别网络，得到第一识别结果和第二识别结果；基于所述第一识别结果和所述第二识别结果之间的信息量差异生成目标函数；基于所述目标函数对所述第一识别网络进行训练；当带噪语音的输出满足预设条件，停止所述训练，得到第二识别网络。本申请能够在提高语音识别模型性能的同时，做到占用内存体积小以及计算量小的，提高了系统的效率和实用性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音识别领域，特别是涉及到一种提升带噪语音识别率的网络生成方法、装置、设备及介质。

技术介绍

1、语音识别尤其是命令词识别广泛应用于智能家居设备，比如语音控制耳机、语音控制家电等。带噪场景的语音识别，相比安静环境下的识别，准确率要低，影响用户体验。一般对带噪语音的识别，是先对语音通过语音前端算法（语音降噪等）进行处理，然后送入语音识别网络进行识别，此种方案需要降噪和识别两个模型，模型参数量大，降噪的输出需要缓存，占用的空间也多。另一种是增强和识别使用一种网络，对其进行联合训练，此类方式虽然训练方式是端到端，但实际推理时，计算较复杂，功耗和耗时较多，且中间结果需要缓存，需占用更多的缓存。

2、因此，针对现有提升带噪语音识别准确率的识别网络在识别带噪语音过程中的计算量大以及占用内存大的问题是一个亟需解决的技术问题。

技术实现思路

1、本申请的主要目的为提供一种提升带噪语音识别率的网络生成方法、装置、设备及介质，旨在解决现有提升带噪语音识别准确率的识别网络在识别带噪语音过...

【技术保护点】

1.一种提升带噪语音识别率的网络生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的提升带噪语音识别率的网络生成方法，其特征在于，所述对预设的语音数据进行训练得到语音识别模型的步骤，包括：

3.根据权利要求1所述的提升带噪语音识别率的网络生成方法，其特征在于，所述基于所述语音识别模型对命令词数据进行迁移训练，得到第一识别网络的步骤，包括：

4.根据权利要求1所述的提升带噪语音识别率的网络生成方法，其特征在于，所述将干净语音以及所述干净语音的增强语音输入到所述第一识别网络，得到第一识别结果和第二识别结果的步骤，包括：