System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及语音识别领域,特别是涉及到一种提升带噪语音识别率的网络生成方法、装置、设备及介质。
技术介绍
1、语音识别尤其是命令词识别广泛应用于智能家居设备,比如语音控制耳机、语音控制家电等。带噪场景的语音识别,相比安静环境下的识别,准确率要低,影响用户体验。一般对带噪语音的识别,是先对语音通过语音前端算法 (语音降噪等)进行处理,然后送入语音识别网络进行识别,此种方案需要降噪和识别两个模型,模型参数量大,降噪的输出需要缓存,占用的空间也多。另一种是增强和识别使用一种网络,对其进行联合训练,此类方式虽然训练方式是端到端,但实际推理时,计算较复杂,功耗和耗时较多,且中间结果需要缓存,需占用更多的缓存。
2、因此,针对现有提升带噪语音识别准确率的识别网络在识别带噪语音过程中的计算量大以及占用内存大的问题是一个亟需解决的技术问题。
技术实现思路
1、本申请的主要目的为提供一种提升带噪语音识别率的网络生成方法、装置、设备及介质,旨在解决现有提升带噪语音识别准确率的识别网络在识别带噪语音过程中的计算量大以及占用内存大的技术问题。
2、为了实现上述专利技术目的,本申请提出一种提升带噪语音识别率的网络生成方法,所述方法包括:
3、对预设的语音数据进行训练得到语音识别模型;
4、基于所述语音识别模型对命令词数据进行迁移训练,得到第一识别网络;
5、将干净语音以及所述干净语音的增强语音输入到所述第一识别网络,得到第一识别结果和第二识别结果;<
...【技术保护点】
1.一种提升带噪语音识别率的网络生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述对预设的语音数据进行训练得到语音识别模型的步骤,包括:
3.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述基于所述语音识别模型对命令词数据进行迁移训练,得到第一识别网络的步骤,包括:
4.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述将干净语音以及所述干净语音的增强语音输入到所述第一识别网络,得到第一识别结果和第二识别结果的步骤,包括:
5.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述基于所述第一识别结果和所述第二识别结果之间的信息量差异生成目标函数的步骤,包括:
6.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述基于所述目标函数对所述第一识别网络进行训练的步骤,包括:
7.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述当带噪语音的输出满足预设条件
8.一种提升带噪语音识别率的网络生成装置,其特征在于,包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7 中任一项所述方法的步骤。
...【技术特征摘要】
1.一种提升带噪语音识别率的网络生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述对预设的语音数据进行训练得到语音识别模型的步骤,包括:
3.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述基于所述语音识别模型对命令词数据进行迁移训练,得到第一识别网络的步骤,包括:
4.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述将干净语音以及所述干净语音的增强语音输入到所述第一识别网络,得到第一识别结果和第二识别结果的步骤,包括:
5.根据权利要求1所述的提升带噪语音识别率的网络生成方法,其特征在于,所述基于所述第一识别结果和所述第二识别结果之间的信息量差异生成目标...
【专利技术属性】
技术研发人员:李杰,
申请(专利权)人:深圳市友杰智新科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。