降噪模型训练方法、装置及存储介质制造方法及图纸

技术编号:32340983 阅读:22 留言:0更新日期:2022-02-16 18:49
本申请提供一种降噪模型训练方法、装置及存储介质,涉及语音信号处理技术领域,该方法包括:生成至少一个随机数,基于所述随机数确定加噪信息,根据加噪信息对安静数据进行加噪操作,获得加噪数据,所述加噪信息包括:目标噪声数据、所述目标噪声数据与所述安静数据的合并时间段以及所述目标噪声数据与所述安静数据合成的信噪比;从所述加噪数据中提取声学特征,并基于所述声学特征对降噪模型进行训练以得到目标降噪模型。能够解决目前对带噪语音进行语音识别的准确性低的问题。行语音识别的准确性低的问题。行语音识别的准确性低的问题。

【技术实现步骤摘要】
降噪模型训练方法、装置及存储介质


[0001]本申请涉及语音信号处理领域,具体而言,涉及一种降噪模型训练方法、装置及存储介质。

技术介绍

[0002]在语音信号接收过程中,存在着周围环境、传播媒介、电磁干扰等多种噪声,使接受到的语音不再是纯净的原始语音,在对语音信号应用时会导致性能大幅下降。
[0003]而语音降噪的主要目的是从含噪声语音中提取尽可能纯净的原始语音,对带噪语音进行降噪处理,进而提升语音识别的准确率。但在目前的降噪技术手段中大多是直接对于语音信号进行处理,存在对带噪语音进行语音识别的准确性低的问题。

技术实现思路

[0004]本申请实施例的目的在于提供一种降噪模型训练方法、装置及存储介质,用以解决目前对带噪语音进行语音识别的准确性低的问题。
[0005]第一方面,本申请实施例提供一种降噪模型训练方法,包括:
[0006]生成至少一个随机数,基于所述随机数确定加噪信息,根据加噪信息对安静数据进行加噪操作,获得加噪数据,所述加噪信息包括:目标噪声数据、所述目标噪声数据与所述安静数据的合并时间段以本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种降噪模型训练方法,其特征在于,包括:生成至少一个随机数,基于所述随机数确定加噪信息,根据加噪信息对安静数据进行加噪操作,获得加噪数据,所述加噪信息包括:目标噪声数据、所述目标噪声数据与所述安静数据的合并时间段以及所述目标噪声数据与所述安静数据合成的信噪比;从所述加噪数据中提取声学特征,并基于所述声学特征对降噪模型进行训练以得到目标降噪模型。2.根据权利要求1所述的方法,其特征在于,所述基于所述随机数确定加噪信息包括以下的一项或多项:基于所述随机数中的第一随机数确定从预设的所述噪声库中选择与所述第一随机数对应的所述噪声数据,将所述噪声数据作为目标噪声数据;基于所述随机数中的第二随机数确定所述目标噪声数据与所述安静数据的合并时间段;基于所述随机数中的第三随机数确定所述目标噪声数据与所述安静数据合成的信噪比。3.根据权利要求1所述的方法,其特征在于,所述基于所述声学特征对降噪模型进行训练包括:对于一条所述加噪数据,分别将所述加噪数据输入所述降噪模型和训练好的语音识别模型,在所述降噪模型中根据第一损失函数得到所述加噪数据的第一损失值,在所述语音识别模型中根据第二损失函数得到第二损失值;基于插值合并的方式判断所述第一损失值和所述第二损失值的合并损失值是否超过预设损失阈值;在所述合并损失值超过预设损失阈值时,剔除所述加噪数据;在所述合并损失值未超过预设损失阈值时,判断使用所述第一损失值训练所述降噪模型。4.根据权利要求2所述的方法,其特征在于,所述基于所述随机数中的第一随机数确定从预设的所述噪声库中选择与所述第一随机数对应的所述噪声数据,将所述噪声数据作为目标噪声数据包括:基于混合同余算法,生成所述第一随机数,所述第一随机数为在第一预设区间上均匀分布的所有随机数中的一个随机数,所述第一预设区间中的每一个数对应所述噪声库中的一条所述噪声数据从所述噪声库中选择与所述第一随机数对应的所述噪声数据作为目标噪声数据。5.根据权利要求2所述的方法,其特征在于,所述基于所述随机数中的第二随机数确定所述目标噪声数据与所述安静数据的合并时间段包括:基于混合同余算法,生成所述第二随机数,所述第二随...

【专利技术属性】
技术研发人员:邱立坤胡云燎赵言王炼胡加明
申请(专利权)人:鼎富新动力北京智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1