音频降噪模型的训练方法、音频降噪方法及装置制造方法及图纸

技术编号:32883906 阅读:24 留言:0更新日期:2022-04-02 12:18
本公开提出一种音频降噪模型的训练方法、音频降噪方法及装置,涉及人工智能技术领域,尤其涉及深度学习和音频技术领域。其中,音频降噪模型的训练方法包括:采用音频生成算法对原始含噪音频进行采样,得到具有相似特征的第一含噪音频和第二含噪音频;确定所述原始含噪音频的原始含噪频谱特征和所述第一含噪音频的第一含噪频谱特征;采用音频降噪模型分别对所述原始含噪频谱特征和所述第一含噪频谱特征进行降噪处理,得到原始降噪音频和第一降噪音频;利用所述原始降噪音频、所述第一降噪音频和所述第二含噪音频构建损失函数;根据所述损失函数对所述音频降噪模型的参数进行调整。采用本公开能够降低对音频降噪模型的训练难度。度。度。

【技术实现步骤摘要】
音频降噪模型的训练方法、音频降噪方法及装置


[0001]本公开涉及人工智能
,尤其涉及深度学习和音频
,具体涉及一种音频降噪模型的训练方法、音频降噪方法和装置。

技术介绍

[0002]音频降噪,又称为语音降噪或语音增强,是指当语音信号被各种各样的背景噪声干扰、甚至淹没后,尽可能地从含噪音频中提取出有用音频(或称纯净音频或降噪音频),抑制或降低噪声干扰的技术。音频降噪的主要作用是降低背景噪声干扰,改善语音质量,提升听者的舒适感,并提高语音信息传达的可懂度。
[0003]目前出现了深度学习技术应用于音频降噪的方法,这种方法获取训练样本的难度大,导致对音频降噪模型训练的难度较大。

技术实现思路

[0004]本公开提出了一种音频降噪模型的训练方法和音频降噪方法,能够降低对音频降噪模型的训练难度。
[0005]第一方面,本公开提供了一种音频降噪模型的训练方法,包括:
[0006]采用音频生成算法对原始含噪音频进行采样,得到具有相似特征的第一含噪音频和第二含噪音频;
[0007]确定原始含噪音频的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频降噪模型的训练方法,包括:采用音频生成算法对原始含噪音频进行采样,得到具有相似特征的第一含噪音频和第二含噪音频;确定所述原始含噪音频的原始含噪频谱特征和所述第一含噪音频的第一含噪频谱特征;采用音频降噪模型分别对所述原始含噪频谱特征和所述第一含噪频谱特征进行降噪处理,得到原始降噪音频和第一降噪音频;利用所述原始降噪音频、所述第一降噪音频和所述第二含噪音频构建损失函数;根据所述损失函数对所述音频降噪模型的参数进行调整。2.根据权利要求1所述的方法,其中,所述采用音频生成算法对原始含噪音频进行采样,得到具有相似特征的第一含噪音频和第二含噪音频,包括:将所述原始含噪音频进行分帧,得到多个帧;将所述多个帧进行分组处理,得到多个块;每个块包括K个所述帧,所述K为正偶数;对各个块进行采样,得到每个块对应的两个音频片段,其中一个音频片段由该块中的序列号为奇数的帧依次连接而成,另一个音频片段由该块中的序列号为偶数的帧依次连接而成;分别提取各个块对应的一个音频片段,将提取的音频片段依次连接,得到所述第一含噪音频,并将提取之后各个块剩余的另一个音频片段依次连接,得到所述第二含噪音频。3.根据权利要求1所述的方法,其中,所述采用音频降噪模型分别对所述原始含噪频谱特征和所述第一含噪频谱特征进行降噪处理,得到原始降噪音频和第一降噪音频,包括:将所述原始含噪频谱特征和所述第一含噪频谱特征分别输入所述音频降噪模型,得到原始降噪频谱特征和第一降噪频谱特征;分别对所述原始降噪频谱特征和所述第一降噪频谱特征进行频域到时域的转换,得到所述原始降噪音频和所述第一降噪音频。4.根据权利要求3所述的方法,其中,所述利用所述原始降噪音频、所述第一降噪音频和所述第二含噪音频构建损失函数,包括:利用所述第一降噪音频、所述第一降噪频谱特征、所述第二含噪音频和所述第二含噪音频的第二含噪频谱特征,构建所述损失函数的第一部分;采用所述音频生成算法对所述原始降噪音频进行采样,得到具有相似特征的第一音频和第二音频;利用所述第一音频、所述第二音频、所述第二含噪音频和所述第一降噪音频,构建所述损失函数的第二部分;将所述第一部分和所述第二部分组成所述损失函数。5.根据权利要求4所述的方法,其中,所述采用所述音频生成算法对所述原始降噪音频进行采样,得到具有相似特征的第一音频和第二音频,包括:将所述原始降噪音频进行分帧,得到多个帧;将所述多个帧进行分组处理,得到多个块;每个块包括L个所述帧,所述L为正整数;对各个块进行采样,得到每个块对应的两个音频片段,其中一个音频片段由该块中的序列号为奇数的帧依次连接而成,另一个音频片段由该块中的序列号为偶数的帧依次连接
而成;分别提取各个块对应的一个音频片段,将提取的音频片段依次连接,得到所述第一音频,并将提取之后各个块剩余的另一个音频片段依次连接,得到所述第二音频。6.根据权利要求3至5中任一所述的方法,其中,所述音频降噪模型的参数矩阵包括实部分量和虚部分量;所述原始含噪频谱特征表征为包括实部分量和虚部分量的原始含噪特征矩阵;所述第一含噪频谱特征表征为包括实部分量和虚部分量的第一含噪特征矩阵。7.根据权利要求3至6中任一所述的方法,其中,所述将所述原始含噪频谱特征和所述第一含噪频谱特征分别输入所述音频降噪模型,得到原始降噪频谱特征和第一降噪频谱特征,包括:采用所述音频降噪模型的参数矩阵分别对所述原始含噪特征矩阵和所述第一含噪特征矩阵进行卷积处理,得到所述原始降噪频谱特征和所述第一降噪频谱特征。8.根据权利要求4所述的方法,其中,所述利用所述第一降噪音频、所述第一降噪频谱特征、所述第二含噪音频和所述第二含噪音频的第二含噪频谱特征,构建所述损失函数的第一部分,包括:利用所述第一降噪频谱特征和所述第二含噪频谱特征,确定所述第一部分的频域部分,并且,利用所述第一降噪音频和所述第二含噪音频,确定所述第一部分的时域部分;确定所述频域部分和所述时域部分的加权和,得到所述损失函数的第一部分。9.根据权利要求8所述的方法,其中,所述第一降噪频谱特征表征为包括实部分量和虚部分量的第一降噪特征矩阵;所述第二含噪频谱特征表征为包括实部分量和虚部分量的第二含噪特征矩阵。10.根据权利要求9所述的方法,其中,所述利用所述第一降噪频谱特征和所述第二含噪频谱特征,确定所述第一部分的频域部分,包括:利用所述第一降噪特征矩阵的实部分量与所述第二含噪特征矩阵的实部分量的差值、以及所述第一降噪特征矩阵的虚部分量与所述第二含噪特征矩阵的虚部分量的差值,确定所述第一部分的频域部分。11.根据权利要求8至10中任一所述的方法,其中,所述利用所述第一降噪音频和所述第二含噪音频,确定所述第一部分的时域部分,包括:利用所述第一降噪音频和所述第二含噪音频在各个对应时刻上的差值,确定所述第一部分的时域部分。12.根据权利要求4至11中任一所述的方法,其中,所述利用所述第一音频、所述第二音频、所述第二含...

【专利技术属性】
技术研发人员:赵情恩
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1