语音降噪方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:32975139 阅读:15 留言:0更新日期:2022-04-09 11:50
本申请涉及一种语音降噪方法、装置、计算机设备和存储介质。所述方法包括:获取待处理语音,并获取第一处理模型和第二处理模型;对待处理语音进行语音端点检测,得到包括有多个待处理语音段的语音段序列和每个待处理语音段各自对应的语音类型;通过第一处理模型,并根据语音类型对至少一个待处理语音段进行第一降噪处理,得到待处理语音段所对应的第一降噪信号段;通过第二处理模型,并根据语音类型对至少一个待处理语音段进行第二降噪处理,得到待处理语音段所对应的第二降噪信号段;根据第一降噪信号段和第二降噪信号段,得到过滤噪音的目标语音信号。采用本方法能够对语音进行有效地降噪处理。有效地降噪处理。有效地降噪处理。

【技术实现步骤摘要】
语音降噪方法、装置、计算机设备和存储介质


[0001]本申请涉及语音处理
,特别是涉及一种语音降噪方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着语音处理技术的发展,对目标语音进行内容识别的技术在人机语音交互中扮演重要角色。用户通过使用语音识别设备,可对目标说话人的待处理语音进行识别处理,进而识别到目标说话人的说话内容。
[0003]但在实际情况中,待处理语音往往都伴随着大量的噪声信号,噪声信号会使得对待处理语音的识别产生严重干扰,造成待处理语音的识别准确性下降。因此,如何有效地进行语音降噪处理是本公开需要解决的问题。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够有效地进行语音降噪的语音降噪方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种语音降噪方法。所述方法包括:
[0006]获取待处理语音,并获取第一处理模型和第二处理模型;所述待处理语音包括噪音;所述第一处理模型为对语音段样本和非语音段样本进行综合训练而得的模型,所述第二处理模型为对语音段样本进行训练而得的模型;
[0007]对所述待处理语音进行语音端点检测,得到包括有多个待处理语音段的语音段序列和每个待处理语音段各自对应的语音类型;
[0008]通过所述第一处理模型,并根据所述语音类型对至少一个所述待处理语音段进行第一降噪处理,得到所述待处理语音段所对应的第一降噪信号段;
[0009]通过所述第二处理模型,并根据所述语音类型对至少一个所述待处理语音段进行第二降噪处理,得到所述待处理语音段所对应的第二降噪信号段;
[0010]根据所述第一降噪信号段和所述第二降噪信号段,得到过滤噪音的目标语音信号。
[0011]在其中一个实施例中,所述语音类型包括语音段类型和非语音段类型;所述通过所述第一处理模型,并根据所述语音类型对至少一个所述待处理语音段进行第一降噪处理,得到所述待处理语音段所对应的第一降噪信号段,包括:过滤所述多个待处理语音段中的属于语音段类型的待处理语音段,得到属于非语音段类型的待处理语音段;通过所述第一处理模型,对属于非语音段类型的待处理语音段进行第一降噪处理,得到属于非语音段类型的待处理语音段所对应的第一降噪信号段。
[0012]在其中一个实施例中,所述语音类型包括语音段类型和非语音段类型;所述通过所述第二处理模型,并根据所述语音类型对至少一个所述待处理语音段进行第二降噪处理,得到所述待处理语音段所对应的第二降噪信号段,包括:过滤所述多个待处理语音段中
的属于非语音段类型的待处理语音段,得到属于语音段类型的待处理语音段;通过所述第二处理模型,对属于语音段类型的待处理语音段进行第二降噪处理,得到属于语音段类型的待处理语音段所对应的第二降噪信号段。
[0013]在其中一个实施例中,所述根据所述第一降噪信号段和所述第二降噪信号段,得到过滤噪音的目标语音信号,包括:确定与所述第一降噪信号段相对应的属于非语音段类型的待处理语音段在所述语音段序列中的第一位置信息;确定与所述第二降噪信号段相对应的属于语音段类型的待处理语音段在所述语音段序列中的第二位置信息;根据所述第一位置信息和所述第二位置信息,对所述第一降噪信号段和所述第二降噪信号段进行第一拼接处理,得到过滤噪音的目标语音信号。
[0014]在其中一个实施例中,所述方法还包括:对所述目标语音信号进行分帧处理,得到至少一个分帧语音信号;对每个所述分帧语音信号进行频谱转换,得到每个所述分帧语音信号各自对应的语音频谱图;通过注意力机制确定所述语音频谱图中的语音权重和噪声权重;根据所述语音权重和噪声权重,对所述目标语音信号进行优化降噪处理。
[0015]在其中一个实施例中,所述第一处理模型的训练步骤,包括:获取第一声音样本集合和第一噪声样本集合;所述第一噪声样本集合包括多个第一噪声样本;所述第一声音样本集合包括多个第一声音样本;所述第一声音样本包括第一纯净声音段和第一纯净非声音段;在所述第一声音样本中的第一纯净声音段和第一纯净非声音段中加入第一噪声样本,得到第一语音段样本和第一非语音段样本;通过待训练的第一处理模型分别对所述第一语音段样本和第一非语音段样本进行第一降噪处理,得到相应的第一预测降噪语音段和第二预测降噪语音段;通过所述第一预测降噪语音段、第二预测降噪语音段、第一纯净声音段和第一纯净非声音段,对所述待训练的第一处理模型进行训练,直至达到第一训练停止条件时停止,得到训练好的第一处理模型。
[0016]在其中一个实施例中,所述第二处理模型的训练步骤,包括:获取第二声音样本集合和第二噪声样本集合;所述第二噪声样本集合包括多个第二噪声样本;所述第二声音样本集合包括多个第二声音样本;所述第二声音样本包括第二纯净声音段;在所述第二声音样本中的第二纯净声音段中加入第二噪声样本,得到第二语音段样本;通过待训练的第二处理模型对所述第二语音段样本进行第二降噪处理,得到相应的第三预测降噪语音段;通过所述第三预测降噪语音段和第二纯净声音段,对所述待训练的第二处理模型进行训练,直至达到第二训练停止条件时停止,得到训练好的第二处理模型。
[0017]在其中一个实施例中,根据第一降噪信号段和第二降噪信号段,得到过滤噪音的目标语音信号,包括:确定与第一降噪信号段相对应的待处理语音段的语音类型和在语音段序列中的第一位置信息,并将与第一降噪信号段相对应的待处理语音段的语音类型作为第一降噪信号段的语音类型;确定与第二降噪信号段相对应的待处理语音段的语音类型和在语音段序列中的第二位置信息,并将与第二降噪信号段相对应的待处理语音段的语音类型作为第二降噪信号段的语音类型;根据第一降噪信号所对应的语音类型和第二降噪信号所对应的语音类型,对第一降噪信号段进行第一过滤处理,得到第一过滤信号段;根据第一降噪信号所对应的语音类型和第二降噪信号所对应的语音类型,对第二降噪信号段进行第二过滤处理,得到第二过滤信号段;根据第一位置信息和第二位置信息,对第一过滤信号段和第二过滤信号段进行第二拼接处理,得到过滤噪音的目标语音信号。
[0018]在其中一个实施例中,所述语音降噪方法由语音降噪模型执行,所述语音降噪模型包括第一处理模型、第二处理模型和第三处理模型,所述第二处理模型的训练步骤,包括:获取第三声音样本集合和第三噪声样本集合;所述第三语音样本包括第三纯净声音段和第三纯净非声音段;通过在第三语音样本中加入至少一个第三噪声样本,得到带噪语音信号,并对所述带噪语音信号进行语音类型分类,得到分类后的预测语音;通过所述预测语音、第三纯净声音段和第三纯净非声音段,对所述待训练的第三处理模型进行训练,直至达到第三训练停止条件时停止,得到训练好的第三处理模型。
[0019]第二方面,本申请还提供了一种语音降噪装置。所述装置包括:
[0020]语音获取模块,用于获取待处理语音,并获取第一处理模型和第二处理模型;所述待处理语音包括噪音;所述第一处理模型为对语音段样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音降噪方法,其特征在于,所述方法包括:获取待处理语音,并获取第一处理模型和第二处理模型;所述待处理语音包括噪音;所述第一处理模型为对语音段样本和非语音段样本进行综合训练而得的模型,所述第二处理模型为对语音段样本进行训练而得的模型;对所述待处理语音进行语音端点检测,得到包括有多个待处理语音段的语音段序列和每个待处理语音段各自对应的语音类型;通过所述第一处理模型,并根据所述语音类型对至少一个所述待处理语音段进行第一降噪处理,得到所述待处理语音段所对应的第一降噪信号段;通过所述第二处理模型,并根据所述语音类型对至少一个所述待处理语音段进行第二降噪处理,得到所述待处理语音段所对应的第二降噪信号段;根据所述第一降噪信号段和所述第二降噪信号段,得到过滤噪音的目标语音信号。2.根据权利要求1所述的方法,其特征在于,所述语音类型包括语音段类型和非语音段类型;所述通过所述第一处理模型,并根据所述语音类型对至少一个所述待处理语音段进行第一降噪处理,得到所述待处理语音段所对应的第一降噪信号段,包括:过滤所述多个待处理语音段中的属于语音段类型的待处理语音段,得到属于非语音段类型的待处理语音段;通过所述第一处理模型,对属于非语音段类型的待处理语音段进行第一降噪处理,得到属于非语音段类型的待处理语音段所对应的第一降噪信号段。3.根据权利要求1所述的方法,其特征在于,所述语音类型包括语音段类型和非语音段类型;所述通过所述第二处理模型,并根据所述语音类型对至少一个所述待处理语音段进行第二降噪处理,得到所述待处理语音段所对应的第二降噪信号段,包括:过滤所述多个待处理语音段中的属于非语音段类型的待处理语音段,得到属于语音段类型的待处理语音段;通过所述第二处理模型,对属于语音段类型的待处理语音段进行第二降噪处理,得到属于语音段类型的待处理语音段所对应的第二降噪信号段。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一降噪信号段和所述第二降噪信号段,得到过滤噪音的目标语音信号,包括:确定与所述第一降噪信号段相对应的属于非语音段类型的待处理语音段在所述语音段序列中的第一位置信息;确定与所述第二降噪信号段相对应的属于语音段类型的待处理语音段在所述语音段序列中的第二位置信息;根据所述第一位置信息和所述第二位置信息,对所述第一降噪信号段和所述第二降噪信号段进行第一拼接处理,得到过滤噪音的目标语音信号。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述目标语音信号进行分帧处理,得到至少一个分帧语音信号;对每个所述分帧语音信号进行频谱转换,得到每个所述分帧语音信号各自对应的语音频谱图;通过注意力机制确定所述语音频谱图中的语音权重和噪声权重;根据所述语音权重和噪声权重,对所述目标语音信号进行优化降噪处理。
6.根据权利要求1所...

【专利技术属性】
技术研发人员:崔洋洋余俊澎
申请(专利权)人:游密科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1