语音降噪方法、装置、设备及存储介质制造方法及图纸

技术编号:34320854 阅读:20 留言:0更新日期:2022-07-31 00:10
本发明专利技术公开了语音降噪方法、装置、设备及存储介质,该方法包括:采集音频流,并识别音频流对应的场景类型;根据场景类型选取预训练的目标语音降噪模型;采用目标语音降噪模型对音频流对应的各个采样点依次进行频域降噪处理以及时域降噪处理,得到各个采样点的干净时域信号;将各个采样点的干净时域信号进行重叠相加,得到降噪后的音频流。本发明专利技术实现了音频流的实时降噪处理,降低了降噪后的音频流的传输时延。时延。时延。

Speech noise reduction method, device, equipment and storage medium

【技术实现步骤摘要】
语音降噪方法、装置、设备及存储介质


[0001]本专利技术涉及音视频
,尤其涉及一种语音降噪方法、装置、设备及存储介质。

技术介绍

[0002]语音降噪具有通过减弱背景噪音以增强有用的语音信号的作用。现有的语音降噪方法,例如基于深度学习的语音降噪方法,虽然可以对非平稳噪声场景的音频信号进行降噪,但实时性差,无法基于实时场合对音频信号进行降噪处理。

技术实现思路

[0003]本专利技术实施例通过提供一种语音降噪方法、装置、设备及存储介质,旨在解决现有语音降噪方法实现音频信号降噪的实时性差,无法基于实时场合对音频信号进行降噪处理的技术问题。
[0004]本专利技术实施例提供了一种语音降噪方法,所述语音降噪方法,包括:
[0005]采集音频流,并识别所述音频流对应的场景类型;
[0006]根据所述场景类型选取预训练的目标语音降噪模型;
[0007]采用所述目标语音降噪模型对所述音频流对应的各个采样点依次进行频域降噪处理以及时域降噪处理,得到所述各个采样点的干净时域信号;以及,
[0008]将所述各个采样点的干净时域信号进行重叠相加,得到降噪后的所述音频流。
[0009]在一实施例中,所述目标语音降噪模型包括短时傅里叶变换层、第一信号降噪层、短时傅里叶逆变换层、第一卷积层、第二信号降噪层、第二卷积层和信号重建层,所述短时傅里叶变换层、所述第一信号降噪层、所述短时傅里叶逆变换层、所述第一卷积层、所述第二信号降噪层、所述第二卷积层和所述信号重建层依次连接。r/>[0010]在一实施例中,所述识别所述音频流对应的场景类型的步骤之后,还包括:
[0011]根据所述场景类型确定所述目标语音降噪模型的降噪参数,所述降噪参数用于调节所述目标语音降噪模型的降噪效果。
[0012]在一实施例中,所述采用所述目标语音降噪模型对所述音频流对应的各个采样点依次进行频域降噪处理以及时域降噪处理,得到所述各个采样点的干净时域信号的步骤包括:
[0013]对所述各个采样点进行短时傅里叶变换,得到所述各个采样点的频域信号;
[0014]对所述各个采样点的频域信号进行降噪处理;
[0015]对降噪处理后的各个所述频域信号进行短时傅里叶逆变换,得到所述各个采样点的第一时域信号;
[0016]对所述各个采样点的第一时域信号的第一时域特征进行降维,得到具有第二时域特征的各个所述第一时域信号;
[0017]对具有第二时域特征的各个所述第一时域信号进行降噪,得到所述各个采样点的
第二时域信号;
[0018]根据所述各个采样点的第二时域信号确定所述各个采样点的干净时域信号。
[0019]在一实施例中,所述将所述各个采样点的干净时域信号进行重叠相加,得到降噪后的所述音频流的步骤包括:
[0020]对所述各个采样点的干净时域信号的第三时域特征进行升维,得到具有第四时域特征的各个所述干净时域信号;
[0021]对具有第四时域特征的各个所述干净时域信号进行重叠相加,得到降噪后的所述音频流。
[0022]在一实施例中,所述识别所述音频流对应的场景类型的步骤包括:
[0023]采用预先训练的声学场景识别模型识别所述音频流,得到所述音频流对应的场景类型。
[0024]在一实施例中,所述声学场景识别模型包括卷积层、池化层、全连接层和归一化指数函数层,卷积层、池化层、全连接层和归一化指数函数层依次连接,所述采用预先训练的声学场景识别模型识别所述音频流,得到所述音频流对应的场景类型的步骤包括:
[0025]提取所述音频流的梅尔频谱特征;
[0026]采用所述卷积层、所述池化层、所述全连接层和所述归一化指数函数层对所述梅尔频谱特征进行识别,得到多个预设场景类型和各个所述预设场景类型对应的概率;
[0027]将最大概率对应的预设场景类型作为所述场景类型。
[0028]此外,为实现上述目的,本专利技术还提供了一种语音降噪装置,所述语音降噪装置包括:
[0029]类型获取模块,用于采集音频流,并识别所述音频流对应的场景类型;
[0030]模型选择模块,用于根据所述场景类型选取预训练的目标语音降噪模型;
[0031]语音降噪模块,用于采用所述目标语音降噪模型对所述音频流对应的各个采样点依次进行频域降噪处理以及时域降噪处理,得到所述各个采样点的干净时域信号;
[0032]语音重建模块,用于将所述各个采样点的干净时域信号进行重叠相加,得到降噪后的所述音频流。
[0033]此外,为实现上述目的,本专利技术还提供了一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音降噪程序,所述语音降噪程序被所述处理器执行时实现上述的语音降噪方法的步骤。
[0034]此外,为实现上述目的,本专利技术还提供了一种存储介质,其上存储有语音降噪程序,所述语音降噪程序被处理器执行时实现上述的语音降噪方法的步骤。
[0035]本专利技术实施例中提供的一种语音降噪方法、装置、设备及存储介质的技术方案,至少具有如下技术效果或优点:
[0036]本专利技术通过采集音频流,并识别音频流对应的场景类型,根据场景类型选取预训练的目标语音降噪模型,采用目标语音降噪模型对音频流对应的各个采样点依次进行频域降噪处理以及时域降噪处理,得到各个采样点的干净时域信号,将各个采样点的干净时域信号进行重叠相加,得到降噪后的音频流的技术方案,解决了现有语音降噪方法实现音频信号降噪的实时性差,无法基于实时场合对音频信号进行降噪处理的技术问题。本专利技术通过根据音频流对用户所处的场景进行识别,从而根据用户所处的场景类型选择对应的语音
降噪模型对音频流进行降噪,不仅实现了音频流的实时降噪处理,还降低了降噪后的音频流的传输时延以及提高了降噪后的音频流的质量。
附图说明
[0037]图1为本专利技术实施例方案涉及的硬件运行环境的结构示意图;
[0038]图2为本专利技术语音降噪方法的一实施例的流程示意图;
[0039]图3为本专利技术语音降噪方法的语音降噪流程框图;
[0040]图4为本专利技术声学场景识别模型的网络结构示意图;
[0041]图5为本专利技术语音降噪模型的网络结构示意图;
[0042]图6为本专利技术语音降噪装置的功能模块图。
具体实施方式
[0043]为了更好的理解上述技术方案,下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。
[0044]如图1所示,图1为本专利技术实施例方案涉及的硬件运行环境的结构示意图。
[0045]需要说明的是,图1即可为终端设备的硬件运行环境的结构示意图。
[0046]作为一种实现方式,可本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音降噪方法,其特征在于,所述语音降噪方法包括:采集音频流,并识别所述音频流对应的场景类型;根据所述场景类型选取预训练的目标语音降噪模型;采用所述目标语音降噪模型对所述音频流对应的各个采样点依次进行频域降噪处理以及时域降噪处理,得到所述各个采样点的干净时域信号;以及,将所述各个采样点的干净时域信号进行重叠相加,得到降噪后的所述音频流。2.如权利要求1所述的方法,其特征在于,所述目标语音降噪模型包括短时傅里叶变换层、第一信号降噪层、短时傅里叶逆变换层、第一卷积层、第二信号降噪层、第二卷积层和信号重建层,所述短时傅里叶变换层、所述第一信号降噪层、所述短时傅里叶逆变换层、所述第一卷积层、所述第二信号降噪层、所述第二卷积层和所述信号重建层依次连接。3.如权利要求1或2所述的方法,其特征在于,所述识别所述音频流对应的场景类型的步骤之后,还包括:根据所述场景类型确定所述目标语音降噪模型的降噪参数,所述降噪参数用于调节所述目标语音降噪模型的降噪效果。4.如权利要求1或2所述的方法,其特征在于,所述采用所述目标语音降噪模型对所述音频流对应的各个采样点依次进行频域降噪处理以及时域降噪处理,得到所述各个采样点的干净时域信号的步骤包括:对所述各个采样点进行短时傅里叶变换,得到所述各个采样点的频域信号;对所述各个采样点的频域信号进行降噪处理;对降噪处理后的各个所述频域信号进行短时傅里叶逆变换,得到所述各个采样点的第一时域信号;对所述各个采样点的第一时域信号的第一时域特征进行降维,得到具有第二时域特征的各个所述第一时域信号;对具有第二时域特征的各个所述第一时域信号进行降噪,得到所述各个采样点的第二时域信号;根据所述各个采样点的第二时域信号确定所述各个采样点的干净时域信号。5.如权利要求1或2所述的方法,其特征在于,所述将所述各个采样点的干净时域信号进行重叠相加,得到降噪后的所述音频流的步骤包括:对所述各个采样点的干...

【专利技术属性】
技术研发人员:卢志强
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1