一种语音增强方法、装置、设备及介质制造方法及图纸

技术编号：35305536 阅读：9 留言：0更新日期：2022-10-22 12:55

本发明专利技术公开了一种语音增强方法、装置、设备及介质。语音增强方法，包括：获取预处理语音信号；将预处理语音信号进行频域维纳滤波处理，得到第一滤波语音信号；根据第一滤波语音信号，确定基音分析结果，并根据基音分析结果以及预处理语音信号，确定目标特征；将目标特征输入至完成训练的RNN，得到各目标增益；根据基音分析结果以及预处理语音信号，确定基音滤波结果；根据各目标增益以及基音滤波结果，确定目标降噪语音信号。本发明专利技术实施例的技术方案实现传统信号处理理论与深度学习的结合，在不显著增加计算量的前提下，能够有效地抑制噪声。声。声。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音增强方法、装置、设备及介质

[0001]本专利技术涉及信号处理
，尤其涉及一种语音增强方法、装置、设备及介质。

技术介绍

[0002]在现实场景中，语音信号会被各种各样的噪声干扰、甚至淹没，从噪声背景中提取有用的语音信号，成为信号处理的研究热点。
[0003]噪声的来源众多，因应用场合而异，它们的特性也各不相同。针对不同噪声，采用不同的语音增强对策，传统的RNN(Recurrent Neural Network，循环神经网络)降噪算法的性能主要取决于基音滤波和RNN训练数据集，然而传统的RNN降噪算法的基音分析效果较差，导致降噪效果不理想。

技术实现思路

[0004]本专利技术提供了一种语音增强方法、装置、设备及介质，实现传统信号处理理论与深度学习的结合，在不显著增加计算量的前提下，能够有效地抑制噪声。
[0005]根据本专利技术的一方面，提供了一种语音增强方法，包括：
[0006]获取预处理语音信号；
[0007]将预处理语音信号进行频域维纳滤波处理，得到第一滤波语音信号；
[0008]根据第一滤波语音信号，确定基音分析结果，并根据基音分析结果以及预处理语音信号，确定目标特征；其中，基音分析结果包括基音周期；
[0009]将目标特征输入至完成训练的循环神经网络RNN，得到各目标增益；
[0010]根据基音分析结果以及预处理语音信号，确定基音滤波结果；
[0011]根据各目标增益以及基音滤波结果，确定目标降噪语音信号。/>[0012]根据本专利技术的另一方面，提供了一种语音增强装置，包括：
[0013]信号获取模块，用于获取预处理语音信号；
[0014]第一滤波语音信号获取模块，用于将预处理语音信号进行频域维纳滤波处理，得到第一滤波语音信号；
[0015]目标特征确定模块，用于根据第一滤波语音信号，确定基音分析结果，并根据基音分析结果以及预处理语音信号，确定目标特征；其中，基音分析结果包括基音周期；
[0016]目标增益获取模块，用于将目标特征输入至完成训练的RNN，得到各目标增益；
[0017]基音滤波结果确定模块，用于根据基音分析结果以及预处理语音信号，确定基音滤波结果；
[0018]目标降噪语音信号确定模块，用于根据各目标增益以及基音滤波结果，确定目标降噪语音信号。
[0019]根据本专利技术的另一方面，提供了一种电子设备，所述电子设备包括：
[0020]至少一个处理器；以及
[0021]与所述至少一个处理器通信连接的存储器；其中，
[0022]所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本专利技术任一实施例所述的语音增强方法。
[0023]根据本专利技术的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的语音增强方法。
[0024]本专利技术实施例的技术方案，通过获取预处理语音信号，从而将预处理语音信号进行频域维纳滤波处理，得到第一滤波语音信号，进而根据第一滤波语音信号，确定基音分析结果，并根据基音分析结果以及预处理语音信号，确定目标特征，进一步将目标特征输入至完成训练的RNN，得到各目标增益，从而根据基音分析结果以及预处理语音信号，确定基音滤波结果，进而根据各目标增益以及基音滤波结果，确定目标降噪语音信号。基音分析结果中的基音周期对降噪效果有直接影响，对预处理语音信号进行频域维纳滤波处理可以提高基音分析结果中基音周期估计的准确性，还不会明显增加计算量。在本方案中获取目标特征属于传统信号处理理论，将传统信号处理理论与深度学习结合，能够在准确估计基音周期的前提下，有效抑制带噪语音中的噪声，起到事半功倍的效果，解决了现有技术中RNN降噪算法的基音分析效果较差，降噪效果不佳的问题，实现传统信号处理理论与深度学习的结合，在不显著增加计算量的前提下，能够有效地抑制噪声。
[0025]应当理解，本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征，也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0026]为了更清楚地说明本专利技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本专利技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0027]图1为本专利技术实施例一提供的一种语音增强方法的流程图；
[0028]图2为本专利技术实施例二提供的一种语音增强方法的流程图；
[0029]图3是本专利技术实施例二提供的一种语音增强计算流程的示意图；
[0030]图4是本专利技术实施例二提供的一种基音分析中基音分析的流程图；
[0031]图5是本专利技术实施例二提供的一种GRU框架示意图；
[0032]图6是本专利技术实施例二提供的一种RNN结构的示意图；
[0033]图7是本专利技术实施例二提供的一种传统RNN降噪与改进RNN降噪的效果对比图；
[0034]图8为本专利技术实施例三提供的一种语音增强装置的结构示意图；
[0035]图9示出了可以用来实施本专利技术的实施例的电子设备的结构示意图。
具体实施方式
[0036]为了使本
的人员更好地理解本专利技术方案，下面将结合本专利技术实施例中的附图，对本专利技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本专利技术一部分的实施例，而不是全部的实施例。基于本专利技术中的实施例，本领域普通技术人
员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本专利技术保护的范围。
[0037]需要说明的是，本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0038]实施例一
[0039]图1为本专利技术实施例一提供的一种语音增强方法的流程图，本实施例可适用于有效抑制带噪语音中噪声的情况，该方法可以由语音增强装置来执行，该语音增强装置可以采用硬件和/或软件的形式实现，该语音增强装置可配置于电子设备中。如图1所示，该方法包括：
[0040]S110、获取预处理语音信号。
[0041]其中，预处理语音信号可以是完成信号预处理的语音信号。
[0042]在本专利技术实施例中，在获取到本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法，其特征在于，包括：获取预处理语音信号；将所述预处理语音信号进行频域维纳滤波处理，得到第一滤波语音信号；根据第一滤波语音信号，确定基音分析结果，并根据所述基音分析结果以及所述预处理语音信号，确定目标特征；其中，基音分析结果包括基音周期；将所述目标特征输入至完成训练的循环神经网络RNN，得到各目标增益；根据所述基音分析结果以及所述预处理语音信号，确定基音滤波结果；根据各目标增益以及所述基音滤波结果，确定目标降噪语音信号。2.根据权利要求1所述的方法，其特征在于，获取预处理语音信号，包括：获取待处理语音信号以及窗函数；根据所述窗函数，对所述待处理语音信号进行重叠加窗处理，得到重叠加窗语音信号；对所述重叠加窗语音信号进行傅里叶变换，得到所述预处理语音信号。3.根据权利要求1所述的方法，其特征在于，根据第一滤波语音信号，确定基音分析结果，包括：对所述第一滤波语音信号进行傅里叶逆变换，得到第一逆变换结果，并对所述第一逆变换结果进行重叠相加处理，得到第一重叠相加结果；将所述第一重叠相加结果进行基音分析，得到所述基音分析结果。4.根据权利要求1所述的方法，其特征在于，根据所述基音分析结果以及所述预处理语音信号，确定目标特征，包括：获取所述预处理语音信号的巴克频率倒谱系数，以及所述巴克频率倒谱系数在时域的一阶导数和二阶导数；计算所述预处理语音信号频带上基音相关度的离散余弦变换系数；根据所述基音分析结果，确定基音周期以及基音平稳度；根据所述巴克频率倒谱系数、所述巴克频率倒谱系数在时域的一阶导数以及二阶导数、所述离散余弦变换系数、所述基音周期以及所述基音平稳度，确定所述目标特征。5.根据权利要求1所述的方法，其特征在于，在将所述目标特征输入至完成训练的RNN，得到各目标增益之后，还包括：获取待插值频带；按照各待插值频带，对各目标增益依次进行线性插值，得到线性插值结果。6.根据权利要求5所述的方法，其特征在于，根据各目标增益以及所述...

【专利技术属性】
技术研发人员：李娟，江雄杰，
申请(专利权)人：辰芯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人