一种基于语谱补偿的单通道语音增强系统技术方案

技术编号：32275261 阅读：30 留言：0更新日期：2022-02-12 19:40

本发明专利技术公开了一种基于语谱补偿的单通道语音增强系统，包括预增强模块，语谱补偿模块和联合训练模块；所述预增强模块，用于去除语音中的部分干扰信号；所述语谱补偿模块，与所述预增强模块相连接，用于获取语谱补偿的权重矩阵，利用该权重矩阵对预增强的语谱和原始输入的语谱进行融合；所述联合训练模块，与预增强模块和语谱补偿模块相连接，用于联合训练和优化预增强模块与语谱补偿模块。本发明专利技术的基于语谱补偿的单通道语音增强系统，具有能够在嘈杂的背景环境中保持增强后的语音有较高的音质、语音清晰、可懂等优点。可懂等优点。可懂等优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语谱补偿的单通道语音增强系统

[0001]本专利技术涉及测距
，特别是涉及一种基于语谱补偿的单通道语音增强系统。

技术介绍

[0002]语音作为人类交流信息的主要手段之一，语音增强一直在语音信号处理中占据着重要的地位。语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术。
[0003]实际语音遇到的干扰可以分以下几类：
①
周期性噪声，例如电气干扰，发动机旋转部分引起的干扰等，这类干扰表现为一些离散的窄频峰；
②
冲激噪声，例如
‑
些电火花、放电产生的噪声干扰；
③
宽带噪声，这是指高斯噪声或白噪声一类的噪声，它们的特点是频带宽，几乎覆盖整个语音频带；
④
语音干扰，例如话筒中拾入其它人的说话，或者传输时遇到串音引起的语音。对付上述各种不同类型的噪声，增强技术亦是不一样的。
[0004]语音增强技术的目标是从嘈杂的环境中，将目标干净语音分离出来，去除背景干扰噪声。当一段语音中含有背景噪音，会严重影响语音识别、说话人识别和助听器等系统的性能，因此语音增强技术就显得尤其重要。
[0005]在语音增强技术的发展过程中，早期的研究主要是采用基于谱减法、维纳滤波和基于统计的方法等。但是，这些方法对于非平稳噪声效果十分有限，因此也制约着这些方法的应用。近年来，随着计算机技术的发展，基于深度学习的语音增强方法得到了很大的发展，受到了越来越多人的关注。r/>[0006]基于深度学习的语音增强方法利用大量成对的带噪
‑
干净语音数据训练语音增强模型，建立带噪语音特征参数和目标干净语音信号特征参数之间的映射关系，这样对于任意输入的带噪语音信号都可以通过建立的增强模型来输出降噪后的语音信号，从而达到语音增强的目的。采用基于深度学习建模的语音增强方法与传统的方法具有很多优点，比如利用深度学习强大的建模能力，可以很好的学习到带噪语音和目标语音信号之间的映射关系。但是，对于语音增强来说，其最大的问题是增强后的语音存在失真问题。语音失真会丢失很多十分重要的语音信息，严重影响增强后的语音感知质量和可懂度，制约着语音增强的性能。

技术实现思路

[0007]本专利技术所要解决的技术问题是提供一种基于语谱补偿的单通道语音增强系统，以在嘈杂的背景环境中获得清晰、可懂、音质更好的语音。
[0008]为解决上述技术问题，本专利技术采用如下的技术方案。
[0009]一种基于语谱补偿的单通道语音增强系统，包括预增强模块，语谱补偿模块和联合训练模块；
[0010]所述预增强模块，用于去除语音中的部分干扰信号；
[0011]所述语谱补偿模块，与所述预增强模块相连接，用于获取语谱补偿的权重矩阵λ，利用该权重矩阵λ对预增强的语谱和原始输入的语谱进行融合；
[0012]所述联合训练模块，与预增强模块和语谱补偿模块相连接，用于联合训练和优化预增强模块与语谱补偿模块。
[0013]本专利技术的基于语谱补偿的单通道语音增强系统，其结构特征还在于：
[0014]优选地，所述预增强模块为利用深度神经网络训练的语音分离系统。
[0015]优选地，所述预增强模块的输出包括预增强的掩蔽值
[0016]优选地，通过所述掩蔽值计算得到估计的目标干净语音的幅值谱
[0017]优选地，所述语谱补偿模块利用预增强模块产生的输入获得权重矩阵λ。
[0018]优选地，根据所述权重矩阵λ计算获得最终语谱补偿后的语谱
[0019]优选地，根据最终语谱补偿后的语谱计算获得时域上的增强后的语音信号
[0020]优选地，所述语谱补偿模块的输入包括预增强目标函数
[0021]优选地，所述语谱补偿模块的输入包括语谱补偿目标函数J
SI
‑
SNR
。
[0022]优选地，根据所述预增强目标函数和所述语谱补偿目标函数J
SI
‑
SNR
计算总的训练目标函数J的计算公式为：
[0023][0024]其中，α表示预增强模块和语谱补偿模块的权重。
[0025]本专利技术的有益效果是：
[0026]本专利技术的一种基于语谱补偿的单通道语音增强系统，包括预增强模块，语谱补偿模块和联合训练模块；所述预增强模块，用于去除语音中的部分干扰信号；所述语谱补偿模块，与所述预增强模块相连接，用于获取语谱补偿的权重矩阵，利用该权重矩阵对预增强的语谱和原始输入的语谱进行融合；所述联合训练模块，与预增强模块和语谱补偿模块相连接，用于联合训练和优化预增强模块与语谱补偿模块。
[0027]本专利技术基于语谱补偿的单通道语音增强系统具有以下有益效果：
[0028](1)本专利技术中，在预增强模块，利用深度神经网络对于包含噪声的语音进行预增强，以去除大部分的背景噪声，从而实现对输入语音信号预增强的目的；
[0029](2)本专利技术中，由于预增强模块会产生语音失真进而丢失重要的语音信息，为了找回丢失的信息解决语音失真的问题，在语谱补偿模块，首先估计出语谱补偿的权重矩阵，利用该矩阵对预增强的语谱和原始输入的语谱进行融合，进而实现语谱补偿并对预增强的语音进一步增强的作用；
[0030](3)本专利技术中，在联合训练模块，采用联合优化预增强模块与语谱补偿模块，可以在保证预增强性能的同时提升谱补偿后语音的质量。因此，分离后的语音比单独基于深度学习的方法更加清晰、可懂，音质更好。
[0031]本专利技术的基于语谱补偿的单通道语音增强系统，具有能够在嘈杂的背景环境中保持增强后的语音有较高的音质、语音清晰、可懂等优点。
附图说明
[0032]图1是本专利技术的基于语谱补偿的单通道语音增强系统的结构示意图；
[0033]图2是本专利技术的基于语谱补偿的单通道语音增强系统中预增强模块的结构示意图；
[0034]图3是本专利技术的基于语谱补偿的单通道语音增强系统中语谱补偿模块的结构示意图；
[0035]图4是本专利技术的基于语谱补偿的单通道语音增强系统中联合训练模块的结构示意图。
具体实施方式
[0036]下面结合附图对本专利技术的较佳实施例进行详细阐述，，使本专利技术的目的、技术方案和优点更加清楚明白，使本专利技术的优点和特征能更易于被本领域技术人员理解，从而对本专利技术的保护范围做出更为清楚明确的界定。以下结合具体实施例，并参照附图，对本专利技术进一步详细说明。
[0037]需要说明的是，在附图或说明书描述中，相似或相同的部分都使用相同的图号。且在附图中，以简化或是方便标示。再者，附图中未绘示或描述的实现方式，为所属
中普通技术人员所知的形式。另外，虽然本文可提供包含特定值的参数的示范，但应了解，参数无需确切等于相应的值，而是可在可接受的误差容限或设计约束内近似于相应的值。
[0038]如图1
‑
4，本专利技术的一种基于语谱补偿的单本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于语谱补偿的单通道语音增强系统，其特征在于，包括预增强模块，语谱补偿模块和联合训练模块；所述预增强模块，用于去除语音中的部分干扰信号；所述语谱补偿模块，与所述预增强模块相连接，用于获取语谱补偿的权重矩阵λ，利用该权重矩阵λ对预增强的语谱和原始输入的语谱进行融合；所述联合训练模块，与预增强模块和语谱补偿模块相连接，用于联合训练和优化预增强模块与语谱补偿模块。2.根据权利要求1所述的基于语谱补偿的单通道语音增强系统，其特征在于，所述预增强模块为利用深度神经网络训练的语音分离系统。3.根据权利要求1所述的基于语谱补偿的单通道语音增强系统，其特征在于，所述预增强模块的输出包括预增强的掩蔽值4.根据权利要求3所述的基于语谱补偿的单通道语音增强系统，其特征在于，通过所述掩蔽值计算得到估计的目标干净语音的幅值谱5.根据权利要求1所述的基于语谱补偿的单通道语音增强系统，其特征在于，所述语谱补偿模块利用预增强模块产生的输入获...

【专利技术属性】
技术研发人员：范存航，吕钊，
申请(专利权)人：安徽大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人