一种改进的语音增强方法、系统、介质、设备及终端技术方案

技术编号:37982257 阅读:20 留言:0更新日期:2023-06-30 09:57
本发明专利技术属于语音降噪技术领域,公开了一种改进的语音增强方法、系统、介质、设备及终端,采集语音数据集并将语音数据集划分为训练集、测试集和验证集;将Wave

【技术实现步骤摘要】
一种改进的语音增强方法、系统、介质、设备及终端


[0001]本专利技术属于语音降噪
,尤其涉及一种改进的语音增强方法、系统、介质、设备及终端。

技术介绍

[0002]语音增强的主要目标是从带噪语音中提取原始语音信号,通过抑制或分离噪声来提高语音感知质量和可懂度,在语音信号通信、安全监听、助听器和自动语音识别等领域有着广泛的应用。
[0003]常见的语音增强算法可以分为传统的语音增强算法和基于机器学习的语音增强算法。传统的语音增强算法主要包括谱减法、维纳滤波法和子空间算法等。但是,传统的语音增强方法需要假设,对于平稳噪声去噪效果好,对于非平稳噪声去噪效果不佳。而深度学习的兴起也使得神经网络模型开始被广泛应用于语音增强任务中,但目前已有的大多数方法应用时需要将时域波形变换到频域的幅度谱或功率谱,这样往往会忽略掉语音信号中的相位信息。同时,现有语音增强模型对已训练的噪声去噪效果好,未训练的去噪效果不好;而传统CNN无法高效捕获全局特征。因此,亟需设计一种新的语音增强方法及系统。
[0004]通过上述分析,现有技术存在的问题及缺陷本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种改进的语音增强方法,其特征在于,包括:采集语音数据集并将语音数据集划分为训练集、测试集和验证集;将Wave

U

Net模型层数减少、融合LSTM网络,改变内部特征融合方法,并在模型前后加入形似U

Net的编解码器得到改进后的Wave

U

Net模型用于执行语音增强任务;使用训练集和验证集对构建的语音增强模型进行训练;将测试集作为待增强语音信号输入训练完成后的语音增强模型,得到增强后的语音信号。2.如权利要求1所述改进的语音增强方法,其特征在于,改进的语音增强方法包括以下步骤:步骤一,采集原始的干净语音数据集和带噪语音数据集,并将语音数据集分为训练集、测试集和验证集;步骤二,对传统的Wave

U

Net模型进行改进,构建得到用于执行语音增强任务的语音增强模型;步骤三,使用步骤一中的训练集和验证集对步骤二中构建的语音增强模型进行训练;步骤四,将步骤一中的测试集作为待增强语音信号输入训练完成后的语音增强模型,得到增强后的语音信号。3.如权利要求2所述改进的语音增强方法,其特征在于,步骤二中的语音增强模型的构建包括:获取经典的Wave

U

Net网络,在Wave

U

Net网络前后加入形似U

Net的编解码器结构,对语音信号进行预去噪;将Wave

U

Net网络的层数从十二层减少至十层;将Wave

U

Net网络的下采样模块的第一、二层与LSTM模块进行融合,用于提取更多的语音信号序列的局部特征;将Wave

U

Net网络融合每层上下采样特征的concat方法改为add方法。4.如权利要求2所述改进的语音增强方法,其特征在于,基于Wave

U

Net改进的语音增强模型包括依次相连的编码模块、改进的Wave

U

Net模块和解码模块;其中,编码模块采用形似U

Net的编码结构,包含三个编码层,编码模块的输入为一段时域语音信号;每个编码层均包括:一个卷积核大小为K,步长为S,输出通道为2
j
‑1H的一维卷积层,j表示层数;一个ReLu函数激活层;一个卷积核大小为1、步长为1、输出通道为2
j
H的一维卷积层。5.如权利要求2所述改进的语音增强方法,其特征在于,改进的Wave

U

Net模块是对称的网络结构,包含左侧的10层下采样块和右侧的10层上采样块;其中,下采样模块是一个抽取操作,每层下采样块将特征映射的维度减半,并在前两层下采样块中加入LSTM块;在上采样模块中,Wave

U

Net使用线性插值和转置卷积组合;除上采样部分的最后一层外,所有层均包含LeakyReLu层,最后一层包含一个Tanh激活层;向下采样块在较长的时间尺度上计算越来越多的高级特征,高级特征与向上采样块计算出的局部高分辨率特征利用add方法相结合,产生用于预测的多尺度特征;其中,融合的LSTM模块是一种特殊类型的RNN,包含一个记忆单元,在...

【专利技术属性】
技术研发人员:乔思诺伍忠东郑礼汤春阳王鹏程陈志浩张卓
申请(专利权)人:兰州交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1