一种基于循环生成对抗网络的骨导语音增强方法技术

技术编号：38993431 阅读：5 留言：0更新日期：2023-10-07 10:24

本发明专利技术公开了一种基于循环生成对抗网络的骨导语音增强方法，具体包括：在训练阶段提取骨导语音和相应气导语音的梅尔倒谱系数送入构建好的循环生成对抗网络进行训练，保存训练好的循环生成对抗网络中生成器的网络参数。在应用阶段将待增强的的骨导语音信号利用WORLD声码器提取基频，梅尔倒谱系数和非周期性参数等三种特征，利用训练阶段完成后保存的生成器网络参数构建特征映射模型，将其中的梅尔倒谱系数输入训练好的神经网络模型进行映射，将映射后的梅尔倒谱系数与骨导语音的基频和非周期性参数特征经WORLD声码器的语音合成功能获得增强后的骨导语音。功能获得增强后的骨导语音。功能获得增强后的骨导语音。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于循环生成对抗网络的骨导语音增强方法

[0001]本专利技术涉及语音信号处理和深度学习领域，属于基于深度学习的语音增强方法，具体为一种基于循环生成对抗网络的骨导语音增强方法，用于对骨导语音进行增强，便于使用骨导设备进行通信。

技术介绍

[0002]骨导语音与外界环境隔离，对噪声有较好的鲁棒性。但是骨导语音带宽有限，高频部分严重缺失，使得骨导语音听起来很沉闷。骨导语音在一些噪声环境中可以很好地发挥作用，因此单独增强骨导语音来弥补其清晰度的不足是有意义的。骨导语音增强方面常用的思想是基于源
‑
滤波器模型的谱包络映射。在深度学习技术被广泛应用之前常用的方法是基于高斯混合模型的方法。近年来，深度学习在信号处理领域崭露头角。随着深度学习在语音处理中的发展和应用，实现骨导语音和气导语音之间复杂而详细的频谱映射成为可能。源滤波器模型的理论认为一段语音信号等同于一个声源信号经过一个滤波器后得到，声源就是肺部气流和声带的共同作用下形成的激励，至于声源信号经过的部位如声道口腔等就相当于一个滤波器，骨导语音和气导语音可以认为是相同的激励通过不同的传播路径和方式所产生，也即声源相同而声源信号经过的滤波器不同。
[0003]与本专利技术相关的现有技术如下：
[0004]现有技术方案一：由郑昌艳等人发表的“一种基于深度双向长短期记忆循环神经网络(BLSTM)的喉传声器语音增强框架”文章中。首先训练一个BLSTM型网络用于骨导语音到与之对应的气导语音之间的幅度谱映射，在应用模型的时候将骨导语音进行短时傅里叶...

【技术保护点】

【技术特征摘要】
1.一种基于循环生成对抗网络的骨导语音增强方法，其特征在于包括：获取音频数据，利用声码器对音频数据中的骨导语音和气导语音进行特征提取，将提取的梅尔倒谱系数作为训练数据；构建循环生成对抗网络；将训练数据输入至循环生成对抗网络中进行训练，根据模型输出的梅尔倒谱系数和上述提取的梅尔倒谱系数之间的误差设计损失函数，将完成训练的循环生成对抗网络用于应用过程；应用过程中：采用声码器提取需要增强的骨导语音梅尔倒谱系数、基频信息和非周期性参数信息；构建特征映射模型，将待增强的骨导语音的梅尔倒谱系数映射为增强后的梅尔倒谱系数；将提取的骨导语音的基频信息、非周期性参数信息和获得的增强梅尔倒谱系数通过声码器合成增强后的骨导语音。2.根据权利要求1所述的方法，其特征是在于：采用WORLD声码器的内置功能函数提取出音频数据集中所有的骨导语音和相对应的气导语音的梅尔倒谱系数。3.根据权利要求2所述的方法，其特征是在于：构建循环生成对抗网络时：利用卷积层、距离标准化层以及门控线性单元层搭建循环生成对抗网络，所述循环生成对抗网络包括生成器网络和鉴别器网络，使用正态分布随机数对循环生成对抗网络参数进行...

【专利技术属性】
技术研发人员：陈喆，殷福亮，王伟，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人