一种全局多头注意力语音增强方法技术

技术编号：37706253 阅读：12 留言：0更新日期：2023-06-01 23:55

本发明专利技术公开了一种全局多头注意力语音增强方法，涉及生成对抗网络领域，包括将含噪音频信号输入至生成器编码器卷积得到卷积特征图谱；将卷积特征图谱输入至全局多头注意力层得到全局多头注意力特征图谱；将全局多头注意力特征图谱输入至生成器编码器得到卷积

全部详细技术资料下载

【技术实现步骤摘要】
一种全局多头注意力语音增强方法

[0001]本专利技术涉及生成对抗网络领域，更具体地说，涉及一种全局多头注意力语音增强方法。

技术介绍

[0002]近年来，基于生成对抗网络(GANs)的语音增强方法被提出，通过直接向网络中输入波形来实现端到端语音增强。然而，现有的语音增强GAN完全依赖于卷积操作，这可能会掩盖序列输入的时间依赖性。

技术实现思路

[0003]本专利技术要解决的技术问题是提供一种全局多头注意力语音增强方法，以解决
技术介绍
中提到的问题。
[0004]为了达到上述目的，本专利技术采取以下技术方案：一种全局多头注意力语音增强方法，包括如下步骤：步骤一：获取含噪音频信号；步骤二：将含噪音频信号输入至生成器编码器经过若干层卷积后得到卷积特征图谱；步骤三：将步骤二得到的卷积特征图谱输入至全局多头注意力层，得到全局多头注意力特征图谱；步骤四：将步骤三得到的全局多头注意力特征图谱输入至生成器编码器，经过若干层卷积后得到卷积
‑
全局多头注意力
‑
卷积特征图谱；步骤五：将步骤四得到的卷积
‑
全局多头注意力
‑
卷积特征图谱与从高斯分布中采样的随机噪声z叠加，然后输入至生成器解码器，经过若干层反卷积后，得到反卷积特征图谱；步骤六：将步骤五得到的反卷积特征图谱输入至全局多头注意力层，得到解码
‑
全局多头注意力特征图谱；步骤七：将步骤六得到的解码
‑
全局多头注意力特征图谱输入至生成器解码器，经过若干层...

【技术保护点】

【技术特征摘要】
1.一种全局多头注意力语音增强方法，其特征在于，包括如下步骤：步骤一：获取含噪音频信号；步骤二：将含噪音频信号输入至生成器编码器经过若干层卷积后得到卷积特征图谱；步骤三：将步骤二得到的卷积特征图谱输入至全局多头注意力层，得到全局多头注意力特征图谱；步骤四：将步骤三得到的全局多头注意力特征图谱输入至生成器编码器，经过若干层卷积后得到卷积
‑
全局多头注意力
‑
卷积特征图谱；步骤五：将步骤四得到的卷积
‑
全局多头注意力
‑
卷积特征图谱与从高斯分布中采样的随机噪声z叠加，然后输入至生成器解码器，经过若干层反卷积后，得到反卷积特征图谱；步骤六：将步骤五得到的反卷积特征图谱输入至全局多头注意力层，得到解码
‑
全局多头注意力特征图谱；步骤七：将步骤六得到的解码
‑
全局多头注意力特征图谱输入至生成器解码器，经过若干层反卷积后，得到增强后的音频信号。2.根据权利要求1所述全局多头注意力语音增强方法，其特征在于，步骤三包括第一前置步骤：获取卷积特征图谱的查询矩阵、键矩阵和值矩阵，其中N=1、2，N表示头的数量。3.根据权利要求2所述全局多头注意力语音增强方法，其特征在于，步骤三还包括第二前置步骤：计算全局多头注意力的权重矩阵：其中N=1、2，表示头的数量,Softmax表示归一化指数函数；T表示向量或矩阵的转置。4.根据权利要求3所...

【专利技术属性】
技术研发人员：楚明航，王靖，马瑶瑶，黄玉玲，杨梦涛，范智玮，徐超，吴迪，
申请(专利权)人：苏州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人