当前位置: 首页 > 专利查询>东南大学专利>正文

基于增强注意力双路径卷积循环网络的语音增强方法及设备技术

技术编号:43229621 阅读:19 留言:0更新日期:2024-11-05 17:18
本发明专利技术公开了一种基于增强注意力双路径卷积循环网络的语音增强方法及设备,方法包括:对含噪训练语音信号进行分帧、加窗处理,计算改进离散余弦变换谱图;构建增强注意力双路径卷积循环网络,由编码器模块、SimAM注意力块、双路径长短时记忆模块、解码器模块和hardtanh函数映射模块组成;将含噪训练语音的改进离散余弦变换谱图、纯净语音分别作为该网络的输入特征和标签,基于组合损失函数训练该增强注意力双路径卷积循环网络;将含噪测试语音信号的改进离散余弦变换谱图作为输入特征,增强注意力双路径卷积循环网络估计对应纯净语音的改进余弦变换谱图,逆变换后得到时域的增强语音。本发明专利技术实现了在较小参数量和计算量情况下获得了更好的感知语音质量。

【技术实现步骤摘要】

本专利技术涉及语音增强技术,尤其涉及一种基于增强注意力双路径卷积循环网络的语音增强方法及设备


技术介绍

1、语音增强是信号处理领域中的一项关键技术,旨在从噪声污染的语音信号中恢复出纯净的语音信号。这项技术对于改善语音通信质量、提高自动语音识别系统的准确性以及提升助听设备的效能等方面都具有重要意义。根据输入输出的不同,可以将其分为:基于频域的语音增强技术、基于时域的语音增强技术。而基于频域的语音增强技术又可以分为:基于短时傅里叶变换的语音增强技术、基于短时离散余弦变换的语音增强技术。

2、神经网络是一种有效的技术。近年来,卷积神经网络、循环神经网络、长短期记忆网络、注意力机制等被广泛应用于语音增强领域。然而,卷积神经网络主要捕捉局部信息,对上下文信息的理解能力不足;传统长短时记忆网络能很好地学习时间依赖性,但无法有效提取频点信息;注意力机制能提高网络的信息提取能力,但会引入额外的参数,增加额外计算。这些问题都会限制语音增强技术的进一步应用,因此,语音增强领域仍需要开展大量、深入的研究,从而满足日益增长的高质量语音的需求。p>

本文档来自技高网...

【技术保护点】

1.一种基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述步骤2具体包括:

3.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述编码器模块包括特征重塑子模块和特征处理子模块组成,所述特征重塑子模块和所述特征处理子模块结构相同,均包括依次连接的卷积层、批归一化层和PReLU激活函数,卷积层参数不同。

4.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述SimAM注意力模块...

【技术特征摘要】

1.一种基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述步骤2具体包括:

3.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述编码器模块包括特征重塑子模块和特征处理子模块组成,所述特征重塑子模块和所述特征处理子模块结构相同,均包括依次连接的卷积层、批归一化层和prelu激活函数,卷积层参数不同。

4.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述simam注意力模块具体为能量函数。

5.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述双路径长短时记忆模块包括帧内双向循环网络和帧间单向循环网络,所述帧内双向循环网络包括依次连接的双向循环神经网络、全连接层、层归一化,所述帧间单向循环网络包括依次连接的单向循环神经网络、全连接层、层归一化;所述帧内双向循环网络与帧间单向循环网络之间进行残差连接。

6.根据权利要求3所述的基于增强注意力双路径卷积循环网...

【专利技术属性】
技术研发人员:包浩辰周琳杨云雁闫桐嘉
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1