【技术实现步骤摘要】
本专利技术涉及语音增强技术,尤其涉及一种基于增强注意力双路径卷积循环网络的语音增强方法及设备。
技术介绍
1、语音增强是信号处理领域中的一项关键技术,旨在从噪声污染的语音信号中恢复出纯净的语音信号。这项技术对于改善语音通信质量、提高自动语音识别系统的准确性以及提升助听设备的效能等方面都具有重要意义。根据输入输出的不同,可以将其分为:基于频域的语音增强技术、基于时域的语音增强技术。而基于频域的语音增强技术又可以分为:基于短时傅里叶变换的语音增强技术、基于短时离散余弦变换的语音增强技术。
2、神经网络是一种有效的技术。近年来,卷积神经网络、循环神经网络、长短期记忆网络、注意力机制等被广泛应用于语音增强领域。然而,卷积神经网络主要捕捉局部信息,对上下文信息的理解能力不足;传统长短时记忆网络能很好地学习时间依赖性,但无法有效提取频点信息;注意力机制能提高网络的信息提取能力,但会引入额外的参数,增加额外计算。这些问题都会限制语音增强技术的进一步应用,因此,语音增强领域仍需要开展大量、深入的研究,从而满足日益增长的高质量语音的需求。
...【技术保护点】
1.一种基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述步骤2具体包括:
3.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述编码器模块包括特征重塑子模块和特征处理子模块组成,所述特征重塑子模块和所述特征处理子模块结构相同,均包括依次连接的卷积层、批归一化层和PReLU激活函数,卷积层参数不同。
4.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述
...【技术特征摘要】
1.一种基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述步骤2具体包括:
3.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述编码器模块包括特征重塑子模块和特征处理子模块组成,所述特征重塑子模块和所述特征处理子模块结构相同,均包括依次连接的卷积层、批归一化层和prelu激活函数,卷积层参数不同。
4.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述simam注意力模块具体为能量函数。
5.根据权利要求1所述的基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于:所述双路径长短时记忆模块包括帧内双向循环网络和帧间单向循环网络,所述帧内双向循环网络包括依次连接的双向循环神经网络、全连接层、层归一化,所述帧间单向循环网络包括依次连接的单向循环神经网络、全连接层、层归一化;所述帧内双向循环网络与帧间单向循环网络之间进行残差连接。
6.根据权利要求3所述的基于增强注意力双路径卷积循环网...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。