【技术实现步骤摘要】
本专利技术涉及语音增强技术,尤其涉及一种基于时频-相位联合感知与cbam(convolutional block attention module,卷积块注意力)机制的单通道语音增强方法及设备。
技术介绍
1、语音增强技术旨在通过分离含噪语音信号中的目标语音与背景噪声,实现噪声抑制与语音质量提升。在移动终端设备(如智能手机、平板电脑)中,该技术可有效消除麦克风采集的混响干扰,保障语音通信清晰度;在助听器应用中,能够补偿患者的听觉感知缺陷,辅助正常言语交流;在智能客服质检系统中,可抑制环境噪声以提升语音识别精度;在军事领域,则用于消除复杂环境下的突发性干扰,确保关键语音指令的可靠传输。由此可见,语音增强技术已深度融入移动通信、医疗辅助、工业检测及国防应用等多个领域,成为现代语音系统的核心模块。
2、传统基于变换域与深度学习的语音增强方法通常仅对语音幅度谱进行建模,并直接利用含噪语音相位进行时域信号重构,导致增强性能受限。当前主流的时频域联合建模方法主要分为两类:基于复数域的方法以及基于幅度和相位的双路建模方法。然而,此类方法因
...【技术保护点】
1.一种基于时频-相位联合感知与CBAM注意力机制的单通道语音增强方法,其特征在于,包括:
2.根据权利要求1所述的基于时频-相位联合感知与CBAM注意力机制的单通道语音增强方法,其特征在于:所述编码器包括若干依次连接的卷积注意力模块,每个卷积注意力模块包括依次连接的二维卷积层、批归一化层、随机失活Dropout层、LeakyRELU激活函数和自注意力记忆单元,所述自注意力记忆单元包括依次连接的自注意力网络和深度前馈序列记忆网络。
3.根据权利要求1所述的基于时频-相位联合感知与CBAM注意力机制的单通道语音增强方法,其特征在于:所述第一CBA
...【技术特征摘要】
1.一种基于时频-相位联合感知与cbam注意力机制的单通道语音增强方法,其特征在于,包括:
2.根据权利要求1所述的基于时频-相位联合感知与cbam注意力机制的单通道语音增强方法,其特征在于:所述编码器包括若干依次连接的卷积注意力模块,每个卷积注意力模块包括依次连接的二维卷积层、批归一化层、随机失活dropout层、leakyrelu激活函数和自注意力记忆单元,所述自注意力记忆单元包括依次连接的自注意力网络和深度前馈序列记忆网络。
3.根据权利要求1所述的基于时频-相位联合感知与cbam注意力机制的单通道语音增强方法,其特征在于:所述第一cbam注意力模块由通道注意力模块和空间注意力模块级联而成,所述通道注意力模块包括依次连接的最大池化层、平均池化层、多层感知机和sigmoid激活函数,所述空间注意力模块包括依次连接的平均池化层、最大池化层、二维卷积层及sigmoid激活函数。
4.根据权利要求1所述的基于时频-相位联合感知与cbam注意力机制的单通道语音增强方法,其特征在于:所述第二cbam注意力模块与所述第一cbam注意力模块结构相同。
5.根据权利要求1所述的基于时频-相位联合感知与cbam注意力机制的单通道语音增强方法,其特征在...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。