当前位置: 首页 > 专利查询>苏州大学专利>正文

一种基于时域神经网络的单通道语音回声消除方法技术

技术编号:42242757 阅读:31 留言:0更新日期:2024-08-02 13:54
本发明专利技术公开了一种基于时域神经网络的单通道语音回声消除方法,涉及回声消除技术领域,包括对采集麦克风信号进行分帧和数值归一化,提取时域帧序列特征,建立并训练时域神经网络模型;将采集麦克风信号输入至时域神经网络模型进行性能分析,并通过U‑Net编解码处理,输出回声消除后的语音序列。本发明专利技术通过提取一致的时域特征,提高神经网络的训练效率和稳定性;构建并训练基于Wave‑U‑Net架构的时域神经网络,通过分组卷积和注意力机制,增强回声消除的效果和适应复杂环境的能力;将信号输入模型进行性能分析,并通过U‑Net的U型编解码结构进行特征提取和重构,利用跳跃连接保留特征信息,实现高效回声消除和语音重构,提高语音清晰度和自然度。

【技术实现步骤摘要】

本专利技术涉及回声消除,特别是一种基于时域神经网络的单通道语音回声消除方法


技术介绍

1、在当今通信技术飞速发展的背景下,电子通信设备已经成为我们生活和工作中不可或缺的一部分,而双向通信平台如zoom、skype和腾讯会议则极大地提升了沟通效率和便利性。然而,随着通信技术的普及和使用频率的增加,用户对通话质量的要求也随之提高,其中语音通信质量成为关键因素之一。在双端通话中,声学回声问题尤为突出,不仅干扰正常沟通,而且严重影响通话清晰度,尤其在免提模式下更为明显。

2、为了解决这一问题,声学回声消除技术应运而生。该技术旨在识别并消除通话中的回声,从而提高通话质量。虽然声学回声消除技术已取得显著进展,但在实际应用中,如何有效消除回声、处理背景噪声和非线性失真,以及实现实时回声消除仍是关键挑战。因此,研究和开发更高效、更稳定、适应性更强的声学回声消除解决方案成为通信
的重要研究方向之一。

3、在此背景下,提出了一种基于时域神经网络的单通道语音回声消除方法。该方法利用神经网络在时域上对语音信号进行处理,以识别和消除回声,从而提高通话本文档来自技高网...

【技术保护点】

1.一种基于时域神经网络的单通道语音回声消除方法,其特征在于:包括,

2.如权利要求1所述的基于时域神经网络的单通道语音回声消除方法,其特征在于:所述注意力融合机制包括以下步骤:

3.如权利要求2所述的基于时域神经网络的单通道语音回声消除方法,其特征在于:所述时域神经网络模型包括编码器、辅助编码器和解码器,其中编码器和辅助编码器相同,均包括一维卷积层、批归一化层、ELU激活函数以及高分辨率特征提取模块;所述编码器包括下采样层和瓶颈层;所述解码器包括上采样层和输出层。

4.如权利要求3所述的基于时域神经网络的单通道语音回声消除方法,其特征在于:所述下采样...

【技术特征摘要】

1.一种基于时域神经网络的单通道语音回声消除方法,其特征在于:包括,

2.如权利要求1所述的基于时域神经网络的单通道语音回声消除方法,其特征在于:所述注意力融合机制包括以下步骤:

3.如权利要求2所述的基于时域神经网络的单通道语音回声消除方法,其特征在于:所述时域神经网络模型包括编码器、辅助编码器和解码器,其中编码器和辅助编码器相同,均包括一维卷积层、批归一化层、elu激活函数以及高分辨率特征提取模块;所述编码器包括下采样层和瓶颈层;所述解码器包括上采样层和输出层。

4.如权利要求3所述的基于时域神经网络的单通道语音回声消除方法,其特征在于:所述下采样层通过对输出的三维张量,将输出的三维张量在第三维中按步长为2进行间隔取样;所述上采样层通过对输出的三维张量,沿着第三维度扩大两倍,并使用线...

【专利技术属性】
技术研发人员:芮贤义徐新海俞一彪
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1