一种单通道语音回声消除方法和装置制造方法及图纸

技术编号：37194776 阅读：9 留言：0更新日期：2023-04-20 22:54

本发明专利技术公开了一种单通道语音回声消除方法和装置，其中所述方法包括：对采集的近端时域信号和远端时域信号进行傅里叶变换获得近端频域信号和远端频域信号并提取信号特征；对频域信号特征拼接后输入至全频带模型，全频带频模型包括2个GRU层、1个全连接层和1个ReLU层；对近端频域信号特征划分子频带，将近端频域信号特征子频带划分结果与全频带模型的输出信号特征拼接后输入至子频带模型，子频带模型包括2个GRU层和1个全连接层；对子频带模型输出结果优化计算后输出语音时域信号。本发明专利技术回声消除方案基于GRU构建全频带和子频带模型并考虑频点间相关性，性能消耗低，可以实时运行于本地设备。行于本地设备。行于本地设备。

全部详细技术资料下载

【技术实现步骤摘要】
一种单通道语音回声消除方法和装置

[0001]本说明书涉及音频处理
，尤其涉及一种单通道语音回声消除方法、装置、电子设备和存储介质。

技术介绍

[0002]在远程音视频会议通信系统中，当麦克风与扬声器存在耦合时，麦克风将扬声器产生的语音信号重新采集并通过通信系统传送至对端，导致对端听到自己的声音即为回声，回声问题严重影响会议系统的通话质量，回声消除技术对于高质量的音视频通讯具有重要意义。回声消除是在不损伤近端语音的情况下将采集到的远端信号进行消除，只发送近端语音信号给远端。传统的基于传统信号处理的回声消除方法在实际应用中面临非线性回声消除效果不好以及双讲情况下近端语音损伤的问题；近来，基于深度神经网络的回声消除算法虽然取得了较好处理效果，但是由于模型较为复杂、模型规模较大且未考虑频点间相关性，应用于实际的远程音视频会议系统中仍有诸多性能待提升。因此，如何在深度神经网络方法基础上提出具有性能消耗低、模型规模小的回声消除技术，是亟待解决的技术问题。

技术实现思路

[0003]本说明书实施例的目的是针对上述问题，提供一种单通道语音回声消除方法、装置、电子设备和存储介质。
[0004]为解决上述技术问题，本说明书实施例是这样实现的：第一方面，提出一种单通道语音回声消除方法，包括：对近端麦克采集的近端时域信号和远端时域信号分别进行傅里叶变换获得近端频域信号和远端频域信号，以及分别对所述近端频域信号和所述远端频域信号提取信号特征，得到近端频域信号特征和远端频域信号特征；对所述近端频域信号特征和所述远...

【技术保护点】

【技术特征摘要】
1.一种单通道语音回声消除方法，其特征在于，包括：对近端麦克采集的近端时域信号和远端时域信号分别进行傅里叶变换获得近端频域信号和远端频域信号，以及分别对所述近端频域信号和所述远端频域信号提取信号特征，得到近端频域信号特征和远端频域信号特征；对所述近端频域信号特征和所述远端频域信号特征进行拼接后输入至全频带模型，所述全频带模型至少包括2个GRU层、1个全连接层和1个ReLU层；对所述近端频域信号特征进行子频带划分，并将所述近端频域信号特征子频带划分结果与所述全频带模型的输出信号特征进行拼接后输入至子频带模型，所述子频带模型至少包括2个GRU层和1个全连接层；对所述子频带模型输出结果进行优化计算后输出语音时域信号。2.根据权利要求1所述的单通道语音回声消除方法，其特征在于，对近端麦克采集的近端时域信号和远端时域信号分别进行傅里叶变换获得近端频域信号和远端频域信号，以及分别对所述近端频域信号和所述远端频域信号提取信号特征的过程，包括：分别对所述近端时域信号和所述远端时域信号进行傅里叶变换：，；其中，所述傅里叶变换点数为512；获取所述近端频域信号的幅度和所述远端频域信号幅度；计算输出所述近端频域信号特征和所述远端频域信号特征，所述近端频域信号特征和所述远端频域信号特征分别包括257个频点。3.根据权利要求2所述的单通道语音回声消除方法，其特征在于，对所述近端频域信号特征和所述远端频域信号特征进行拼接后输入至全频带模型的工作过程，包括：拼接所述近端频域信号特征和所述远端频域信号特征形成第一拼接频域信号特征，所述第一拼接频域信号特征包括514个频点；将所述第一拼接频域信号特征输入所述全频带模型并依次通过所述GRU层、所述全连接层和所述ReLU层计算获得第一频域信号特征；其中，所述GRU层节点数为32，所述全连接层节点数为257，所述第一频域信号特征包括257个频点；输出所述第一频域信号特征。4.根据权利要求1所述的单通道语音回声消除方法，其特征在于，对所述近端频域信号特征进行子频带划分的过程，包括：在当前频点前后分别选取连续个频点，构成长度为的子频带；若当前频点前后频点数不足个时，采用环形循环方式选取频点构成子频带；将全部频点对应的所述子频带构成近端频域子频带频点信息矩阵。
5.根据权利要求3或4所述的单通道语音回声消除方法，其特征在于，将所述近端频域信号特征子频带划分结果与所述全频带模型的输出信号特征进行拼接后输入至子频带模...

【专利技术属性】
技术研发人员：杨亮，
申请(专利权)人：全时云商务服务股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人