一种回声路径延迟估计方法及装置制造方法及图纸

技术编号：24358022 阅读：64 留言：0更新日期：2020-06-03 02:59

本发明专利技术公开了一种回声路径延迟估计方法及装置，回声路径延迟估计装置通过执行回声路径延迟估计方法，包括：对输入信号进行预处理获取预处理后的语音信号；对预处理后的语音信号进行时频转换获取频域信号；获取所述频域信号的特征参数，其中，所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值；将所述特征参数输入所述深度学习回声路径延迟估计模型，获取回声路径的延迟估计值。从而解决现有技术中存在的现有的回声消除算法中的回声路径延迟估计方法具有局限性，无法适用于不同的回声环境的技术问题。

An echo path delay estimation method and device

全部详细技术资料下载

【技术实现步骤摘要】
一种回声路径延迟估计方法及装置
本专利技术涉及语音处理领域，尤其涉及一种回声路径延迟估计方法及装置。
技术介绍
和传统的使用电话进行通话相比，利用网络进行语音实时通话的语音质量较差，影像网络语音通话的关键因素之一就是回声。因此，为了提高网络语音通话时的语音质量，就必须在网络语音通话过程中消除回声。由于网络传送的语音信号要经过编码、压缩和打包等一系列处理，不仅会导致回声路径的延迟较大，还会导致延迟抖动较大。此外，利用不同设备进行语音通话，回声延迟也不尽相同。因此，在回声消除处理中，估计回声延迟就显得至关重要。在VOIP(VoiceoverInternetProtocol，网络电话)语音通话中回声的产生原因比较复杂，不仅有回声源复杂，通话设备类型多变也对回声有影响。目前的回声消除算法(AlgorithmofEchoCancellation，AEC)中通过自适应滤波器来模拟回声路径，由于对于不同回声环境的回声路径也不相同，利用一个自适应滤波器来模拟所有的回声环境中的回声路径时的计算结果误差过大，为了降低误差就需要根据不同的回声环境设计不同的自适应滤波器，从现有技术中至少存在以下技术问题：现有的回声消除算法中的回声路径延迟估计方法具有局限性，无法适用于不同的回声环境。
技术实现思路
本专利技术实施例通过提供一种回声路径延迟估计方法及装置，用于解决现有技术中存在的现有的回声消除算法中的回声路径延迟估计方法具有局限性，无法适用于不同的回声环境的技术问题。第一方面，本专利技术一实施例提供...

【技术保护点】
1.一种回声路径延迟估计方法，应用于回声路径延迟估计装置，其中，所述装置包括深度学习回声路径延迟估计模型，其特征在于，所述方法包括：/n对输入信号进行预处理，获取预处理后的语音信号；其中，所述输入信号包括近端语音信号和远端语音信号；/n对所述预处理后的语音信号进行时频转换，获取所述预处理后的语音信号对应的频域信号；其中，所述频域信号包括近端频域信号和远端频域信号；/n获取所述频域信号的特征参数，其中，所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值；/n将所述特征参数输入所述深度学习回声路径延迟估计模型，获取回声路径的延迟估计值。/n

【技术特征摘要】
1.一种回声路径延迟估计方法，应用于回声路径延迟估计装置，其中，所述装置包括深度学习回声路径延迟估计模型，其特征在于，所述方法包括：
对输入信号进行预处理，获取预处理后的语音信号；其中，所述输入信号包括近端语音信号和远端语音信号；
对所述预处理后的语音信号进行时频转换，获取所述预处理后的语音信号对应的频域信号；其中，所述频域信号包括近端频域信号和远端频域信号；
获取所述频域信号的特征参数，其中，所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值；
将所述特征参数输入所述深度学习回声路径延迟估计模型，获取回声路径的延迟估计值。

2.如权利要求1所述的方法，其特征在于，所述对输入信号进行预处理，获取预处理后的语音信号，具体包括：
对所述输入信号进行分帧处理和加窗处理，获取预处理后的语音信号。

3.如权利要求1所述的方法，其特征在于，所述对所述预处理后的语音信号进行时频转换，获取所述预处理后的语音信号对应的频域信号，具体包括：
对所述预处理后的语音信号进行快速傅里叶变换或小波变换，获取所述预处理后的语音信号对应的频域信号。

4.如权利要求1-3中任一项所述的方法，其特征在于，所述深度学习回声路径延迟估计模型包括语音检测模块、互相关计算模块、延迟估计计算模块、预存的特征值以及和所述特征值对应的目标值。

5.一种回声路径延迟估计装置，其特征在于，所述装置包括：
预处理单元，用于对输入信号进行预处理，获取预处理后的语音信号；其中，所述输入信号包括近端语音信号和远端语音信号；

【专利技术属性】
技术研发人员：宋钦梅，方华，袁其政，程宝平，
申请(专利权)人：中移杭州信息技术有限公司，中国移动通信集团有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人