一种回声路径延迟估计方法及装置制造方法及图纸

技术编号:24358022 阅读:64 留言:0更新日期:2020-06-03 02:59
本发明专利技术公开了一种回声路径延迟估计方法及装置,回声路径延迟估计装置通过执行回声路径延迟估计方法,包括:对输入信号进行预处理获取预处理后的语音信号;对预处理后的语音信号进行时频转换获取频域信号;获取所述频域信号的特征参数,其中,所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值;将所述特征参数输入所述深度学习回声路径延迟估计模型,获取回声路径的延迟估计值。从而解决现有技术中存在的现有的回声消除算法中的回声路径延迟估计方法具有局限性,无法适用于不同的回声环境的技术问题。

An echo path delay estimation method and device

【技术实现步骤摘要】
一种回声路径延迟估计方法及装置
本专利技术涉及语音处理领域,尤其涉及一种回声路径延迟估计方法及装置。
技术介绍
和传统的使用电话进行通话相比,利用网络进行语音实时通话的语音质量较差,影像网络语音通话的关键因素之一就是回声。因此,为了提高网络语音通话时的语音质量,就必须在网络语音通话过程中消除回声。由于网络传送的语音信号要经过编码、压缩和打包等一系列处理,不仅会导致回声路径的延迟较大,还会导致延迟抖动较大。此外,利用不同设备进行语音通话,回声延迟也不尽相同。因此,在回声消除处理中,估计回声延迟就显得至关重要。在VOIP(VoiceoverInternetProtocol,网络电话)语音通话中回声的产生原因比较复杂,不仅有回声源复杂,通话设备类型多变也对回声有影响。目前的回声消除算法(AlgorithmofEchoCancellation,AEC)中通过自适应滤波器来模拟回声路径,由于对于不同回声环境的回声路径也不相同,利用一个自适应滤波器来模拟所有的回声环境中的回声路径时的计算结果误差过大,为了降低误差就需要根据不同的回声环境设计不同的自适应滤波器,从现有技术中至少存在以下技术问题:现有的回声消除算法中的回声路径延迟估计方法具有局限性,无法适用于不同的回声环境。
技术实现思路
本专利技术实施例通过提供一种回声路径延迟估计方法及装置,用于解决现有技术中存在的现有的回声消除算法中的回声路径延迟估计方法具有局限性,无法适用于不同的回声环境的技术问题。第一方面,本专利技术一实施例提供了一种回声路径延迟估计方法,应用于回声路径延迟估计装置,其中,所述装置包括深度学习回声路径延迟估计模型,包括:对输入信号进行预处理,获取预处理后的语音信号;其中,所述输入信号包括近端语音信号和远端语音信号;对所述预处理后的语音信号进行时频转换,获取所述预处理后的语音信号对应的频域信号;获取所述频域信号的特征参数,其中,所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值;将所述特征参数输入所述深度学习回声路径延迟估计模型,获取回声路径的延迟估计值。可选的,所述对输入信号进行预处理,获取预处理后的语音信号,具体包括:对所述输入信号进行分帧处理和加窗处理,获取预处理后的语音信号。可选的,所述对所述预处理后的语音信号进行时频转换,获取所述预处理后的语音信号对应的频域信号,具体包括:对所述预处理后的语音信号进行快速傅里叶变换或小波变换,获取所述预处理后的语音信号对应的频域信号。可选的,所述深度学习回声路径延迟估计模型包括语音检测模块、互相关计算模块、延迟估计计算模块、预存的特征值以及和所述特征值对应的目标值。第二方面,本专利技术一实施例提供了一种回声路径延迟估计装置,所述装置包括:预处理单元,用于对输入信号进行预处理,获取预处理后的语音信号;其中,所述输入信号包括近端语音信号和远端语音信号;时频转换单元,用于对所述预处理后的语音信号进行时频转换,获取所述预处理后的语音信号对应的频域信号;其中,所述频域信号包括近端频域信号和远端频域信号;第一获取单元,用于获取所述频域信号的特征参数,其中,所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值;第二获取单元,用于将所述特征参数输入所述深度学习回声路径延迟估计模型,获取回声路径的延迟估计值。可选的,所述预处理单元,具体用于:对所述输入信号进行分帧处理和加窗处理,获取预处理后的语音信号。可选的,所述时频转换单元,具体用于:对所述预处理后的语音信号进行快速傅里叶变换或小波变换,获取所述预处理后的语音信号对应的频域信号。可选的,所述深度学习回声路径延迟估计模型包括语音检测模块、互相关计算模块、延迟估计计算模块、预存的特征值以及和所述特征值对应的目标值。第三方面,本专利技术一实施例提供了一种计算机装置,包括:至少一个处理器,以及与所述至少一个处理器连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上述第一方面中所述的方法。第四方面,本专利技术一实施例提供了一种计算机可读存储介质,包括:所述计算机可读存储介质上存储有计算机指令,当所述计算机指令被所述计算机装置的至少一个处理器执行时,实现如上述第一方面中所述的方法。本专利技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:在本专利技术实施例中,回声路径延迟估计装置通过执行回声路径延迟估计方法,包括:对输入信号进行预处理获取预处理后的语音信号;对预处理后的语音信号进行时频转换获取频域信号,其中,所述频域信号包括近端频域信号和远端频域信号;获取所述频域信号的特征参数;将所述特征参数输入所述深度学习回声路径延迟估计模型,获取回声路径的延迟估计值。从而解决现有技术中存在的现有的回声消除算法中的回声路径延迟估计方法具有局限性,无法适用于不同的回声环境的技术问题,达到对于不同的回声环境可以采用同一个回声路径延迟估计方法计算回声路径的延迟的技术效果。附图说明图1为本专利技术实施例提供的一种回声路径延迟估计方法的流程图;图2为本专利技术实施例提供的深度学习回声路径延迟估计模型的训练方法的流程图;图3为本专利技术实施例提供的一种回声路径延迟估计装置的结构示意图;图4为本专利技术实施例提供的一种计算机装置的物理结构示意图。具体实施方式为了解决上述技术问题,本专利技术实施例中的技术方案的总体思路如下:提供了一种回声路径延迟估计方法及装置,具体的,回声路径延迟估计方法包括:对输入信号进行预处理,获取预处理后的语音信号;其中,所述输入信号包括近端语音信号和远端语音信号;对所述预处理后的语音信号进行时频转换,获取所述预处理后的语音信号对应的频域信号;其中,所述频域信号包括近端频域信号和远端频域信号;获取所述频域信号的特征参数,其中,所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值;将所述特征参数输入所述深度学习回声路径延迟估计模型,获取回声路径的延迟估计值。为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。请参见图1,本专利技术实施例一提供了一种回声路径延迟估计方法,具体包括以下步骤:步骤S110,对输入信号进行预处理,获取预处理后的语音信号;其中,所述输入信号包括近端语音信号和远端语音信号。步骤S120,对所述预处理后的语音信号进行时频转换,获取所述预处理后的语音信号对应的频域信号;其中,所述频域信号包括近端频域信号和远端频域信号。步骤S130,获取所述频域信号的特征参数,其中本文档来自技高网...

【技术保护点】
1.一种回声路径延迟估计方法,应用于回声路径延迟估计装置,其中,所述装置包括深度学习回声路径延迟估计模型,其特征在于,所述方法包括:/n对输入信号进行预处理,获取预处理后的语音信号;其中,所述输入信号包括近端语音信号和远端语音信号;/n对所述预处理后的语音信号进行时频转换,获取所述预处理后的语音信号对应的频域信号;其中,所述频域信号包括近端频域信号和远端频域信号;/n获取所述频域信号的特征参数,其中,所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值;/n将所述特征参数输入所述深度学习回声路径延迟估计模型,获取回声路径的延迟估计值。/n

【技术特征摘要】
1.一种回声路径延迟估计方法,应用于回声路径延迟估计装置,其中,所述装置包括深度学习回声路径延迟估计模型,其特征在于,所述方法包括:
对输入信号进行预处理,获取预处理后的语音信号;其中,所述输入信号包括近端语音信号和远端语音信号;
对所述预处理后的语音信号进行时频转换,获取所述预处理后的语音信号对应的频域信号;其中,所述频域信号包括近端频域信号和远端频域信号;
获取所述频域信号的特征参数,其中,所述特征参数包括噪声阈值、所述近端语音信号的傅里叶变换值、所述远端语音信号的傅里叶变换值、长时能量值和短时能量值;
将所述特征参数输入所述深度学习回声路径延迟估计模型,获取回声路径的延迟估计值。


2.如权利要求1所述的方法,其特征在于,所述对输入信号进行预处理,获取预处理后的语音信号,具体包括:
对所述输入信号进行分帧处理和加窗处理,获取预处理后的语音信号。


3.如权利要求1所述的方法,其特征在于,所述对所述预处理后的语音信号进行时频转换,获取所述预处理后的语音信号对应的频域信号,具体包括:
对所述预处理后的语音信号进行快速傅里叶变换或小波变换,获取所述预处理后的语音信号对应的频域信号。


4.如权利要求1-3中任一项所述的方法,其特征在于,所述深度学习回声路径延迟估计模型包括语音检测模块、互相关计算模块、延迟估计计算模块、预存的特征值以及和所述特征值对应的目标值。


5.一种回声路径延迟估计装置,其特征在于,所述装置包括:
预处理单元,用于对输入信号进行预处理,获取预处理后的语音信号;其中,所述输入信号包括近端语音信号和远端语音信号;

【专利技术属性】
技术研发人员:宋钦梅方华袁其政程宝平
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1