使用稀疏预测滤波器集的调适的回波估计及管理制造技术

技术编号：20882560 阅读：37 留言：0更新日期：2019-04-17 13:21

本发明专利技术涉及用以下至少一者对输入音频信号进行回波估计或回波管理(回波抑制或消除)的方法：调适稀疏预测滤波器集、修改(例如，截断)经调适预测滤波器脉冲响应、从经调适预测滤波器脉冲响应生成复合脉冲响应、或以至少部分通过将所述输入音频信号分类为无回波(或非回波)确定的方式使用回波估计及/或回波管理资源。其它方面是经配置以执行所述方法中的任何者的任何实施例的系统。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用稀疏预测滤波器集的调适的回波估计及管理
本专利技术涉及用于估计及管理(抑制或消除)音频信号的回波内容(例如，在电话会议系统的节点处接收到的音频信号的回波内容)的系统及方法。
技术介绍
在本文中，“回波管理”用于表示对输入音频信号的回波抑制或回波消除，或对输入音频信号的回波抑制及回波消除两者。在本文中，“回波估计”用于表示输入音频信号(例如，输入音频信号的帧)的回波内容估计的生成，以用于对输入音频信号执行回波管理。回波管理的执行通常包含回波估计步骤。在本专利技术中，当提及包含回波估计步骤(以生成估计)及回波管理步骤(使用所述估计)的方法时，应理解，回波管理步骤无须包含额外回波估计步骤(除明确陈述的回波估计步骤外)。使用回波抑制或消除系统(在本文中有时称为“回波抑制器”或“ES”)来抑制或消除来自音频信号的回波内容(例如，在电话会议系统的节点处接收到的回波)是众所周知的。通常，常规ES被实施于(或作为)电话会议系统的“第一”端点(ES的用户被定位在此处)，且所述ES具有两个端口：输入，其从远端(电话会议系统的第二端点，与ES的用户交谈的一方被定位在此处)接收音频信...

【技术保护点】
1.一种用于对输入音频信号执行回波估计或回波管理的方法，所述方法包含以下步骤：(a)确定所述输入音频信号的M频段频域表示及由N个预测滤波器组成的稀疏预测滤波器集，其中所述N个预测滤波器中的每一者用于处理所述M频段频域表示的N频段子集中的相应频段中的音频数据值，其中N及M是正整数且N小于M；及(b)对所述输入音频信号执行回波估计，其包含通过调适所述N个预测滤波器以生成一组N个经调适预测滤波器脉冲响应；及生成所述输入音频信号的回波内容估计，其包含通过处理所述N个经调适预测滤波器脉冲响应。

【技术特征摘要】
【国外来华专利技术】2016.07.20 EP 16180309.3;2016.07.12 US 62/361,069;1.一种用于对输入音频信号执行回波估计或回波管理的方法，所述方法包含以下步骤：(a)确定所述输入音频信号的M频段频域表示及由N个预测滤波器组成的稀疏预测滤波器集，其中所述N个预测滤波器中的每一者用于处理所述M频段频域表示的N频段子集中的相应频段中的音频数据值，其中N及M是正整数且N小于M；及(b)对所述输入音频信号执行回波估计，其包含通过调适所述N个预测滤波器以生成一组N个经调适预测滤波器脉冲响应；及生成所述输入音频信号的回波内容估计，其包含通过处理所述N个经调适预测滤波器脉冲响应。2.根据权利要求1所述的方法，其中对于所述N个频段中的每一者，执行回波估计涉及：基于所述相应经调适滤波器脉冲响应估计所述相应频段的所述回波内容的传输延迟；及/或基于所述相应经调适滤波器脉冲响应估计所述相应频段的所述回波内容的衰减。3.根据权利要求2所述的方法，其中对于所述剩余的M-N个频段中的每一者，执行回波估计涉及：基于所述N个频段的所述回波内容的所述经估计传输延迟估计所述相应频段的所述回波内容的传输延迟；及/或基于所述N个频段的所述回波内容的所述经估计衰减估计所述相应频段的所述回波内容的衰减。4.根据权利要求1到3中任一权利要求所述的方法，其还包含以下步骤：(c)使用所述回波内容估计对所述输入音频信号执行回波管理，借此生成经回波管理音频信号。5.根据权利要求4所述的方法，其还包含以下步骤：呈现所述经回波管理音频信号以生成至少一个扬声器反馈。6.根据权利要求5所述的方法，其包含以下步骤：用所述至少一个扬声器反馈驱动至少一个扬声器以生成声场。7.根据权利要求1到6中任一权利要求所述的方法，其中M至少基本上等于160，且N比M小得多。8.根据权利要求1到7中任一权利要求所述的方法，其中N＝4或N＝6。9.一种用于对输入音频信号执行回波估计或回波管理的方法，所述方法包含以下步骤：(a)确定由N个预测滤波器组成的预测滤波器集，其中所述N个预测滤波器中的每一者用于处理所述输入音频信号的频域表示的相应频段中的音频数据值，且N是正整数；及(b)对所述输入音频信号执行回波估计，其包含通过调适所述N个预测滤波器以生成一组N个经调适预测滤波器脉冲响应；及生成所述输入音频信号的回波内容估计，其包含通过处理所述N个经调适预测滤波器脉冲响应，其中步骤(b)包含以下步骤：从所述经调适预测滤波器脉冲响应的统计函数生成复合脉冲响应；及从所述复合脉冲响应生成所述输入音频信号的回波内容的传输延迟估计。10.根据权利要求9所述的方法，其中对于所述N个频段中的每一者，执行回波估计涉及：基于所述相应经调适滤波器脉冲响应估计所述相应频段的所述回波内容的衰减；且任选地，其中对于所述剩余的M-N个频段中的每一者，执行回波估计包含：基于所述N个频段的所述回波内容的所述经估计衰减估计所述相应频段的所述回波内容的衰减。11.根据权利要求9或10所述的方法，其中步骤(b)包含以下步骤：确定给定预测滤波器的预测误差的沿着滤波器抽头方向的梯度；基于相应滤波器抽头的所述预测误差的所述梯度确定所述每一滤波器抽头的相应权重；通过以其相应权重加权所述复合脉冲响应中的每一滤波器抽头加权所述复合脉冲响应以获得经加权复合脉冲响应；及从所述经加权复合脉冲响应生成所述传输延迟估计。12.根据权利要求9到11中任一权利要求所述的方法，其还包含以下步骤：(c)使用所述回波内容估计对所述输入音频信号执行回波管理借此生成经回波管理音频信号。13.根据权利要求12所述的方法，其还包含以下步骤：呈现所述经回波管理音频信号以生成至少一个扬声器反馈。14.根据权利要求13所述的方法，其包含以下步骤：用所述至少一个扬声器反馈驱动至少一个扬声器以生成声场。15.根据权利要求9到14中任一权利要求所述的方法，其中所述输入音频信号的所述频域表示是所述输入音频信号的M频段频域表示，所述N个预测滤波器中的每一者用于处理所述M频段频域表示中的N频段子集的相应频段中的音频数据值，M是正整数，且N小于M。16.一种用于对输入音频信号执行回波估计或回波管理的方法，所述方法包含以下步骤：(a)确定由N个预测滤波器组成的预测滤波器集，其中所述N个预测滤波器中的每一者用于处理所述输入音频信号的频域表示的相应频段中的音频数据值，且N是正整数；及(b)对所述输入音频信号执行回波估计，其包含通过调适所述N个预测滤波器以生成一组N个经调适预测滤波器脉冲响应；及生成所述输入音频信号的回波内容估计，其包含通过处理所述N个经调适预测滤波器脉冲响应，其中步骤(b)包含以下步骤：修改所述经调适预测滤波器脉冲响应，借此生成经修改预测滤波器脉冲响应；及从所述经修改预测滤波器脉冲响应生成所述输入音频信号的传输延迟估计及/或回波损耗估计。17.根据权利要求16所述的方法，其中所述修改所述经调适预测滤波器脉冲响应的步骤包含从其移除具有大于阈值的绝对值的每一峰值。18.根据权利要求16所述的方法，其中所述修改所述经调适预测滤波器脉冲响应的步骤包含从所述经调适预测滤波器脉冲响应中的每一者移除暗示不同于一致延迟估计的传输延迟的每一峰值，其中所述一致延迟估计是从其它经调适预测滤波器脉冲响应确定的。19.根据权利要求18所述的方法，其还包含以下步骤：(c)使用所述回波内容估计对所述输入音频信号执行回波管理借此生成经回波管理音频信号。20.根据权利要求19所述的方法，其还包含以下步骤：呈现所述经回波管理音频信号以生成至少一个扬声器反馈。21.根据权利要求20所述的方法，其包含以下步骤：用所述至少一个扬声器反馈驱动至少一个扬声器以生成声场。22.根据权利要求16到21中任一权利要求所述的方法，其中所述输入音频信号的所述频域表示是所述输入音频信号的M频段频域表示，所述N个预测滤波器中的每一者对应于所述M频段频域表示的N频段子集的不同频段，M是正整数，且N小于M。23.一种用于对输入音频信号执行回波估计或回波管理的方法，其中所述输入音频信号具有预期最大传输延迟，所述方法包含以下步骤：(a)确定由N个预测滤波器组成的预测滤波器集，其中所述N个预测滤波器中的每一者用于处理所述输入音频信号的频域表示的相应频段中的音频数据值，N是正整数，且所述N个预测滤波器中的每一者具有大于L的长度，其中L是所述预期最大传输延迟；及(b)对所述输入音频信号执行回波估计，其包含通过调适所述N个预测滤波器以生成一组N个经调适预测滤波器脉冲响应；截断所述经调适预测滤波器脉冲响应中的每一者以生成一组N个经截断经调适预测滤波器脉冲响应，所述经截断经调适预测滤波器脉冲响应中的每一者具有不大于L的长度；及生成所述输入音频信号的回波内容估计，其包含通过处理所述N个经截断经调适预测滤波器脉冲响应。24.根据权利要求23所述的方法，其还包含以下步骤：(c)使用所述回波内容估计对所述输入音频信号执行回波管理借此生成经回波管理音频信号。25.根据权利要求24所述的方法，其还包含以下步骤：呈现所述经回波管理音频信号以生成至少一个扬声器反馈。26.根据权利要求25所述的方法，其还包含以下步骤：用所述至少一个扬声器反馈驱动至少一个扬声器以生成声场。27.根据权利要求23到26中任一权利要求所述的方法，其中所述输入音频信号的所述频域表示是所述输入音频信号的M频段频域表示，所述N个预测滤波器中的每一者用于处理所述M频段频域表示的N频段子集的相应频段中的音频数据值，M是正整数，且N小于M。28.一种用于对输入音频信号执行回波估计或回波管理的方法，所述方法包含以下步骤：(a)在需要相对较少回波估计及/或回波管理资源的意义上，将所述输入音频信号分类为无回波，或将所述输入音频信号分类为非无回波因此在需要相对较多回波估计及/或回波管理资源；及(b)以使用至少部分通过将所述输入音频信号分类为无回波或非无回波确定的估计及/或回波管理资源的方式对所述输入音频信号执行所述回波估计或回波管理。29.根据权利要求28所述的方法，其中步骤(b)包含以下步骤：对所述输入音频信号执行回波管理，借此生成经回波管理音频信号。30.根据权利要求29所述的方法，其还包含以下步骤：呈现所述经回波管理音频信号以生成至少一个扬声器反馈。31.根据权利要求30所述的方法，其包含以下步骤：用所述至少一个扬声器反馈驱动至少一个扬声器以生成声场。32.根据权利要求28到31中任一权利要求所述的方法，其中步骤(b)包含以下步骤：确定所述输入音频信号的M频段频域表示及由N个预测...

【专利技术属性】
技术研发人员：施栋，李凯，H·米施，D·古纳万，P·霍姆伯格，G·N·迪金斯，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人