音频信号解相关器制造技术

技术编号:8413614 阅读:160 留言:0更新日期:2013-03-14 11:55
本发明专利技术创建了一种用于从输入音频信号导出输出音频信号的音频信号解相关器。所述音频信号解相关器包括频率分解器,用于从所述输入音频信号中提取第一部分信号和第二部分信号,所述第一部分信号描述第一音频频率范围中的音频内容,所述第二部分信号描述第二音频频率范围中的音频内容。与所述第二音频频率范围相比,所述第一音频频率范围具有更高的频率。

【技术实现步骤摘要】

本专利技术一般地涉及音频信号解相关器、多声道音频信号处理器、五声道音频信号处理器、用于从输入音频信号导出输出音频信号的方法以及计算机程序。具体地,本专利技术的目的是用于声学回声消除(AEC)的收敛增强。
技术介绍
在电信和其他应用环境中,发射声音的扬声器与同时有效地从相同的声学环境中拾取(pick up)声音的麦克风之间的声学串扰问题是众所周知的。作为一种解决方案,过去已经提出了声学回声消除(AEC)技术,该技术用于单声道的重现(“单声道AEC”)以及双声道的重现(“立体声AEC”)。对于单声道AEC,参考以下出版物,本申请的附录中包括了其详细列表、、。对于立体声 AEC,参考以下出版物、、、。图9示出了 AEC应用的总体图。图9描述了一种典型的立体声AEC场景。图9的系统其整体被标记为900。通过两个麦克风920、922拾取来自发送室910的声源(例如扬声器912)。扬声器912发送的声音与两个麦克风920、922接收的声音之间的关系由传递函数gl(k)、g2(k)来描述。换言之,例如,传递函数gl(k)、g2(k)受发送室910的声学特性(例如反射)的影响,并受扬声器912与两个麦克风920、922之间的距离的影响。麦克风信号X1 (k)、xp (k)被传送至接收室930,并通过两个扬声器932、934来重现。同时,设置接收室930中的麦克风940以拾取来自出现在接收室中的另一个用户942的话音。第一扬声器932发射的声音信号与麦克风940稱合,其中,使用Ii1(Ic)来标记第一扬声器932与话筒940之间的传递特性。同样,第二扬声器934产生的声学信号与麦克风940耦合,其中,使用hp (k)来标记第二扬声器934与话筒940之间的传递特性。为了防止从两个扬声器932、934发射的声音f禹合入输出麦克风信号(例如,由远端收听者,例如人和/或机器回送的信号),AEC 950试图通过从输出信号(例如从麦克风940的麦克风信号y(k))中减去输入信号X1 (k)、Xp(k)的滤波版本,以从输出信号e(k)中消除输入信号X1GO、Xp (k)的任何贡献。换言之,使用滤波器函数/n(k)来对接收的信号Xl(k)进行滤波,并从麦克风信号y(k)中减去滤波的结果。同样,使用滤波器函数^p(k)来对信号Xp(k)进行滤波。从麦克风信号y(k)中还减去该滤波的结果,使得通过从麦克风信号y(k)中减去信号Xl(k)、Xp(k)的滤波版本来获得校正的麦克风信号e(k)。从输出信号e(k)中消除(或至少减少)输入信号X1GO、Xp(k)的贡献一般需要使用自适应算法动态调节消除滤波器952、954,以实现最小误差信号e (k),从而实现最优的消除。已经知道,当自适应的消除滤波器952、954是发射扬声器932、934和麦克风940之间的传递特性的精确模型(传递函数hpGchh1 (k)或冲击响应)时,正是如此。AEC的两个重要应用领域是免提电话(其中远端收听者是位于该电话的远程端的另一个人)或用于自动语音识别(ASR)的麦克风信号增强。在后一种情况下,目的是从麦克风信号中移除在室内重现的其他声音的影响,以使自动语音识别器的操作具有较低的识别误差率。作为一个示例,可以从话音命令模块的输入中移除HiFi设置的音乐,以允许所说出的用户命令进行特定功能的可靠控制。进一步表明,对于立体声AEC的情况,存在一种所谓的“非唯一性问题” 如果两个扬声器信号强相关,则自适应滤波器一般地收敛至方案(AP(丨<),/n(k)),该方案不能对扬声器932、934与麦克风940之间的传递函数\00 ^h1 (k)进行正确建模,而是仅对给定的特定扬声器信号优化了回声消除。由此,扬声器信号Xl(k)、xp(k)的特性的改变(例 如由于发送室910中的声源912的几何位置的改变)导致了回声消除性能的下降,并需要对消除滤波器进行新的自适应。作为该非唯一性问题的解决方案,已经提出了各种技术,以在接收室930中重现来自发送室910的信号之前,对其进行预处理,以对其“解相关”,并按照这种方式来避免之前所讨论的不定性。对这样的预处理方案的要求概括如下 收敛增强预处理必须能够有效地对输入信号进行解相关,以确保即使对高度相关/单声道(输入)信号也能进行快速而正确的AEC滤波器收敛。 主观声音质量由于经预处理的信号随后通过扬声器来重现,并由接收室930中的用户942来收听,因此,预处理必须不对所使用的音频信号类型引入任何令人反感的人工效应。例如,音频信号类型对于免提电信应用可以是仅有语音,或对于ASR输入增强可以使用包括音乐的任何类型的音频素材。 实现复杂度为了在不昂贵的消费设备中实现经济的预处理的使用,希望非常低的计算和存储器复杂度。预处理技术的另一个区别特性是推广至多声道操作的能力,即处理多于两个的重现音频声道的能力。以下描述用于声学回声消除(AEC)的现有技术的预处理概念。第一种用于立体声AEC的简单预处理方法由Benesty等人提出(参考、),该方法通过向信号加入非线性失真来实现信号的解相关。例如,使用半程整流(halfway rectification)、全程整流(full-way rectification)或通过形成平方根来创建该非线性失真。图10示出了通过非线性预处理的示意框图和传递函数。图10的图形表示其整体被标记为1000。第一图形表示1010示出了使用半程整流单元1020、1022的预处理单元的示意框图。换言之,图10示意了在半程整流的通常情况下的信号X1GO、X2GO的解相关。第二图形表不1050描述了输入信号Xp X2与输出信号X1' X2’之间的传递特性。横坐标1060描述了输入值Xl、x2。纵坐标1062描述了输出值x/、x2’。第一曲线1070包括在Xl、Xl’坐标系统的原点上的尖锐弯曲,反映了输入至X1与对应的输出值Xl’之间的关系。第二曲线1072包括在x2、x2^坐标系统的原点上的尖锐弯曲,描述了输入信号X2与对应的输出值x2’之间的传递特性。换言之,图10示出了在半程整流的通常情况下,向输入信号Xl、X2加入非线性失真,以形成输出信号x/、x2’。虽然所描述的方案(加入非线性失真的方案)具有极其低的复杂度,但是,依赖于所处理的音频信号的类型,引入的失真产物可能变得容易听见和令人反感。典型地,对于语音或通信应用,声音质量的退化被认为是可接受的,而对于音乐信号的高质量应用则是不可接受的。第二种现有技术方法包括向信号(例如向两个输入信号Xl、X2)加入不相关的噪声。在中,通过信号的感知音频编码/解码实现了这一点,该方法将不相关的量化失真引入每个信号,使得由于在根据心理声学模型的感知音频编码器内执行的噪声整形将其掩蔽。为了将不相关的噪声引入两个声道,不得使用联合立体声编码。 通过使用在感知上控制的水印方案,例如基于扩频调制(参照),可以实现类似的效果。在这种情况下,将不相关的扩频数据信号替代量化噪声来嵌入原始信号中。对于上述两种方法,对任意类型的音频信号,清楚的心理声学模型与分解/合成滤波器组的结合使用能够防止可听见的失真。然而,相关的实现复杂度和引入的延迟致使该方法在经济上对多数应用没有吸引力。第三种公开的AEC预处本文档来自技高网...

【技术保护点】
一种音频信号解相关器(100;300),用于从输入音频信号(112;310)导出输出音频信号(170;352),所述音频信号解相关器包括:频率分解器(110;312),用于从所述输入音频信号中提取第一部分信号(120;314)和第二部分信号(122;316),所述第一部分信号描述第一音频频率范围中的音频内容,所述第二部分信号描述第二音频频率范围中的音频内容,与所述第二音频频率范围相比,所述第一音频频率范围包括频率值更高的频率;部分信号修改器(140;332、334、336),用于修改所述第一部分信号,以获得第一已处理部分信号(150;342),并用于修改所述第二部分信号,以获得第二已处理部分信号(152;344),使得应用至所述第一部分信号的时变相移或时变延迟的调制幅度比应用至所述第二部分信号的时变相移或时变延迟的调制幅度更高,或用于仅修改所述第一部分信号,使得将时变相移或时变延迟应用至所述第一部分信号;以及信号组合器(160;350),用于将所述第一已处理部分信号和所述第二已处理部分信号组合,或用于将所述第一已处理部分信号与所述第二部分信号组合,以获得输出音频信号(170;352)。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:于尔根·赫勒赫伯特·比希讷
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1