用于确定对于混响感知水平的度量的装置与方法、音频处理器及用于处理信号的方法制造方法及图纸

技术编号:9411161 阅读:124 留言:0更新日期:2013-12-05 07:51
一种用于确定在包括直接信号分量(100)和混响信号分量(102)的混合信号中对混响感知水平的度量的装置,其包括响度模型处理器(104),该响度模型处理器包括用于滤波该原始信号分量(100)、该混响信号分量(102)或该混合信号的感知滤波级,其中该感知滤波级被配置为模型化实体的听觉感知机构而获得滤波后的直接信号、滤波后的混响信号、或滤波后的混合信号。该装置还包括用于使用该滤波后的直接信号估计第一响度度量,并用于使用该滤波后的混响信号或该滤波后的混合信号估计第二响度度量的响度估计器,其中,该滤波后的混合信号从该直接信号分量及该混响信号分量的混叠得出。该装置还包括用于组合该第一与第二响度度量(106、108)而获得对于混响感知水平的度量(112)的组合器(110)。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】一种用于确定在包括直接信号分量(100)和混响信号分量(102)的混合信号中对混响感知水平的度量的装置,其包括响度模型处理器(104),该响度模型处理器包括用于滤波该原始信号分量(100)、该混响信号分量(102)或该混合信号的感知滤波级,其中该感知滤波级被配置为模型化实体的听觉感知机构而获得滤波后的直接信号、滤波后的混响信号、或滤波后的混合信号。该装置还包括用于使用该滤波后的直接信号估计第一响度度量,并用于使用该滤波后的混响信号或该滤波后的混合信号估计第二响度度量的响度估计器,其中,该滤波后的混合信号从该直接信号分量及该混响信号分量的混叠得出。该装置还包括用于组合该第一与第二响度度量(106、108)而获得对于混响感知水平的度量(112)的组合器(110)。【专利说明】
本案有关于音频信号处理,特别是有关于可用于人工混响器的音频处理。
技术介绍
确定对于混响(reverberation)感知水平的度量最好应用于人工混响处理器以自动化方式操作,并需要将其参数调整适应于输入信号,以使该混响的感知水平匹配目标值的情况中。须注意术语混响虽然暗示相同主旨,但显然不具有共同接受的定义,因而使得术语混响难以在收听测试及预测方案中作为量化度量。人工混响处理器经常被实现为线性非时变系统,并在往返信号路径中操作,如第6图所示,具有前置延迟d、混响脉冲响应(RIR)、及用于控制直接混响比(DRR)的定标(scaling,比例换算)因子g。当实现为参数混响处理器时,其具有多个参数特征,例如用于控制RIR的形状及密度,及在一个或多个频带中针对多声道处理器的RIR的声道间相干性(ICC)0图6显示在输入600输入的直接信号X ,及此信号被转发至加法器602,该加法器602用于将加信号加至输出自加权器604的混响信号分量r ,该加权器604在其第一输入接收由混响滤波器606所输出的信号,及在其第二输入接收增益因子g。混响滤波器606可具有连接在混响滤波器606上游的选择性延迟级608,但因实际上混响滤波器606将包含其本身的若干延迟,故在方块608的延迟可包括在混响滤波器606中,使得图6的上支路可以只包含合并该延迟及该混响,或只合并混响而无任何额外延迟的单个的滤波器。混响信号分量由滤波器606输出,此混响信号分量可由乘法器606响应于增益因子g修改来获得处理混响信号分量r,其然后组合在600输入的直接信号分量来最终地在加法器602的输出获得混合信号m。注意术语“混响滤波器”指人工混响的普通实现方式(或如等价于FIR滤波的卷积,或如使用递归结构的实现方式,诸如反馈延迟网络或全通滤波器及反馈巢式滤波器网络,或其它递归滤波器),但标示产生混响信号的通用处理。这样的处理可能涉及非线性处理或时变处理,诸如信号幅值或延迟长度的低频调制。在这样的情况下,术语“混响滤波器”将不适用于线性非时变(LTI)系统的严格技术意义。实际上,“混响滤波器”是指输出混响信号的处理,可能地包括从内存读取计算的或记录的混响信号的机构。感知水平、距离、室内大小、特色及音质等这些参数对所得音频信号有影响。此外,混响的感知特性取决于输入信号的时间特性及频谱特性。将注意力集中在一项重要的感觉、即响度上,可观察到感知混响的响度与输入信号的非平稳性单调相关。直观而言,包络中变化大的音频信号激励高水平的混响,而允许其于较低水平变成可听闻的。在典型方案中,其中,以分贝为单位表示的长期DRR为正,在其能量包络增加的瞬时,直接信号几乎可完全掩蔽混响信号。另一方面,每当信号结束时,先前激励的混响尾部在间隙中变明显,该间隙超过由后掩蔽的斜坡(slope)(至多200毫秒)及听觉系统积分时间(中等水平至多200毫秒)所确定的最短时间。为了示出此点,图4a示出合成音频信号及人工混响信号的时间信号包络,图4b示出预测响度及使用响度计算模型计算的部分响度函数。具有短的前置延迟50毫秒的RIR被用于此处,删除早期反射并以指数性衰减白噪声合成混响的后期部分。输入信号已根据谐波宽带信号及包络函数产生,以感知有短衰减的一个事件及有长衰减的第二事件。虽然长事件产生较多总混响能量,但不意外的是短声音被感知为有较多混响。当较长事件的衰减斜坡掩蔽混响时,短声音在混响建立前已经消失,因而开放间隙,在该间隙中混响被感知。请注意此处使用的掩蔽定义包括完全掩蔽及部分掩蔽。虽然已经多次获得这样的观察,但仍然值得强调,原因在于其定性地示出为何部分响度模型可应用于本工作的背景下。实际上,已经指出混响的感知来自于听觉系统中的流隔离处理,且受直接声音造成混响的部分掩蔽的影响。前文考虑推动响度模型的使用。相关研究由Lee等人进行,其注意力焦点聚焦在当直接收听时RIR的主观衰减率的预测,及回放水平对混响的效应。使用以响度为基础的早期衰减时间的混响预测器在中被提出。与该项研究工作相反地,本文提出的预测方法以部分响度的计算模型(及以其简化版本寻求低复杂度实现方式)处理直接信号及混响信号,及由此考虑输入(直接)信号对感觉的影响。近来,Tsilfidis及Mourjopoulus 研究用于单声道录音中的后期混响的抑制的响度模型。直接信号的估值是使用频谱减法而根据混响输入信号来计算的,利用控制混响处理的计算听觉掩蔽模型导出混响掩蔽指数。多声道合成器及其它装置的特征是加入混响来从感知观察点让声音变得更佳。另一方面,产生的混响为人工信号,当以低水平加至信号时几乎无法听闻,但当以高水平添加时导致不自然且不怡人声音的最终混合信号。让情况变得更恶化的是如在图4a及4b背景下的讨论,混响的感知水平具有强信号依赖性,因此某个混响滤波器对多个信号中的一种信号可能效果极佳,但对不同种信号可能没有听觉效果,或甚至更差地可能产生严重听觉假影。与混响有关的另一问题是混响后的信号是用于实体或个体诸如人类的耳朵的,产生具有直接信号分量及混响信号分量的混合信号的最终目标是该实体感知此混合信号或“混响后的信号”为声音良好或声音自然。但听觉感知机构或声音如何由个体实际上感知的机制不仅就人类听觉有作用的频带而言是强非线性的,同时也就在该频带内部的信号处理而言也是强非线性的。此外,已知人类的声音感知不太受声压水平的控制,声压水平例如可由数字样本求平方算出,反而声音感知较受响度感觉控制。此外,针对包括直接信号分量及混响信号分量的混合信号,混响分量的响度感觉不仅取决于直接信号分量类别,同时也取决于直接信号分量的水平或响度。因此存在对于确定在由直接信号分量及混响信号分量所组成的混合信号中对于混响感知水平的度量的需求,以处理前述与实体的听觉感知机构有关的问题。
技术实现思路
因此本专利技术的目的是提供一种用于确定混响感知水平的度量的装置或方法,或提供一种以改良特性处理音频信号的音频处理器或方法。该目标通过根据权利要求1所述的用于确定混响感知水平的度量的装置、根据权利要求10所述的确定混响感知水平的度量的方法、根据权利要求11所述的音频处理器、根据权利要求14所述的处理音频信号的方法、或根据权利要求15所述的计算机程序而予实现。本专利技术基于确立信号中混响感知水平的度量是由响度模型处理器所确定,该响度模型处理器包括感知滤波级,以使用该感知滤波器来滤波直接信号分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:克里斯蒂安·乌勒约尼·保卢斯于尔根·赫莱彼得·普罗克因奥利弗·黑尔慕斯
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1