用于耳机虚拟化的混响生成制造技术

技术编号:23365440 阅读:357 留言:0更新日期:2020-02-18 18:26
本公开涉及用于耳机虚拟化的混响生成。描述了一种生成用于耳机虚拟化的双耳房间脉冲响应(BRIR)的一个或多个分量的方法。在该方法中,生成定向控制的反射,其中定向控制的反射对与声源定位对应的音频输入信号给予期望的感知线索。然后组合至少所生成的反射来获得BRIR的一个或多个分量。还描述了对应的系统和计算机程序产品。

Reverberation generation for headphone virtualization

【技术实现步骤摘要】
用于耳机虚拟化的混响生成本申请是申请号为201680009849.2、申请日为2016年2月11日、专利技术名称为“用于耳机虚拟化的混响生成”的专利技术专利申请的分案申请。相关申请的交叉引用本申请要求以下申请的优先权:2015年2月12日提交的中国专利申请No.201510077020.3;2015年2月17日提交的美国临时申请No.62/117,206;以及2016年2月5日提交的中国申请No.2016100812817,这些申请通过引用被整体结合于此。
本公开的实施例大体上涉及音频信号处理,并且更具体地涉及用于耳机虚拟化的混响生成。
技术介绍
为了创建更令人沉浸的音频体验,当通过耳机呈现2声道立体声和多声道音频节目时,可以使用双耳音频渲染来对这些音频节目给予空间感觉。一般地,可以通过对适当设计的双耳房间脉冲响应(BRIR)与节目中的每个音频声道或对象进行卷积来创建空间感觉,其中BRIR表征特定声学环境中的从空间中的特定点到收听者的耳朵的音频信号的变换。该处理可以或者由内容创建者应用,或者由消费者回放设备应用。虚拟器设计方法是从或者物理房间/头部测量或者房间/头部模型模拟来导出BRIR的全部或部分。通常,具有非常期望的声学性质的房间或房间模型被选择,目标是耳机虚拟器可以复制实际房间的引人注目的收听体验。在房间模型精确地体现所选择的收听房间的声学特性的假定下,该方法产生虚拟化BRIR,这些虚拟化BRIR固有地应用空间音频感知所必需的听觉线索。听觉线索可以例如包括耳间时差(ITD)、耳间声强差(ILD)、耳间互相关(IACC)、混响时间(例如,随频率而变化的T60)、直接与混响(DR)能量比、特定的谱峰和谱凹口(notches)、回声密度等。在理想的BRIR测量和耳机收听条件下,基于物理房间BRIR的多声道音频文件的双耳音频渲染可以听起来与相同房间中的扩音器呈现几乎不可区分。但是,该方法的缺点是,物理房间BRIR可以以不期望的方式修改要被渲染的信号。当遵照房间声学法则设计BRIR时,导致外部化(externalization)感觉的感知线索中的一些(诸如谱梳理(spectralcombing)和长的T60时间)还引起副作用,诸如声染色(soundcoloration)和时间拖尾。事实上,即使是最高品质的收听房间也将对渲染的输出信号给予对于耳机再现不期望的一些副作用。此外,在实际测量房间中收听双耳内容期间可以实现的引人注目的收听体验在其他环境(房间)中收听相同内容期间很少实现。
技术实现思路
鉴于以上,本公开提供了一种关于用于耳机虚拟化的混响生成的解决方案。在一个方面,本公开的示例实施例提供了一种生成用于耳机虚拟化的双耳房间脉冲响应(BRIR)的一个或多个分量的方法。在该方法中,生成定向控制(directionallycontrolled)的反射,其中定向控制的反射对与声源定位对应的音频输入信号给予期望的感知线索,然后至少所生成的反射被组合以获得BRIR的该一个或多个分量。在另一方面,本公开的另一示例实施例提供了一种生成用于耳机虚拟化的双耳房间脉冲响应(BRIR)的一个或多个分量的系统。该系统包括反射生成单元和组合单元。反射生成单元被配置为生成定向控制的反射,这些定向控制的反射对与声源定位对应的音频输入信号给予期望的感知线索。组合单元被配置为组合至少所生成的反射以获得BRIR的该一个或多个分量。通过以下描述,将意识到,根据本公开的示例实施例,通过组合来自被选择的方向的多个合成房间反射来生成BRIR后期响应以增强空间中的给定定位处的虚拟声源的错觉(illusion)。反射方向上的改变对随着时间和频率而变化的模拟后期响应给予IACC。IACC主要影响声源外部化和宽敞度(spaciousness)的人类感知。本领域技术人员可以意识到,在本文中所公开的示例实施例中,某些定向反射图案可以在相对于现有技术方法保持音频保真度的同时传达自然的外部化感觉。例如,定向图案可以是振荡(摆动)形状。另外,通过在方位角(azimuth)和仰角(elevation)的预定范围内引入扩散(diffusion)方向分量,对反射给予一定程度的随意性(randomness),这可以提高自然的感觉。以这种方式,该方法旨在捕获物理房间的本质而没有其限制。完整的虚拟器可以通过组合多个BRIR来实现,每个虚拟声源(固定的扩音器或音频对象)一个BRIR。根据以上第一示例,每个声源具有独特的后期响应,该后期响应具有加强声源定位的方向属性。该方法的关键优点是,较高的直接与混响(DR)比可以用于实现与常规的合成混响方法相同的外部化感觉。较高的DR比的使用导致渲染的双耳信号中更小的可听伪像(audibleartifact)(诸如谱染色和时间拖尾)。附图说明通过以下参照附图的详细描述,本公开的实施例的以上和其他目的、特征和优点将变得更可理解。在附图中,本公开的数个示例实施例将被以示例的而非限制性的方式示出,其中:图1是根据本公开的示例实施例的用于耳机虚拟化的混响生成的系统的框图;图2示出根据本公开的示例实施例的预定定向图案的示图;图3A和图3B分别示出用于左声道扩音器和右声道扩音器的良好外部化和不良外部化BRIR对的、短期表观方向(apparentdirection)随着时间推移的改变的示图;图4示出根据本公开的另一示例实施例的预定定向图案的示图;图5示出根据本公开的示例实施例的用于在给定发生时间点生成反射的方法;图6是一般的反馈延迟网络(FDN)的框图;图7是根据本公开的另一示例实施例的用于FDN环境中的耳机虚拟化的混响生成的系统的框图;图8是根据本公开的进一步的示例实施例的用于FDN环境中的耳机虚拟化的混响生成的系统的框图;图9是根据本公开的更进一步的示例实施例的用于FDN环境中的耳机虚拟化的混响生成的系统的框图;图10是根据本公开的示例实施例的用于FDN环境中的多个音频声道或对象的耳机虚拟化的混响生成的系统的框图;图11是根据本公开的另一示例实施例的用于FDN环境中的多个音频声道或对象的耳机虚拟化的混响生成的系统的框图;图12是根据本公开的进一步的示例实施例的用于FDN环境中的多个音频声道或对象的耳机虚拟化的混响生成的系统的框图;图13是根据本公开的更进一步的示例实施例的用于FDN环境中的多个音频声道或对象的耳机虚拟化的混响生成的系统的框图;图14是根据本公开的示例实施例的生成BRIR的一个或多个分量的方法的流程图;以及图15是适合用于实现本公开的示例实施例的示例计算机系统的框图。在整个附图中,相同的或对应的附图标记是指相同的或对应的部分。具体实施方式现在将参照附图中所示的各种示例实施例来描述本公开的原理。应意识到,这些实施例的描绘仅仅是为了使得本领域技术人员能够更好地理解并且进一步实现本公开,而非意图以任何方式限制本公开的范围。在附图中本文档来自技高网
...

【技术保护点】
1.一种用于耳机虚拟化的系统,包括:/n滤波单元,被配置为对包含定向控制的反射的双耳房间脉冲响应(BRIR)进行卷积以产生左耳和右耳中间信号的集合,所述定向控制的反射对与声源定位对应的音频输入信号给予期望的感知线索,其中所述定向控制的反射具有定向图案,其中到达方向随着时间改变以便为BRIR提供随着时间和频率而变化的耳间互相关(IACC);/n随机回声发生器,被配置为生成用于向所述音频输入信号添加扩散分量的所述滤波单元的系数;以及/n组合单元,被配置为接收并组合该中间信号以形成双耳输出信号。/n

【技术特征摘要】
20150217 US 62/117,206;20150212 CN 2015100770203;21.一种用于耳机虚拟化的系统,包括:
滤波单元,被配置为对包含定向控制的反射的双耳房间脉冲响应(BRIR)进行卷积以产生左耳和右耳中间信号的集合,所述定向控制的反射对与声源定位对应的音频输入信号给予期望的感知线索,其中所述定向控制的反射具有定向图案,其中到达方向随着时间改变以便为BRIR提供随着时间和频率而变化的耳间互相关(IACC);
随机回声发生器,被配置为生成用于向所述音频输入信号添加扩散分量的所述滤波单元的系数;以及
组合单元,被配置为接收并组合该中间信号以形成双耳输出信号。


2.根据权利要求1所述的系统,其中,所述定向图案描述定向控制的反射的到达方向关于声源定位的方向怎样随着时间而改变。


3.根据权利要求1或2所述的系统,其中,所述定向图案是摆动函数。


4.根据权利要求3所述的系统,其中,所述摆动函数使得定向控制的反射的到达方向随着时间而改变而远离声源定位的方向并且围绕声源定位来回振荡。


5.根据前述任一项权利要求所述的系统,其中,通过所述随机回声发生器生成的系数被从头部相关传递函数(HRTF)数据集合导出,其中所述滤波器单元的每个滤波器对于左耳和右耳两者提供与来自预定方向的一个反射对应的感知线索。


6.根据权利要求5所述的系统,其中,所述随机回声发生器执行基于时间的处理,包括:
做出独立的随机二元决定以决定反射是否应在给定时刻生成,其中肯定决定的概率随着时间而增大;以及
如果反射被确定为要生成,则将根据期望方向来生成用于左耳和右耳的脉冲响应对,并且所述脉冲响应对包括在任何给定时刻生成的BRIR。


7.根据权利要求6所述的系统,其中,所述期望方向基于包括摆动函数的作为时间的函数的到达方向来确定。
...

【专利技术属性】
技术研发人员:L·D·费尔德双志伟G·A·戴维森郑羲光M·S·文顿
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1