响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频制造技术

技术编号:17414861 阅读:35 留言:0更新日期:2018-03-07 10:18
本公开涉及响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频。在一些实施例中,提供用于响应多通道音频信号的通道产生双耳信号的虚拟化方法,这些虚拟化方法向各通道应用双耳房间脉冲响应(BRIR),包含通过使用至少一个反馈延迟网络(FDN)以向通道的下混应用公共晚期混响。在一些实施例中,输入信号通道在第一处理路径中被处理,以向各通道应用的用于该通道的单通道BRIR的直接响应和早期反射部分,并且,通道的下混在包含至少一个应用公共晚期混响的FDN的第二处理路径中被处理。典型地,公共晚期混响模仿单通道BRIR中的至少一些的晚期混响部分的共同宏观属性。其它方面是被配置为执行方法的任何实施例的耳机虚拟化器。

Double ear audio is generated in response to multichannel audio by using at least one feedback delay network

The present disclosure relates to the generation of binaural audio in response to multichannel audio by using at least one feedback delay network. In some embodiments, provides virtualization method response multichannel audio signal channel binaural signals, the virtualization method to each channel using binaural room impulse response (BRIR), including through the use of at least one feedback delay network (FDN) to pass the mixed application of public late reverberation. In some embodiments, the input signal channel is processed in the first processing path, to channel applications for direct response of single channel BRIR of the channel and the early reflection part, and is under the mixed processing channel including at least one application of the public late reverberation FDN second processing path. Typically, the common late reverberation mimics the common macro attributes of at least some of the late reverberation parts in the single channel BRIR. Other aspects are the headphone virtualizer that is configured to perform any implementation of the method.

【技术实现步骤摘要】
响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频本申请是申请号为201480071993.X、申请日为2014年12月18日、专利技术名称为“响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频”的专利技术专利申请的分案申请。相关申请的交叉引用本申请要求2014年4月29日提交的中国专利申请No.201410178258.0;2014年1月3日提交的美国临时申请No.61/923579;以及2014年5月5日提交的美国临时专利申请No.61/988617的优先权,这些申请中的每一个的全部内容通过引用并入这里。
本专利技术涉及用于如下这样的方法(有时称为耳机虚拟化方法)和系统,其响应于多通道输入信号通过对于音频输入信号的一组通道中的每一个通道(例如,对于所有通道)应用双耳房间脉冲响应(BRIR)而产生双耳信号。在一些实施例中,至少一个反馈延迟网络(FDN)向通道的下混应用下混BRIR的晚期混响部分。
技术介绍
耳机虚拟化(或双耳呈现)是一种旨在通过使用标准立体声耳机传输环绕声体验或身临其境的声场的技术。早期耳机虚拟化器在双耳呈现中应用头部相关传递函数(HRTF)以传送空间信息。HRTF是表征在无回声的环境中声音如何从空间中的特定点(声源位置)发送到收听者的两耳的一组方向和距离相关滤波器对。可在呈现的经HRTF滤波的双耳内容中感知诸如耳间时间差(ITD)、耳间水平差(ILD)、头部遮蔽效果、由于肩部和耳廓反射导致的谱峰和谱凹口的必要空间线索(cue)。由于人头部大小的约束,HRTF不提供足够的或鲁棒的关于超出大致1米的源距离的线索。作为结果,仅基于HRTF的虚拟化器通常不能实现良好的外在化(externalization)或感知距离。我们日常生活中的大多数的声音事件发生在混响环境中,在该环境中,除了通过HRTF被模型化的直接路径(从源到耳朵)以外,音频信号也通过各种反射路径到达收听者的耳朵。反射引入了对诸如距离、房间大小和空间的其它属性的听知觉深刻影响。为了在双耳呈现中传送该信息,除了直接路径HRTF中的线索以外,虚拟化器需要应用房间混响。双耳房间脉冲响应(BRIR)表征在特定声学环境中从空间中的特定点到收听者的耳朵的音频信号的变换。理论上,BRIR包含关于空间感知的所有声音线索。图1是被配置为向多通道音频输入信号的各全频率范围通道(X1、…、XN)应用双耳房间脉冲响应(BRIR)的一种类型的常规耳机虚拟化器的框图。通道X1、…、XN中的每一个是与相对于假定的收听者的不同源方向(即,从相应的扬声器的假定位置到假定的收听者位置的直接路径的方向)对应的扬声器通道,并且,每个这种通道与用于相应的源方向的BRIR卷积。需要对于每个耳朵模拟来自各通道的声音路径。因此,在本文件的剩余部分中,术语BRIR将指的是一个脉冲响应或者与左耳和右耳相关联的一对脉冲响应。因此,子系统2被配置为将通道X1与BRIR1(用于相应的源方向的BRIR)卷积,子系统4被配置为将通道XN与BRIRN(用于相应的源方向的BRIR)卷积,等等。各BRIR子系统(子系统2、、…、4中的每一个)的输出是包含左通道和右通道的时域信号。BRIR子系统的左通道输出在加算元件6中被混合,并且BRIR子系统的右通道输出在加算元件8中被混合。元件6的输出是从虚拟化器输出的双耳音频信号的左通道L,元件8的输出是从虚拟化器输出的双耳音频信号的右通道R。多通道音频输入信号还可包含在图1中被标识为“LFE”通道的低频效果(LFE)或低音炮通道。以常规的方式,LFE通道不与BRIR卷积,而作为替代,在图1的增益级5中衰减(例如,衰减-3dB或更多),并且增益级5的输出(通过元件6和8)均等地混合到虚拟化器的双耳输出信号的各通道中。为了使级5的输出与BRIR子系统(子系统2、、…、4)的输出时间对准,在LFE路径中可能需要附加的延迟级。作为替代方案,LFE通道可简单地被忽略(即,不通过虚拟化器被断言(assert)或者被处理)。例如,本专利技术的图2实施例(后面将描述)简单地忽略由此处理的多通道音频输入信号的任何LFE通道。许多消费者耳机不能精确地再现LFE通道。在一些常规的虚拟化器中,输入信号经受到变换到QMF(正交镜像滤波器)域中的时域到频域变换,以产生QMF域频率成分的通道。这些频率成分在QMF域中经受滤波(例如,在图1的子系统2、、…、4的QMF域实现中),并且,得到的频率成分典型地然后变换回时域(例如,在图1的子系统2、、…、4中的每一个的最后级中),使得虚拟化器的音频输出是时域信号(例如,时域双耳信号)。一般地,输入到耳机虚拟化器的多通道音频信号的各全频率范围通道被假定为指示从在相对于收听者的耳朵的已知位置处的声音源发射的音频内容。耳机虚拟化器被配置为向输入信号的每个这种通道应用双耳房间脉冲响应(BRIR)。各BRIR可分解成两个部分:直接响应和反射。直接响应是与声音源的到达方向(DOA)对应的、由于(声音源与收听者之间的)距离而以适当的增益和延迟被调整的并且可选地对于小距离随视差效果而增扩的HRTF。BRIR的剩余部分模型化反射。早期反射通常是一次和二次反射,并且具有相对稀疏的时间分布。各一次或二次反射的微结构(例如,ITD和ILD)是重要的。对于稍晚反射(在入射到收听者之前从多于两个的表面反射的声音),回声密度随反射次数增加而增加,并且,各单次反射的微观属性变得难以观察。对于越来越晚的反射,宏观结构(例如,整个混响的空间分布、耳间相干性和混响延迟率)变得更重要。因此,反射可进一步分成两个部分:早期反射(earlyreflection)和晚期混响(latereverberation)。直接响应的延迟是距收听者的源距离除以声音的速度,并且其水平(在没有接近源位置的大的表面或墙壁的情况下)与源距离成反比。另一方面,晚期混响的延迟和水平一般对源位置不敏感。由于实际的考虑,虚拟化器可选择时间对准来自具有不同的距离的源的直接响应,并且/或者压缩它们动态范围。但是,BRIR内的直接响应、早期反射和晚期混响之间的时间和水平关系应被保持。典型的BRIR的有效长度在大多数的声学环境中延长到几百毫秒或更长。BRIR的直接应用需要与具有数以千计的抽头(tap)的滤波器卷积,这在计算上是昂贵的。另外,在没有参数化的情况下,为了实现足够的空间分辨率,将需要大的存储器空间以存储用于不同的源位置的BRIR。最后的但同样重要的,声音源位置可随时间改变,并且/或者,收听者的位置和取向可随时间改变。这种移动的精确仿真需要时变BRIR脉冲响应。如果这样的时变滤波器的脉冲响应具有许多抽头,那么这种时变滤波器的适当的内插和应用可能是挑战性的。具有称为反馈延迟网络(FDN)的公知的滤波器结构的滤波器可被用于实现空间混响器,该空间混响器被配置为对于多通道音频输入信号的一个或更多个通道应用仿真混响。FDN的结构是简单的。它包含数个混响箱(例如,在图4中FDN中,包含增益元件g1和延迟线z-n1的混响箱),每个混响箱具有延迟和增益。在FDN的典型的实现中,来自所有混响箱的输出通过单一反馈矩阵被混合,并且矩阵的输出被反馈到混响箱的输入并与其求和。可对混响箱输出进行增益调整,并且,对于多通道或双耳本文档来自技高网...
响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

【技术保护点】
一种用于响应多通道音频输入信号的一组通道产生双耳信号的方法,包括:向该组通道中的各通道应用双耳房间脉冲响应BRIR以由此产生经滤波的信号;和组合经滤波的信号以产生双耳信号,其中,向该组通道中的各通道应用BRIR包含通过使用晚期混响产生器(200)来响应于被断言至所述晚期混响产生器(200)的控制值向该组通道中的通道的下混应用公共晚期混响,其中,所述公共晚期混响模仿在该组通道中的至少一些通道上共享的单通道BRIR的晚期混响部分的共同宏观属性,以及其中,该组通道中的通道的下混的能量等于该多通道音频输入信号的被下混的通道的能量之和。

【技术特征摘要】
2014.01.03 US 61/923,579;2014.05.05 US 61/988,617;1.一种用于响应多通道音频输入信号的一组通道产生双耳信号的方法,包括:向该组通道中的各通道应用双耳房间脉冲响应BRIR以由此产生经滤波的信号;和组合经滤波的信号以产生双耳信号,其中,向该组通道中的各通道应用BRIR包含通过使用晚期混响产生器(200)来响应于被断言至所述晚期混响产生器(200)的控制值向该组通道中的通道的下混应用公共晚期混响,其中,所述公共晚期混响模仿在该组通道中的至少一些通道上共享的单通道BRIR的晚期混响部分的共同宏观属性,以及其中,该组通道中的通道的下混的能量等于该多通道音频输入信号的被下混的通道的能量之和。2.根据权利要求1所述的方法,其中,向该组通道中的各通道应用BRIR包含向该组通道中的各通道应用该通道的单通道BRIR的直接响应和早期反射部分。3.根据权利要求1或2所述的方法,其中,所述晚期混响产生器(200)包括用于向该下混应用公共晚期混响的反馈延迟网络的群(203,204,205),其中该群中的各反馈延迟网络(203,204,205)向该下混的不同频带应用晚期混响。4.根据权利要求3所述的方法,其中,反馈延迟网络(203,204,205)中的每一个在复正交镜像滤波器域中实现。5.根据权利要求1-4中任一项所述的方法,其中,所述晚期混响产生器(200)包括用于将公共晚期混响应用于该组通道中的通道的下混的单个反馈延迟网络(220),其中该反馈延迟网络(220)在时域中实现。6.根据权利要求1-5中任一项所述的方法,其中,所述共同宏观属性包括平均功率谱、能量衰变结构、模态密度和峰密度中的一个或多个。7.根据权利要求1-6中任一项所述的方法,其中,所述控制值中的一个或多个是频率相关的,和/或所述控制值之一是混响时间。8.一种用于响应多通道音频输入信号的一组通道产生双耳信号的系统,所述系统包括一个或多个处理器,用于:向该组通道中的各通道应用双耳房间脉冲响应BRIR以由此产生经滤波的信号;和组合经滤波的信号以产生双耳信号,其中,向该组通道中的各通道应用BRIR包含通过使用晚期混响产生器(200)来响应于被断言至所述晚期混响产生器(200)的控制值向该组通道中的通道的下混应用公共晚期混响,其中,所述公共晚期混响模仿在该组通道中的至少一些通道上共享的单通道BRIR的晚期混响部分的共同宏观属性,以及其中,该组通道中的通道的下混的能量等于该多通道音频输入信号的被下混的通道的能量之和。9.根据权利要求8所述的系统,其中,向该组通道中的各通道应用BRIR包含向该组通道中的各通道应用该通道的单通道BRIR的直接响应和早期反射部分。10.根据权利要求8或9所述的系统,其中,所述晚期混响产生器(200)包括被配置为向该下混应用公共晚期混响的反馈延迟网络的群(203,204,205),其中该群中的各反馈延迟网络(203,204,205)向该下混的不同频带应用晚期混响。11.根据权利要求10所述的系统,其中,反馈延迟网络(203,20...

【专利技术属性】
技术研发人员:颜冠杰D·J·布里巴特G·A·戴维森R·威尔森D·M·库珀双志伟
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1