音频处理装置及其方法制造方法及图纸

技术编号:12582709 阅读:81 留言:0更新日期:2015-12-23 20:50
音频处理装置包括:接收包括音频成分的音频数据和包括一组音频换能器(703)的音频换能器位置数据的渲染配置数据的接收器(705)。渲染器(707)从音频数据产生这组音频换能器的音频换能器信号。渲染器(7010)能够根据多个渲染模式渲染音频成分。渲染控制器(709)基于音频换能器位置数据而从多个渲染模式选择用于渲染器(707)的渲染模式。渲染器(707)可针对这组音频换能器的不同子集采用不同的渲染模式,渲染控制器(709)可针对这组音频换能器(703)的每个不同子集独立地选择渲染模式。渲染控制器(709)可响应于这组音频换能器(703)的第一音频换能器相对于音频换能器的预定位置的位置而选择第一音频换能器的渲染模式。该方法可提供例如对下面的情形的提高的适应:大部分扬声器在期望位置处而子集从(多个)期望位置偏离。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及,且更特别地但不排他地涉及包括不同类型的音频成分的空间音频的渲染。
技术介绍
在最近几十年中,音频应用的多样性和灵活性随着例如显著变化的音频渲染应用的多样性而极大地增加。除了那之外,音频渲染设置用在种种声环境中且用于很多不同的应用。在传统上,总是针对一个或多个规定的扬声器配置来开发空间声再现系统。作为结果,空间体验取决于所使用的实际扬声器配置多么接近地匹配所定义的标称配置,并且一般只针对实质上正确地,即根据规定的扬声器配置被建立的系统,来实现高质量空间体验。然而使用具有一般相对高数量的扬声器的特定扬声器配置的要求是麻烦的和不利的。实际上,由消费者在部署例如家庭影院环绕声系统时感觉到的明显的不方便是对将要位于特定位置处的相对大数量的扬声器的需要。一般,实际环绕声扬声器设置将由于用户发现将扬声器定位在最佳位置处是不实际的而从理想设置偏离。相应地,由这样的设置提供的体验且特别是空间体验是次优的。在近年来,因此有朝着消费者要求对他们的扬声器的位置的较不严格的需要的强烈趋势。甚至更加如此的是,他们的主要要求是扬声器设置适合他们的家庭环境,而同时他们当然预期系统仍然提供高质量声体验。当扬声器的数量增加时,这些冲突要求变得更突出。此外,由于朝着提供具有从多个方向到达收听者的声音的全三维声再现的当前趋势,问题变得更相关。开发了音频编码格式以提供越来越有能力的、多变的和灵活的音频服务,且特别是,开发了支持空间音频服务的音频编码格式。熟知的音频编码技术例如DTS和杜比数码产生将空间图像表示为围绕在固定位置处的收听者放置的多个通道的编码多通道音频信号。对于与对应于多通道信号的设置不同的扬声器设置,空间图像将是次优的。此外,基于通道的音频编码系统一般不能够对付不同数量的扬声器。(IS0/IEC) MPEG-2提供多通道音频编码工具,其中比特流格式包括音频信号的2通道和5多通道混合。当使用(IS0/IEC) MPEG-1解码器对比特流解码时,2通道后向兼容的混合被再现。当使用MPEG-2解码器对比特流解码时,三个辅助数据通道被解码,这三个辅助数据通道在与立体声通道组合(解矩阵)时导致音频信号的5通道混合。(IS0/IEC MPEG-D) MPEG环绕声提供允许现有的基于单声道或立体声的编码器扩展到多通道音频应用的多通道音频编码工具。图1图示MPEG环绕声系统的元件的例子。使用通过原始多通道输入的分析得到的空间参数,MPEG环绕声解码器可通过单声道或立体声信号的受控上混而重新创建空间图像,以得到多通道输出信号。因为多通道输入信号的空间图像被参数化,MPEG环绕声允许通过不使用多通道扬声器设置的渲染设备对同一多通道比特流的解码。例子是在头戴式耳机上虚拟环绕声再现,这被称为MPEG环绕声双耳声解码过程。在这个模式中,当使用常规头戴式耳机时可提供逼真环绕声体验。另一例子是更高阶多通道输出(例如7.1通道)到更低阶设置(例如5.1通道)的削减。如所提到的,随着越来越多的再现格式变得对主流消费者可用,在用于渲染空间声音的渲染配置中的变化和灵活性在近年来明显增大了。这要求音频的灵活表现。与引入MPEG环绕声编码解码器一起采取重要的步骤。尽管如此,仍然对特定的扬声器设置例如ITU 5.1扬声器设置产生并传输音频。没有规定在不同设置上和在非标准(即灵活的或用户定义的)扬声器设置上的再现。实际上,期望使音频编码和变现越来越地独立于特定的预定和标称扬声器设置。越来越优选地,对各种各样不同的扬声器设置的灵活适应可在解码器/渲染侧处被执行。为了提供音频的更灵活的表现,MPEG标准化了称为“空间音频对象编码”(IS0/IECMPEG-D SAOC)的格式。与多通道音频编码系统(例如DTS、杜比数码和MPEG环绕声)相反,SAOC提供对个体音频对象而不是音频通道的有效编码。虽然在MPEG环绕声中,每个扬声器通道可被考虑为起源于声对象的不同混合,SAOC允许在如图2所示的多通道混合中的个体声对象的位置的交互式操纵。类似于MPEG环绕声,SAOC也创建单声道或立体声下混。此外,对象参数被计算并包括。在解码器侧,用户可操纵这些参数以控制个体对象的各种特征(例如位置、级别、均衡),或甚至应用效果例如混响。图3图示使用户能够控制包含在SAOC比特流中的个体对象的交互式接口。借助于清染矩阵,个体的声对象被映射到扬声器通道。SAOC允许更灵活的方法,且特别是通过除了仅仅再现通道之外传输音频对象而允许更多基于渲染的可适应性。这允许解码器侧将音频对象放置在空间中的任意位置处,假定空间被扬声器充分覆盖。这样,在所传输的音频和再现或渲染设置之间没有关系,因此可使用任意扬声器设置。这对于例如在典型起居室中的家庭影院设置(其中扬声器几乎从不在意图位置处)是有利的。在SAOC中,在解码器处决定对象被放置在声场景中的哪里(例如借助于如图3所示的接口),这常常不是从艺术观点所期望的。SAOC标准提供了在比特流中传输默认渲染矩阵的方式,消除了解码器责任。然而,所提供的方法依赖于固定再现设置或未规定的语法。因此,SAOC不提供标准手段来独立于扬声器设置完全传输音频场景。而且,SAOC未很好地被配备到扩散信号成分的忠实渲染。虽然存在包括所谓的多通道背景对象(MBO)以捕获扩散声音的可能性,这个目的被约束到一个特定的扬声器配置。3D音频的音频格式的另一规范由DTS有限公司(数字影院系统)开发。DTS有限公司开发了多维音频(MDA?)—一一种基于开放对象的音频创建和创作平台,以加速下一代内容创建。MDA平台支持通道和音频对象两者,并适应于任何扬声器数量和配置。MDA格式允许遗留多通道下混连同个体声对象一起的传输。此外,对象定位数据被包括。生成MDA音频流的原理在图4中图示。在MDA方法中,声对象单独地在扩展流中被接收到,且这些可从多通道下混被提取。因而产生的多通道下混连同单独可得到的对象一起被渲染。对象可由所谓的符尾组成。这些符尾基本上是被分组(下混的)的轨或对象。因此,对象可由被封装进符尾内的多个子对象组成。在MDA中,多通道基准混合可与一系列音频对象一起被传输。MDA传输每个对象的3D位置数据。可然后使用3D位置数据提取对象。替代地,可传输描述在对象和基准混合之间的关系的逆混合矩阵。从MDA描述中,可能通过将角度和距离分配到每个对象来传输声场景信息,指示对象应相对于例如默认的正向方向放置在哪里。因此,为每个对象传输位置信息。这对点源是有用的,但不能描述宽源(像例如合唱队或喝彩)或扩散声场(例如背景)。当所有点源从基准混合被提取时,背景多通道混合保留。类似于SA0C,在MDA中的残余物固定到特定的扬声器设置。因此,SAOC和MDA方法都合并可个体地在解码器侧被操纵的个体音频对象的传输。在这两种方法之间的差异是,SAOC通过提供相对于下混表征对象的参数(S卩,使得在解码器侧处从下混产生音频对象)来提供关于音频对象的信息,而MDA提供音频对象作为完全和单独的音频对象(即可在解码器侧处与下混独立地产生)。对于这两种方法,可为音频对象传递位置数据。目前,在IS0/IEC MPEG内,准备标准MPEG 3D音频以便于3D音频的传输和渲染。MPEG-3D音频旨在连同HE本文档来自技高网...

【技术保护点】
一种音频处理装置,包括:接收器(705),其用于接收音频数据和渲染配置数据,所述音频数据包括多个音频成分的音频数据且所述渲染配置数据包括一组音频换能器(703)的音频换能器位置数据;渲染器(707),其用于从所述音频数据产生用于所述组音频换能器的音频换能器信号,所述渲染器(707)能够根据多个渲染模式渲染音频成分;渲染控制器(709),其布置成响应于所述音频换能器位置数据而从所述多个渲染模式选择用于所述渲染器(707)的渲染模式;以及其中所述渲染器(707)布置成针对所述组音频换能器的不同子集采用不同的渲染模式,并针对所述组音频换能器(703)的每个所述不同子集独立地选择渲染模式,以及其中所述渲染控制器(709)布置成响应于所述组音频换能器(703)的第一音频换能器相对于所述音频换能器的预定位置的位置来选择所述第一音频换能器的渲染模式。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:WPJ德布鲁伊恩AS赫马AWJ奧门
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1