具有位置信息的有效传输的多通道编码器和解码器制造技术

技术编号:12024674 阅读:120 留言:0更新日期:2015-09-10 09:43
接收机(603)接收利用表示第一位置参数的第一值和表示第二位置参数的第二值所给定的位置。匹配电路(605)确定第二值是否与标称值相匹配。如果是这样的话,输出电路(609)生成输出数据,其中在输出数据的字段中包括表示第一值的数据但是在输出数据中不包括表示第二值的数据。否则,输出电路(609)在该字段中包括表示用于第一位置参数的无效位置值的数据。接收机确定数据字段的数据是否表示用于第一位置参数的有效位置值。如果是这样的话,它确定其中第一值是有效位置值并且第二值是用于第二位置参数的标称值的位置。否则,它从输入数据的第二字段中确定第二值。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及位置信息的通信,并且尤其但不完全涉及用于音频处理应用的位置数 据的通信。
技术介绍
随着数字信号表示和通信已日益取代模拟表示和通信,各种各样源信号的数字编 码在过去数十年已变得越来越重要。例如,诸如语音和音乐之类的音频内容越来越多地以 数字内容编码为基础。此外,随着例如环绕立体声和家庭影院设置成为流行,音频消费已日 益成为一种包络(enveloping)三维体验。 已研制音频编码格式来提供日益有能力的、多样的和灵活的音频服务,并且尤其 已研制支持空间音频服务的音频编码格式。 如同DTS和Dolby Digital之类的众所周知的音频编码技术产生编码的多通道音 频信号,其将空间图像表示为围绕着收听者被放置在固定位置上的许多通道。对于与对应 于多通道信号的设置不同的扬声器设置来说,空间图像将是次最优的。并且,基于通道的音 频编码系统通常不能应付不同数量的扬声器。 (MPEG-D) MPEG Surround (环绕)提供一种多通道音频编码工具,其允许现有的基 于单声道或基于立体声的编码器被扩展至多通道音频应用。图1举例说明MPEG Surround 系统的元素的示例。使用通过原始的多通道输入的分析而获得的空间参数,MPEG Surround 解码器通过单声道或立体声信号的受控上混(upmix)以获得多通道输出信号而能够重新创 建空间图像。 由于多通道输入信号的空间图像被参数化,所以MPEG Surround允许利用不使用 多通道扬声器设置的渲染设备来解码同一个多通道比特流。示例是在耳机上的虚拟环绕立 体声再现,其被称为MPEG Surround双耳解码处理。在这种模式中,在使用普通耳机的同时 能够提供逼真的环绕立体声体验。另一示例是较高阶多通道输出例如7. 1通道至较低阶设 置例如5. 1通道的修剪(pruning)。 实际上,随着越来越多的再现格式变得可用于主流消费者,用于渲染空间声音的 渲染配置的变化和灵活性近年来已显著增加。这要求音频的灵活表示。随着MPEG Surround 编解码器的引入,已采取重要的步骤。然而,仍然针对特定的扬声器设置来产生和发送音 频。没有规定通过不同的设置和通过非标准(即,灵活的或用户定义的)扬声器设置的再现。 实际上,具有使得音频编码和表示日益独立于特定的预定的和标称的扬声器设置的愿望。 日益优选的是:能够在解码器/渲染侧上执行针对多种多样的不同的扬声器设置的灵活适 配(adaptation)。 为了提供更灵活的音频的表示,MPEG标准化了称为"Spatial Audio Object Coding (空间音频对象编码)"(MPEG-D SA0C)的格式。与诸如DTS、Dolby Digital和MPEG Surround之类的多通道音频编码系统形成对比,SA0C提供个别音频对象而非音频通道的 有效编码。借助于渲染矩阵,个别声音对象被映射到扬声器通道上。而在MPEG Surround 中,每一个扬声器通道能够被视为源自声音对象的不同混合,SAOC使得在解码器侧上可利 用的个别声音对象用于如图2所示的交互操纵。在SA0C中,多个声音对象和参数化数据一 起被编码到单声道或立体声缩混(downmix)中,其中参数化数据允许声音对象在植染侧上 被提取,从而允许个别音频对象可用于例如由终端用户进行的操纵。 实际上,与MPEG Surround相类似,SA0C也创建单声道或立体声缩混。另外,计算 和包括对象参数。在解码器侧上,用户可以操纵这些参数来控制个别对象的各种各样特征 诸如位置、水平、均衡乃至应用诸如混响之类的效果。图3举例说明使得用户能够控制在 SA0C比特流中包含的个别对象的交互界面。 通过发送音频对象而非仅仅再现通道,SA0C允许更灵活的方案并且尤其允许更多 的基于渲染的适应性(adaptability)。假定空间被扬声器充分覆盖,则这允许解码器侧将 音频对象放置在空间中的任意位置上。这样,在所发送的音频与再现或渲染设置之间没有 关系,因此能够使用任意的扬声器设置。这对于例如其中扬声器几乎从不位于预定位置上 的典型起居室中的家庭影院设置而言是有利的。在SA0C中,在解码器侧上决定在声音场景 中这些对象被放置在什么地方,这从艺术的角度来看时常不是所希望的。SA0C标准确实提 供在比特流中发送默认渲染矩阵的方式,这消除解码器责任。然而,所提供的方法依赖于或 固定的再现设置或依赖于未指明的语法。因而,SA0C没有提供规范的手段来完全发送音频 场景而与扬声器设置无关。并且,SA0C不太适合于(not well equipped)弥散性信号分量 的忠实植染。虽然具有包括所谓的多通道背景对象(multichannel background object)来 捕获漫声的可能性,但是这个对象被束缚于一个特定的扬声器配置,例如,诸如5. 1环绕扬 声器设置。 由3D Audio Alliance (音频联盟)(3DAA)正在研制用于3D音频的音频格式的 另一规范,其中3DAA是工业联盟。3DAA致力于研制"将有助于从当前的扬声器馈送范例至 灵活的基于对象的方案的转变"的用于3D音频的传输的标准。在3DAA中,将定义允许将传 统的多通道缩混连同个别声音对象一起传输的比特流格式。另外,包括对象定位数据。在 图4中举例说明生成3DAA音频流的原理。 在3DAA方案中,单独地在扩展流中接收声音对象,并且可以从多通道缩混中提取 这些声音对象。由此产生的多声道缩混与个别可用的对象一起进行渲染。 这些对象可以由所谓的词干(stem)构成。这些词干基本上是分组(缩混)的轨道 (track)或对象。因此,对象可以由包装在词干中的多个子对象构成。在3DAA中,利用音 频对象的选择,能够发送多通道参考混合(reference mix)。3DAA针对每一个对象发送3D 位置数据。这些对象随后能够使用3D位置数据来提取。可供选择地,可以发送逆的混合矩 阵,其描述这些对象与参考混合之间的关系。 根据3DAA的描述,通过给每一个对象分配角度和距离,很可能发送声音场景信 息,其表明:相对于例如默认的前进方向应该将该对象放置在什么地方。因而,针对每一个 对象,发送位置信息。这对于点源来说是有用的,但是其无法描述广源(wide source)(例 如,如同合唱或欢呼)或弥漫性声场(诸如周围环境)。当从参考混合中提取所有的点源时, 周围的多声道混合保留。与SA0C相类似,3DAA中的残留物(residual)被固定于特定的扬 声器设置。 因而,SA0C和3DAA方案二者并入能够在解码器侧上个别操纵的个别音频对象的 传输。这两种方案之间的不同在于:SAOC通过相对于缩混提供表征音频对象的参数来提供 有关这些音频对象的信息(即,以致在解码器侧上根据缩混来生成这些音频对象),而3DAA 提供音频对象作为完整的且独立的音频对象(即,能够在解码器侧上独立于缩混来生成这 些音频对象)。对于两种方案,可以针对这些音频对象来传送位置数据。 传统的和新的用于音频编码和分发的方案之间的显著差异在于:传统的方案固有 地假设特定的扬声器配置。因而,对于这些方案来说,每一个扬声器的位置是(被假设为)已 知的。此本文档来自技高网...

【技术保护点】
一种用于传送位置的设备,所述设备包括:用于接收位置的接收机(603),所述位置具有至少第一值和第二值,第一值表示第一位置参数,并且第二值表示第二位置参数;匹配电路(605),用于确定第二值是否与用于第二位置参数的标称值相匹配;用于生成输出数据的输出电路(609),所述输出电路(609)被安排成:当第二值与标称值相匹配时,在所述输出数据的第一字段中包括表示第一值的第一数据,但是在所述输出数据中不包括表示第二值的数据;以及当第二值与标称值不匹配时,在第一字段中包括第二数据,第二数据表示用于第一位置参数的无效位置值。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:JGH科科彭斯AWJ奥奥门EGP舒杰斯
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1