用于自适应音频信号产生、编码和呈现的系统和方法技术方案

技术编号：9799042 阅读：113 留言：0更新日期：2014-03-22 17:17

针对处理包含许多独立的单声道的音频流的音频数据的自适应音频系统描述了实施例。流中的一个或更多个具有与它关联的元数据，该元数据指定流是基于声道的流还是基于对象的流。基于声道的流具有利用声道名字编码的呈现信息；并且基于对象的流具有通过在关联的元数据中编码的位置表述编码的位置信息。编解码器将独立的音频流封装到包含所有音频数据的单个串行的比特流中。这个配置允许根据非自我中心的参考系呈现声音，在其中声音的呈现位置基于回放环境的特性（例如，房间尺寸、形状等）以便对应于混合者的意图。对象位置元数据包含为使用房间中的可用的扬声器位置正确地播放声音所需的合适的非自我中心的参考系信息，该房间被设立来播放自适应的音频内容。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求2011年7月I日提交的美国临时申请N0.61/504，005和2012年4月20日提交的美国临时申请N0.61/636,429的优先权，这两个申请出于所有目的整体通过参考被并入于此。
一个或更多个实现方式一般涉及音频信号处理，并且更具体地涉及供电影院、家庭和其它环境之用的混合对象和基于声道的音频处理。
技术介绍
在
技术介绍
部分中讨论的主题不应该仅仅由于它在
技术介绍
部分中被提到而被假设为现有技术。类似地，在
技术介绍
部分中提到或者与
技术介绍
部分的主题关联的问题不应该被假设为在现有技术中已经被先前认识到。在
技术介绍
部分中的主题仅仅代表不同的方法，在其中及其本身也可以是专利技术。自从将声音引入胶片(film)以来，已经存在用于捕获创作者的对于运动图像音轨的艺术意图并且在电影院环境中准确地再现它的技术的稳定的发展。电影声音的基本的作用是支持在屏幕上示出的故事。典型的电影音轨包括与屏幕上的图像和元素对应的许多不同的声音元素，从不同的屏幕上的元素发出的对话、噪声、以及声音效果，以及与背景音乐和环境效果结合以便创建整体观众...

【技术保护点】
一种用于处理音频信号的系统，包含：创作组件，被配置为接收多个音频信号，并且产生多个单声道的音频流以及与每个音频流关联并且指定相应音频流的回放位置的一个或更多个元数据组，其中音频流被识别为基于声道的音频或者基于对象的音频，并且其中基于声道的音频的回放位置包含扬声器阵列中的扬声器的扬声器指定，并且基于对象的音频的回放位置包含三维空间中的位置；此外其中第一组元数据作为默认被应用于所述多个音频流中的一个或更多个，并且第二组元数据与回放环境的特定条件关联并且在回放环境的条件匹配回放环境的所述特定条件的情况下代替第一组而被应用于所述多个音频流中的所述一个或更多个；以及呈现系统，耦接到创作组件并且被配置为接...

【技术特征摘要】
【国外来华专利技术】2011.07.01 US 61/504,005;2012.04.20 US 61/636,4291.一种用于处理音频信号的系统，包含: 创作组件，被配置为接收多个音频信号，并且产生多个单声道的音频流以及与每个音频流关联并且指定相应音频流的回放位置的一个或更多个元数据组，其中音频流被识别为基于声道的音频或者基于对象的音频，并且其中基于声道的音频的回放位置包含扬声器阵列中的扬声器的扬声器指定，并且基于对象的音频的回放位置包含三维空间中的位置；此外其中第一组元数据作为默认被应用于所述多个音频流中的一个或更多个，并且第二组元数据与回放环境的特定条件关联并且在回放环境的条件匹配回放环境的所述特定条件的情况下代替第一组而被应用于所述多个音频流中的所述一个或更多个；以及呈现系统，耦接到创作组件并且被配置为接收封装所述多个单声道的音频流和一个或更多个数据组的比特流，并且基于回放环境的条件根据一个或更多个元数据组将音频流呈现于与回放环境中的扬声器对应的多个扬声器供给。2.根据权利要求1所述的系统，其中每个元数据组包括与每个基于对象的流关联的元数据元素，每个基于对象的流的元数据元素指定控制对应的基于对象的声音的回放的空间参数，并且包含以下中的一个或更多个:声音位置、声音宽度、和声速；此外其中每个元数据组包括与每个基于声道的流关联的元数据元素，并且扬声器阵列包含在定义的环绕声配置中布置的扬声器，并且其中与每个基于声道的流关联的元数据元素包含根据定义的环绕声音标准的在扬声器阵列中的扬声器的环绕声音声道的指定。3.根据权利要求1所述的系统，其中扬声器阵列包括用于回放基于对象的流的额外的扬声器，所述额外的扬声器是基于回放环境的条件根据来自用户的设立指令被放置在回放环境中的，并且其中回放条件取决于包含如下的变量:回放环境的房间的尺寸和形状、占用率、材料成分、和环境噪声；此外其中系统接收来自用户的设立文件，该设立文件至少包括扬声器指定的列表和声道到扬声器阵列中的单独的扬声器的映射、关于扬声器的分组的信息、以及基于扬声器相对于回放环境的位置的运行时间映射。4.根据权利要求1所述的系统，其中所述创作组件包括混合控制台，所述混合控制台具有能由用户操作以便指定包含原始音频内容的音频流的回放水平的控制，并且其中与每个相应的基于对象的流关联的元数据元素在用户向混合控制台输入控制时被自动产生。5.根据权利要求1所述的系统，其中元数据组包括用于使得能够根据从扬声器阵列的第一配置到扬声器阵列的第二配置的变化来将基于声道的音频流和基于对象的音频流中的至少一个上混或者下混的元数据。6.根据权利要求3所述的系统，其中内容类型选自由如下组成的组:对话、音乐和效果，并且每个内容类型被体现在相应的一组基于声道的流或者基于对象的流中，此外其中每个内容类型的声音成分被发送到扬声器阵列内指明的一个或更多个扬声器组中的定义的扬声器组。7.根据权利要求6所述的系统，其中扬声器阵列中的扬声器被放置在回放环境内的特定位置处，并且其中与每个相应的基于对象的流关联的元数据元素指定，一个或更多个声音成分被呈现给扬声器供给以便通过最接近如位置元数据所指示的声音成分的意图回放位置的扬声器回放。8.根据权利要求1所述的系统，其中回放位置包含相对于回放环境内的屏幕或者包围回放环境的表面的空间位置，并且其中所述表面包含前面、后面、左面、右面、上面和下面。9.根据权利要求1所述的系统，还包含编解码器，该编解码器耦接到创作组件和呈现组件并且被配置为接收多个音频流和元数据并且产生以有序的方式包含多个音频流的单个数字比特流。10.根据权利要求9所述的系统，其中呈现组件还包含用于选择由呈现组件利用的呈现算法的装置，呈现算法选自由如下组成的组:两路立体声、立体声偶极、立体混响声、波场合成(WFS)、多声道摇移、具有位置元数据的原始主干、双平衡、以及基于矢量的振幅摇移。11.根据权利要求1所述的系统，其中对于每个音频流的回放位置被独立地相对于自我中心的参考系或者非自我中心的参考系指定，其中对于回放环境中的收听者采取自我中心的参考系，并且其中对于回放环境的特性采取非自我中心的参考系。12.一种用于处理音频信号的系统，包含: 创作组件，被配置为接收多个音频信号并且产生多个单声道音频流以及与每个音频流关联并且指定相应的音频流的回放位置的元数据，其中音频流被识别为基于声道的音频或者基于对象的音频，并且其中基于声道的音频的回放位置包含扬声器阵列中的扬声器的扬声器指定，并且基于对象的音频的回放位置包含三维空间中的位置，并且其中每个基于对象的音频流在扬声器阵列中的至少一个特定的扬声器中被呈现；以及呈现系统，耦接到所述创作组件并且被配置为接收封装多个单声道音频流和元数据的比特流，并且将音频流呈现给与回放环境中的扬声器对应的多个扬声器供给，其中扬声器阵列中的扬声器被放置在回放环境内的特定位置处，并且其中与每个相应的基于对象的流关联的元数据元素指定一个或更多个声音成分被呈现给扬声器供给以便通过最接近声音成分的意图回放位置的扬声器回放，使得基于对象的流有效地快移到最接近所述意图回放位置的扬声器。13.根据权利要求12所述的系统，其中元数据包含两个或更多个元数据组，并且呈现系统基于回放环境的条件根据所述两个或更多个元数据组之一呈现音频流，其中对于回放环境的第一条件将第一组元数据应用于多个音频流中的一个或更多个，并且对于回放环境的第二条件将第二组元数据应用于多个音频流中的所述一个或更多个；并且其中每个元数据组包括与每个基于对象的流关联的元数据元素，每个基于对象的流的元数据元素指定控制对应的基于对象的声音的回放的空间参数，并且包含以下中的一个或更多个:声音位置、声音宽度、和声速；此外其中每个元数据组包括与每个基于声道的流关联的元数据元素，并且扬声器阵列包含在定义的环绕声配置中布置的扬声器，并且其中与每个基于声道的流关联的兀数据兀素包含根据定义的环绕声音标准的在扬声器阵列中的扬声器的环绕声音声道的指定。14.根据权利要求12所述的系统，其中扬声器阵列包括用于回放基于对象的流的额外的扬声器，所述额外的扬声器是基于回放环境的条件根据来自用户的设立指令被放置在回放环境中的，并且其中回放条件取决于包含如下的变量:回放环境的房间的尺寸和形状、占用率、材料成分、和环境噪声；此外其中系统接收来自用户的设立文件，所述设立文件至少包括扬声器指定的列表和声道到扬声器阵列中的单独的扬声器的映射、关于扬声器的分组的信息、以及基于扬声器相对于回放环境的位置的运行时间映射，并且其中呈现给扬声器供给以便通过最接近声音成分的意图回放位置的扬声器回放的对象流快移到所述额外的扬声器中的单个扬声器。15.根据权利要求14所述的系统，其中意图回放位置包含相对于回放环境内的屏幕或者包围回放环境的表面的空间位置，并且其中所述表面包含前面、后面、左面、顶面和地面。16.一种用于处理音频信号的系统，包含: 创作组件，被配置为接收多个音频信号并且产生多个单声道音频流以及与每个音频流关联并且指定相应的音频流的回放位置的元数据，其中音频流被识别为基于声道的音频或者基于对象的音频，并且其中基于声道的音频的回放位置包含扬声器阵列中的扬声器的扬声器指定，并且基于对象的音频的回放位置包含相对于包含扬声器阵列的回放环境的三维空间中的位置，并且其中每个基于对象的音频流在扬声器阵列中的至少一个特定的扬声器中被呈现；以及呈现系统，耦接到创作组件并且被配置为接收包含扬声器的列表以及他们在回放环境内的相应位置的扬声器到音频声道的第一映射、以及封装所述多个单声道音频流和元数据的比特流，并且基于回放环境的条件以及扬声器相对于回放环境的位置根据运行时间映射将音频流呈现于与回放环境中的扬声器对应的多个扬声器供给。17.根据权利要求16所述的系统，其中回放环境的条件取决于包含以下的变...

【专利技术属性】
技术研发人员：C·Q·罗宾森，N·R·特斯恩高斯，C·查巴尼，
申请(专利权)人：杜比实验室特许公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人