用于生成和渲染具有条件渲染元数据的基于对象的音频的方法和系统技术方案

技术编号：12350375 阅读：109 留言：0更新日期：2015-11-19 01:27

用于生成基于对象的音频节目的方法和音频处理单元，所述基于对象的音频节目包括与该节目的至少一个对象声道对应的条件渲染元数据，其中条件渲染元数据指示适用于每个相应对象声道的基于回放扬声器阵列配置的至少一个渲染约束；以及用于渲染由这种节目指示的音频内容的方法，包括通过响应于至少一些条件渲染元数据来以符合每个可应用渲染约束的方式渲染该节目的至少一个音频声道的内容。对节目内容的选定混合的渲染可以提供沉浸式体验。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于生成和渲染具有条件渲染元数据的基于对象的音频的方法和系统对相关申请的交叉引用本申请要求2013年4月3日提交的美国临时专利申请No.61/807922和2013年6月7日提交的美国临时专利申请No.61/832397的申请日权益。
本专利技术涉及音频信号处理，并且更特别地，涉及包括音频内容(指示至少一个扬声器声道和至少一个音频对象声道)和支持以依赖于回放有事情配置的方式对音频内容的条件渲染(conditionalrendering)的元数据的音频数据比特流的编码、解码和交互式渲染。本专利技术的一些实施例以被称为杜比数字(DolbyDigital，AC-3)、杜比数字加(DolbyDigitalPlus，增强版AC-3或E-AC-3)或者杜比E(DolbyE)的格式之一来生成、解码和/或渲染音频数据。
技术介绍
杜比、杜比数字、杜比数字加以及杜比E是杜比实验室授权许可公司(DolbyLaboratoriesLicensingCorporation)的商标。杜比实验室提供分别被称为杜比数字和杜比数字加的AC-3和E-AC-3的专有实现。尽管本专利技术不限于在根据E-AC-3(或者AC-3或杜比E)格式对音频数据进行编码时或者在传送、解码或渲染E-AC-3、AC-3或杜比E编码数据时使用，但是为了方便，在实施例中将描述本专利技术根据E-AC-3、AC-3或杜比E格式对音频比特流进行编码并且传送、解码和渲染这种比特流典型的音频数据流包括音频内容(例如，音频内容的一个或更多个声道)和指示音频内容的至少一个特性的元数据。例如，在AC-3比特流中，存在若干个专用于改...
用于生成和渲染具有条件渲染元数据的基于对象的音频的方法和系统

【技术保护点】
一种用于生成基于对象的音频节目的方法，所述方法包括以下步骤：生成与至少一个对象声道对应的条件渲染元数据，使得所述条件渲染元数据指示适用于所述至少一个对象声道的基于回放扬声器阵列配置的至少一个渲染约束；确定包括所述至少一个对象声道的一组音频声道；以及生成基于对象的音频节目，使得所述基于对象的音频节目指示所述一组音频声道和条件渲染元数据，并且使得该节目的至少一个音频声道的内容能够由回放系统响应于所述条件渲染元数据中的至少一些来以符合所述至少一个渲染约束的方式渲染。

【技术特征摘要】
【国外来华专利技术】2013.04.03 US 61/807,922;2013.06.07 US 61/832,3971.一种用于生成基于对象的音频节目的方法，所述方法包括以下步骤：生成与至少一个对象声道对应的条件渲染元数据，使得所述条件渲染元数据指示适用于所述至少一个对象声道的基于回放扬声器阵列配置的至少一个渲染约束，其中所述条件渲染元数据还指示用于渲染所述节目的音频声道的基于回放扬声器阵列配置的至少一个渲染规则，所述至少一个渲染规则至少包括以下：如果所述回放扬声器阵列包括至少一个地板上方扬声器，则第一类型的每个对象声道应该被下混成由用户选定的或默认的任何节目内容混合指定的任何扬声器声道，以及如果所述回放扬声器阵列不包括至少一个地板上方扬声器，则所述第一类型的每个对象声道不应该被包括在任何下混中；确定包括所述至少一个对象声道的一组音频声道；以及生成基于对象的音频节目，使得所述基于对象的音频节目指示所述一组音频声道和所述条件渲染元数据，并且使得该节目的至少一个音频声道的内容能够由回放系统响应于所述条件渲染元数据中的至少一些条件渲染元数据来以符合所述至少一个渲染约束的方式渲染。2.如权利要求1所述的方法，其中所述一组音频声道包括至少一个扬声器声道，并且所述一组音频声道中的至少一个扬声器声道的音频内容指示在观赏型赛事捕捉的声音，并且由所述一组音频声道中的至少一个对象声道指示的音频内容指示对该观赏型赛事的现场解说。3.如权利要求1所述的方法，其中所述基于对象的音频节目是包括帧的编码比特流，所述编码比特流是AC-3比特流或E-AC-3比特流，所述编码比特流的每个帧指示至少一个数据结构，所述数据结构是包括所述至少一个对象声道的一些内容和所述条件渲染元数据中的一些条件渲染元数据的容器，并且至少一个所述容器被包括在每个所述帧的auxdata字段或addbsi字段中。4.如权利要求1所述的方法，其中所述基于对象的音频节目是包括一系列突发以及突发对之间的保护带的杜比E比特流。5.如权利要求1所述的方法，其中所述基于对象的音频节目是指示节目的音频内容和元数据的未编码表示，并且所述未编码表示是以非暂态方式存储在存储器中的比特流或至少一个数据文件。6.一种渲染由基于对象的音频节目确定的音频内容的方法，其中所述节目指示与至少一个对象声道对应的条件渲染元数据以及包括所述至少一个对象声道的一组音频声道，并且其中所述条件渲染元数据指示适用于所述至少一个对象声道的基于回放扬声器阵列配置的至少一个渲染约束，其中所述条件渲染元数据还指示用于渲染所述节目的音频声道的基于回放扬声器阵列配置的至少一个渲染规则，所述方法包括以下步骤：(a)将所述基于对象的音频节目提供给音频处理单元；以及(b)在音频处理单元中，解析所述条件渲染元数据以及所述一组音频声道，并且响应于所述条件渲染元数据中的至少一些条件渲染元数据来以符合所述至少一个渲染约束和所述至少一个渲染规则的方式渲染所述一组音频声道中的至少一个音频声道的内容，其中所述至少一个渲染规则包括以下：如果所述回放扬声器阵列包括至少一个地板上方扬声器，则第一类型的每个对象声道应该被下混成由用户选定的或默认的任何节目内容混合指定的任何扬声器声道，以及如果所述回放扬声器阵列不包括至少一个地板上方扬声器，则所述第一类型的每个对象声道不应该被包括在任何下混中。7.如权利要求6所述的方法，其中所述一组音频声道包括至少一个扬声器声道，并且步骤(b)包括...

【专利技术属性】
技术研发人员：S·S·麦塔，T·齐埃格勒，S·默里，
申请(专利权)人：杜比实验室特许公司，杜比国际公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人