选择用于传输的编码的下一代音频数据制造技术

技术编号:18467356 阅读:26 留言:0更新日期:2018-07-18 16:44
一种用于接收音频数据的示例性设备包括:音频解码器,其使用数字逻辑电路来实现以及被配置为对遵循MPEG‑H或AC‑4部分2的音频数据进行解码;和音频数据处理单元,其使用数字逻辑电路来实现以及被配置为接收用于描述遵循MPEG‑H或AC‑4部分2的多个音频对象的清单文件(其中该清单文件指示这些音频对象中的每一个是否可经由广播、宽带或者广播和宽带二者来获得)、接收指示要呈现哪些音频对象的选择数据、接收包括基于该选择数据的音频对象的流媒体数据,以及将该选择数据所指示的音频对象提供给音频解码器。

Select the next generation of audio data encoded for transmission.

An example device for receiving audio data includes an audio decoder that is implemented using a digital logic circuit and is configured to decode audio data that follows a MPEG H or a AC 4 portion 2; and an audio data processing unit, which is implemented using a digital logic circuit and configured to receive a description of compliance. A list file of multiple audio objects based on the MPEG H or the AC 4 Part 2 (which indicates whether each of these audio objects can be obtained by broadcast, broadband or broadcast and broadband two), receives the selected data to indicate which audio objects to present, and receives an audio object based on the selected data. The streaming media data and the audio object indicated by the selected data are supplied to the audio decoder.

【技术实现步骤摘要】
【国外来华专利技术】选择用于传输的编码的下一代音频数据本申请要求享受2015年12月1日提交的美国临时申请No.62/261,743和2015年12月22日提交的美国临时申请No.62/387,269的权益,故以引用方式将这两份申请的全部内容并入本文。
本公开内容涉及媒体数据的传输,具体地说,本公开内容涉及音频数据的传输。
技术介绍
高阶高保真立体声(HOA)信号(其通常由多个球谐系数(SHC)或者其它层次元素来表示)是声场的三维表示。HOA或SHC表示可以利用与用于回放根据SHC信号渲染的多声道音频信号的本地扬声器几何无关的方式来表示声场。可以对HOA或SHC表示进行编码。此外,还可以对相应的视频数据以及其它媒体数据(例如,定时文本)进行编码。在已经对诸如音频数据或视频数据之类的媒体数据进行了编码之后,可以对媒体数据进行分组化以进行传输或者存储。可以将媒体数据组装成符合各种标准中的任何一种的媒体文件,例如,国际标准化组织(ISO)基本媒体文件格式以及其扩展。
技术实现思路
总体上,本公开内容描述了使用诸如广播或者基于宽带的单播之类的流传输,来传输下一代音频(NGA)数据的技术。此外,还描述了用于基于音频对象的特性来选择(例如,预先选择)音频对象的技术。在一个例子中,一种接收媒体数据的方法包括:接收用于描述遵循MPEG-H或AC-4部分2的多个音频对象的清单文件,其中该清单文件指示这些音频对象中的每一个音频对象是否可经由广播、宽带或者广播和宽带二者来获得;接收指示要呈现这些音频对象中的哪些音频对象的选择数据;接收包括基于该选择数据的所述音频对象的流媒体数据;以及将该选择数据所指示的音频对象提供给音频解码器。在另一个例子中,一种用于接收音频数据的设备包括:音频解码器,其使用数字逻辑电路来实现以及被配置为对遵循MPEG-H或AC-4部分2的音频数据进行解码;以及音频数据处理单元,其使用数字逻辑电路来实现以及被配置为接收用于描述遵循MPEG-H或AC-4部分2的多个音频对象的清单文件,其中该清单文件指示这些音频对象中的每一个音频对象是否可经由广播、宽带或者广播和宽带二者来获得,接收指示要呈现这些音频对象中的哪些音频对象的选择数据,接收包括基于该选择数据的所述音频对象的流媒体数据;以及将该选择数据指示的音频对象提供给音频解码器。在另一个例子中,一种用于接收音频数据的设备包括:音频解码器,其使用数字逻辑电路来实现以及配置为对遵循MPEG-H或AC-4部分2的音频数据进行解码;用于接收描述遵循MPEG-H或AC-4部分2的多个音频对象的清单文件的单元,其中该清单文件指示这些音频对象中的每一个音频对象是否可经由广播、宽带或者广播和宽带二者来获得;用于接收指示要呈现这些音频对象中的哪些音频对象的选择数据的单元;用于接收包括基于该选择数据的所述音频对象的流媒体数据的单元;以及用于将该选择数据指示的音频对象提供给音频解码器的单元。在另一个例子中,一种其上存储有指令的计算机可读存储介质,当所述指令被执行时,使接收机设备的一个或多个处理器执行以下操作:接收用于描述遵循MPEG-H或AC-4部分2的多个音频对象的清单文件,其中该清单文件指示这些音频对象中的每一个音频对象是否可经由广播、宽带或者广播和宽带二者来获得;接收指示要呈现这些音频对象中的哪些音频对象的选择数据;接收包括基于该选择数据的所述音频对象的流媒体数据;以及将该选择数据指示的音频对象提供给接收机设备的音频解码器。在附图和下面的描述中阐述了一个或多个例子的细节。根据该描述和附图,以及根据权利要求书,其它特征、目的和优点将变得显而易见。附图说明图1是示出了实现在网络上对媒体数据进行流式传输的技术的示例性系统的框图。图2是示出了更详细的取回单元的一组示例性组件的框图。图3是描绘示例性多媒体内容的元素的概念图。图4是示出一种示例性媒体文件的元素的框图,其可以对应于表示的分段。图5是示出用于传输音频数据的示例性传统系统的概念图。图6是根据本公开内容的技术,示出可以用于支持下一代音频数据的传输的多种变型和选项的示例性系统的概念图。图7是示出以系统为中心的第一例子的概念图。图8是示出呈现定义和部分适配集的例子之间的映射的概念图。图9是示出使用系统和HTML-5的另一个例子的概念图。图10是示出使用系统和音频解码器的另一种示例性系统的概念图。图11是示出示例性数据集以及@bundleID的值和经由各种类型的传输网络的可用性之间的对应关系的概念图。图12是示出用于一组示例性部分适配集的数据网络可用性的例子的概念图。图13是根据本公开内容的技术,示出使用各种各样的选择技术的另一种示例性系统的概念图。图14是示出了根据本公开内容的技术、使用系统和音频解码器的另一种示例性系统的概念图。图15-17是根据本公开内容的技术,示出示例性音频数据模型的概念图。图18是示出接收机设备的例子的概念图,其中该接收机设备包括位于web浏览器和MPEG-2系统层之间的用户接口。图19是示出接收机设备的另一个例子的概念图,其中该接收机设备包括位于web浏览器和NGA音频解码器之间的用户接口。图20是示出接收机设备的另一个例子的概念图。图21是示出在MPEG-2系统水平上进行的对所有数据的示例性选择的概念图。图22是示出其中除了M&E音频数据之外,还存在对英语评论的选择的例子的概念图。图23是示出了其中预选择单元(或者另一个单元)删减适配集以删除没有被用户选择的那些的另一个例子的概念图。图24是示出根据本公开内容的技术的示例性方法的流程图。具体实施方式概括地,本公开内容描述了用于传输编码的媒体数据(例如,编码的音频数据)的技术。本公开内容的技术通常针对于在伴随这些流中的一个流的一组元数据里,通告可用的音频数据流,例如,音乐和效果(M&E)流。也就是说,各种不同的音频数据流可以是可用的,例如,M&E流、各种语言的对话流、以及各种语言的评论。元数据可以描述哪些音频数据流集是可用的以及这些流的特性。此外,元数据还可以进一步指示如何能够访问这些流,例如,这些流是否可以经由广播(诸如ATSC3.0广播或基于网络的广播或多播,比如增强型多媒体广播多播服务(eMBMS))、宽带(例如,单播网络取回)或二者来获得。可以将元数据包括在清单文件中,比如HTTP动态自适应流(DASH)的媒体呈现描述(MPD),或者包括在与其它HTTP流协议相关联的其它类型的清单文件中。此外,接收设备可以包括被配置为接收元数据的音频处理单元。元数据可以符合下一代音频(NGA)编码标准,比如MPEG-H或AC-4第2部分。因此,不是配置MPEG-2系统层单元或其它这种处理单元来分析元数据,本公开内容的技术的某些方面包括使用已经被配置为处理NGA编码标准的元数据的NGA音频解码单元,以向MPEG-2系统层单元提供来自元数据的信息。用此方式,除了作为解码和渲染过程的一部分之外,本公开内容的技术还可以利用NGA音频解码单元的能力来作为数据传输和接收过程的一部分。此外,根据本公开内容的某些技术,并且根据DASH流协议,每个音频流可以对应于DASH适配集。也就是说,上面所讨论的清单文件可以用信号通知用于适配集的特性,其中这些适配集中的每一个适配集本文档来自技高网...

【技术保护点】
1.一种接收媒体数据的方法,所述方法包括:接收用于描述遵循MPEG‑H或AC‑4部分2的多个音频对象的清单文件,其中,所述清单文件指示所述音频对象中的每一个音频对象是否可经由广播、宽带或者广播和宽带二者来获得;接收指示要呈现所述音频对象中的哪些音频对象的选择数据;接收包括基于所述选择数据的所述音频对象的流媒体数据;以及将由所述选择数据指示的所述音频对象提供给音频解码器。

【技术特征摘要】
【国外来华专利技术】2015.12.01 US 62/261,743;2015.12.22 US 62/387,269;1.一种接收媒体数据的方法,所述方法包括:接收用于描述遵循MPEG-H或AC-4部分2的多个音频对象的清单文件,其中,所述清单文件指示所述音频对象中的每一个音频对象是否可经由广播、宽带或者广播和宽带二者来获得;接收指示要呈现所述音频对象中的哪些音频对象的选择数据;接收包括基于所述选择数据的所述音频对象的流媒体数据;以及将由所述选择数据指示的所述音频对象提供给音频解码器。2.根据权利要求1所述的方法,其中,所述清单文件包括HTTP动态自适应流(DASH)媒体呈现描述(MPD),以及其中,所述音频对象是作为适配集来用信号在所述DASHMPD中进行通知的。3.根据权利要求1所述的方法,其中,接收所述流媒体数据包括:接收遵循MPEG-2传输流(TS)的单个节目流或者遵循MPEG-2TS的多个节目流。4.根据权利要求1所述的方法,其中,接收所述流媒体数据包括:接收包括所述音频对象的一个或多个MPEG媒体传输(MMT)资产。5.根据权利要求1所述的方法,还包括针对所述音频适配集中的每一个音频适配集,使用所述清单文件来进行以下确定:确定所述音频适配集是否包括具有特定标识符(ID)的完整可呈现音频呈现;确定所述音频适配集是否依赖于一个或多个其它音频适配集,以及当所述音频适配集依赖于一个或多个其它音频适配集时,确定用于所述一个或多个其它音频适配集的标识符;以及确定用于所述音频适配集的标识符。6.根据权利要求5所述的方法,还包括:确定所述音频适配集中的每个表示的相对质量,其表示所述表示中的每一个表示的质量排名属性。7.根据权利要求5所述的方法,其中,所述清单文件指示所述音频对象中的每一个音频对象是在不同的数据流中提供的。8.根据权利要求5所述的方法,其中,所述清单文件指示所述音频对象中的两个或更多音频对象被复用在广播流中,以及所述其它音频对象作为不同的数据流可经由宽带来获得。9.根据权利要求5所述的方法,其中,所述清单文件指示所述音频对象中的每一个音频对象被复用到单个数据流中。10.根据权利要求9所述的方法,其中,所述清单文件指示所述单个数据流可经由广播来获得。11.根据权利要求5所述的方法,其中,所述清单文件用信号通知作为包括所述完整可呈现音频呈现的所述音频对象的音频对象标识符的所述完整可呈现音频呈现的所述特定ID。12.根据权利要求5所述的方法,其中,所述清单文件用信号通知作为包括所述完整可呈现音频呈现的ISO基本媒体文件格式文件中的轨道的轨道ID的所述完整可呈现音频呈现的所述特定ID。13.根据权利要求5所述的方法,其中,所述清单文件用信号通知作为包括所述完整可呈现音频呈现的MPEG-2传输流中的基本流的节目标识符(PID)的所述完整可呈现音频呈现的所述特定ID。14.根据权利要求5所述的方法,其中,所述清单文件包括描述符数据,其中,所述描述符数据用信号通知包括所述完整可呈现音频呈现的MPEG媒体传输(MMT)流的所述特定ID。15.根据权利要求5所述的方法,其中,所述清单文件使用基本描述符来用信号通知音频适配集之间的依赖性,所述基本描述符具有值,所述值提供依赖的适配集所依赖的适配集的标识符。16.根据权利要求5所述的方法,其中,所述清单文件使用内容分量元素来用信号通知所述音频对象的标识符。17.根据权利要求5所述的方法,还包括:从所述清单文件中取回一个或多个预选择元素。18.根据权利要求17所述的方法,其中,所述预选择元素均包括用于选择所述音频对象的子集的描述符。19.根据权利要求17所述的方法,其中,所述预选择元素均包括能够用于自动选择的一个或多个参数。20.根据权利要求17所述的方法,其中,所述预选择元素均包括指示用于该预选择的所需编解码器能力的数据。21.根据权利要求17所述的方法,其中,所述预选择元素均包括用于用户选择的文本标签。22.根据权利要求21所述的方法,其中,所述文本标签是以与所述相应的音频数据的语言相对应的语言来提供的。23.根据权利要求17所述的方法,其中,所述预选择元素均包括优先级值。24.根据权利要求17所述的方法,还包括:基于所接收的选择数据,使用所述预选择元素来选择所述音频对象的子集。25.一种用于接收音频数据的设备,所述设备包括:音频解码器,其使用数字逻辑电路来实现以及被配置为对遵循MPEG-H或AC-4部分2的音频数据进行解码;以及音频数据处理单元,其使用数字逻辑电路来实现以及被配置为:接收用于描述遵循MPEG-H或AC-4部分2的多个音频对象的清单文件,其中,所述清单文件指示所述音频对象中的每一个音频对象是否可经由广播、宽带或者广播和宽带二者来获得;接收指示要呈现所述音频对象中的哪些音频对象的选择数据;接收包括基于所述选择数据的所述音频对象的流媒体数据;以及将由所述选择数据指示的所述音频对象提供给所述音频解码器。26.根据权利要求25所述的设备,其中,所述清单文件包括HTTP动态自适应流(DASH)媒体呈现描述(MPD),以及其中,所述音频对象是作为适配集来用信号在所述DASHMPD中进行通知的。27.根据权利...

【专利技术属性】
技术研发人员:T·施托克哈默
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1