音频对象元数据和产生方法、电子设备及存储介质技术

技术编号:32005289 阅读:8 留言:0更新日期:2022-01-22 18:21
本公开涉及一种音频对象元数据和产生方法、电子设备及存储介质。音频对象元数据,包括:属性区,包括音频对象的音频对象标识和音频对象名称,所述音频对象标识包括指示多个音频对象之间关系的信息;子元素区,用于表征所述音频对象元数据的音频包格式标识引用、音频对象标识引用、音频互补对象标识引用、音轨唯一标识、音频对象交互的信息。本申请的音频对象元数据描述了音频对象的元数据及其格式,能够实现在音频播放时为渲染器提供准确的音频对象元数据,从而提高了音频播放场景的质量。从而提高了音频播放场景的质量。从而提高了音频播放场景的质量。

【技术实现步骤摘要】
音频对象元数据和产生方法、电子设备及存储介质


[0001]本公开涉及音频处理的
,尤其涉及一种音频对象元数据和产生方法、电子设备及存储介质。

技术介绍

[0002]随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器系统则对多个通道进行排序约束,进而环绕6.1扬声器系统、环绕7.1扬声器系统等使音频处理千变万化,把正确的信号传递给合适的扬声器形成相互牵连的效果。因此,随着声音变得更具沉浸感和交互性,音频处理的复杂性也大大增加。
[0003]音频声道(或声道),是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。而声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。例如,在环绕5.1扬声器系统中包括6个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器;在环绕7.1扬声器系统中包括8个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器。
[0004]因此,当前扬声器系统实现的效果依赖于扬声器的数量和空间位置。例如,双声道扬声器系统无法实现环绕5.1扬声器系统的效果。
[0005]本公开提供了一种音频对象元数据和产生方法,以便提供一种能够解决上述技术问题的元数据。

技术实现思路

[0006]本公开的目的在于提出一种音频对象元数据和产生方法、电子设备及存储介质,以解决上述技术问题之一。
[0007]为实现上述目的,本公开第一方面提供了一种音频对象元数据,包括:
[0008]属性区,包括音频对象的音频对象标识和音频对象名称,所述音频对象标识包括指示多个音频对象之间关系的信息;
[0009]子元素区,用于表征所述音频对象元数据的音频包格式标识引用、音频对象标识引用情况、音频互补对象标识引用、音轨唯一标识引用、音频对象交互的信息。
[0010]为实现上述目的,本公开第二方面提供了一种音频对象元数据的产生方法,包括:
[0011]产生包括如第一方面所述音频对象元数据。
[0012]为实现上述目的,本公开第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
[0013]所述存储器,用于存储一个或多个程序;
[0014]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器产生包括如第一方面所述音频对象元数据。
[0015]为实现上述目的,本公开第四方面提供了一种包含计算机可执行指令的存储介
质,所述计算机可执行指令在由计算机处理器产生包括如第一方面所述音频对象元数据。
[0016]由上可见,本公开音频对象元数据,包括:属性区,包括音频对象的音频对象标识和音频对象名称,所述音频对象标识包括指示多个音频对象之间关系的信息;子元素区,用于表征所述音频对象元数据的音频包格式标识引用、音频对象标识引用、音频互补对象标识引用、音轨唯一标识、音频对象交互的信息。所述音频对象元数据描述了音频对象的元数据及其格式,能够实现在音频播放时为渲染器提供准确的音频对象元数据,从而提高了音频播放场景的质量。
附图说明
[0017]图1为本公开实施例1中提供了一种三维声音频制作模型的示意图;
[0018]图2为本公开实施例1中提供了一种音频对象元数据的结构示意图;
[0019]图3为本公开实施例2中提供的一种音频对象元数据的产生方法的流程图;
[0020]图4为本公开实施例3提供的一种电子设备的结构示意图。
具体实施方式
[0021]以下实施例用于说明本公开,但不用来限制本公开的范围。
[0022]元数据(Metadata)是描述数据的结构特性的信息,而元数据支持的功能包括指示存储位置、历史数据、资源查找或文件记录。
[0023]如图1所示,三维声音频制作模型由一组制作元素组成,每个制作元素均通过元数据描述音频制作对应阶段的数据的结构特性的信息,三维声音频制作模型包括内容制作部分和格式制作部分。
[0024]内容制作部分的制作元素包括:音频节目元素、音频内容元素、音频对象元素和音轨唯一标识元素。
[0025]所述音频节目包括叙述、声音效果和背景音乐,音频节目引用一个或多个音频内容,音频内容组合在一起以构建为完整的音频对象。所述音频节目元素也就是制作音频对象,生成音频节目的元数据用于描述音频节目的结构特性的信息。
[0026]所述音频内容描述音频内容的一个组成部分(例如背景音乐)的内容,并引用一个或多个音频对象将内容与其格式联系起来。所述音频内容元素也就是制作音频内容,生成音频内容的元数据用于描述音频内容的结构特性的信息。
[0027]所述音频对象用于建立内容、格式和有价值的信息,并确定实际音轨的音轨唯一标识。所述音频对象元素也就是制作音频对象,生成音频对象的元数据用于描述音频对象的结构特性的信息。
[0028]所述音轨唯一标识元素也就是制作音轨唯一标识,生成音轨唯一标识的元数据用于描述音轨唯一标识的结构特性的信息。
[0029]格式制作部分的制作元素包括:音频包格式元素、音频通道格式元素、音频流格式元素、音频轨道格式元素。
[0030]所述音频包格式是将音频对象的元数据和音频流数据依据通道分组打包时所采用的格式,其中,音频包格式中能够包括嵌套的音频包格式。所述音频包格式元素也就是制作音频包数据。所述音频包数据中包括音频包格式的元数据,所述音频包格式的元数据用
于描述音频包格式的结构特性的信息。
[0031]所述音频通道格式表示单个音频采样序列,可以对其执行某种操作,例如,在场景中渲染对象的移动。音频通道格式中能够包括嵌套的音频通道格式。所述音频通道格式元素也就是制作音频通道数据。所述音频通道数据中包括音频通道格式的元数据,所述音频通道格式的元数据用于描述音频通道格式的结构特性的信息。
[0032]音频流,是渲染通道、对象、高阶环境音组件或包所需的音轨的组合。所述音频流格式用于建立音频轨道格式集和音频通道格式集或音频包格式之间的关系。所述音频流格式元素也就是制作音频流数据。所述音频流数据中包括音频流格式的元数据,所述音频流格式的元数据用于描述音频流格式的结构特性的信息。
[0033]所述音频轨道格式对应于存储介质中单个音轨中的一组样本或数据,用于描述原始音频数据的轨道格式,及渲染器的解码信号。音频轨道格式来自原始音频数据,用于识别成功解码音轨数据所需的音轨组合。所述音频轨道格式元素也就是制作音频轨道数据。所述音频轨道数据中包括音频轨道格式的元数据,所述音频轨道格式的元数据用于描述音频轨道格式的结构特性的信息。
[0034]三维声音频制作模型的每个阶段均制作出描述该阶段特性的的元数据。
[0035]基于上述三维声音频制作模型制作出的音频通道数据以通信方式传输到远端后,由远端基于元数据对音频通道本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频对象元数据,其特征在于,包括:属性区,包括音频对象的音频对象标识和音频对象名称,所述音频对象标识包括指示多个音频对象之间关系的信息;子元素区,用于表征所述音频对象元数据的音频包格式标识引用、音频对象标识引用情况、音频互补对象标识引用、音轨唯一标识引用、音频对象交互的信息。2.根据权利要求1所述的音频对象元数据,其特征在于,所述属性区还包括:指示音频对象的开始时间信息,所述开始时间信息与所述音频对象中音频节目的播放开始时间有关;和/或,音频对象的持续时间信息,所述持续时间信息与所述音频对象中音频节目的播放开始时间及结束时间有关;和/或,音频对象重要性信息,所述音频对象重要性信息用于描述音频对象的重要性指数;和/或,用户与对象交互信息,所述用户与对象交互信息用于表征是否允许用户与对象进行交互;和/或,自动躲闪信息,所述自动躲闪信息用于表征是否允许对象自动躲闪。3.根据权利要求1所述的音频对象元数据,其特征在于,所述子元素区包括:音频包格式标识引用信息,所述音频包格式标识引用信息用于引用音频包格式标识进行格式描述;和/或,音频对象标识引用信息,所述音频对象标识引用信息用于对引用的其他音频对象进行描述;和/或,音频互补对象标识引用信息,所述音频互补对象标识引用信息用于对与所述音频对象互补的音频对象进行描述;和/或,音轨唯一标识引用信息,所述音轨唯一标识信息用于对音轨的唯一标识进行引用的描述;和/或,音频对象交互信息,所述音频对象交互信息用于表征用户与对象交互的规范。4.根据权利要求3所述的音频对象元数据,其特征在于,所述音频对象交互信息包括:音频对象开关信息,所述音频对象开关信息用于表征是否允许打开或者关闭音频对象;音频对象增益信息,所述音频对象增益信息用于表征是否允许更改音频对象的增益;音频对象位置信息,所述音频对象位置信息用于表征是否允许用户更改音频对象的位置。5.根据权利要求4所述的音频对象元数据,其特征在于,所述音频对象增益信息包括:音频增益的最大值信息,所述音频增益的最大值信息用于表征允许用户增益交互的最大增益因子;音频增益的最小值信息,所述音...

【专利技术属性】
技术研发人员:吴健
申请(专利权)人:赛因芯微北京电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1