基于音床音频包格式元数据和产生方法、设备及介质技术

技术编号:32228291 阅读:11 留言:0更新日期:2022-02-09 17:33
本公开涉及一种基于音床音频包格式元数据和产生方法、设备及介质。音频包格式的元数据,包括:属性区,包括音频包的音频包格式标识和音频包格式名称,所述音频包格式标识包括指示所述音频包的音频类型为音床类型的信息;子元素区,包括:第一引用信息、第二引用信息和绝对距离,所述第一引用信息包括渲染时与所述音频包相关的音频通道所采用的音频通道格式信息,所述第二引用信息包括渲染时与所述音频包相关的音频包所采用的音频包格式信息,所述绝对距离指示为预设无效值,所述预设无效值用于表征渲染时所述音床类型的音频包不存在对应的距离。渲染时在通道中能够实现三维声音的复现,从而提高了声音场景的质量。从而提高了声音场景的质量。从而提高了声音场景的质量。

【技术实现步骤摘要】
基于音床音频包格式元数据和产生方法、设备及介质


[0001]本公开涉及音频处理的
,尤其涉及一种基于音床音频包格式元数据和产生方法、设备及介质。

技术介绍

[0002]随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器系统则对多个通道进行排序约束,进而环绕6.1扬声器系统、环绕7.1扬声器系统等使音频处理千变万化,把正确的信号传递给合适的扬声器形成相互牵连的效果。因此,随着声音变得更具沉浸感和交互性,音频处理的复杂性也大大增加。
[0003]音频声道(或声道),是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。而声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。例如,在环绕5.1扬声器系统中包括6个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器;在环绕7.1扬声器系统中包括8个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器。
[0004]因此,当前扬声器系统实现的效果依赖于扬声器的数量和空间位置。例如,双声道扬声器系统无法实现环绕5.1扬声器系统的效果。
[0005]本公开提供了一种音频包格式的元数据和产生方法,以便提供一种能够解决上述技术问题的元数据。

技术实现思路

[0006]本公开的目的在于提出一种基于音床音频包格式元数据和产生方法、设备及介质,以解决上述技术问题之一。
[0007]为实现上述目的,本公开第一方面提供了一种音频包格式的元数据,包括:
[0008]属性区,包括音频包的音频包格式标识和音频包格式名称,所述音频包格式标识包括指示所述音频包的音频类型为音床类型的信息;
[0009]子元素区,包括:第一引用信息、第二引用信息和绝对距离,所述第一引用信息包括渲染时与所述音频包相关的音频通道所采用的音频通道格式信息,所述第二引用信息包括渲染时与所述音频包相关的音频包所采用的音频包格式信息,所述绝对距离指示为预设无效值,所述预设无效值用于表征渲染时所述音床类型的音频包不存在对应的距离。为实现上述目的,本公开第二方面提供了一种音频包格式的元数据的产生方法,包括:
[0010]产生包括如第一方面所述音频包格式的元数据。
[0011]为实现上述目的,本公开第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
[0012]所述存储器,用于存储一个或多个程序;
[0013]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理
器产生包括如第一方面所述音频包格式的元数据。
[0014]为实现上述目的,本公开第四方面提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器产生包括如第一方面所述音频包格式的元数据。
[0015]由上可见,本公开音频包格式的元数据,包括:属性区,包括音频包的音频包格式标识和音频包格式名称,所述音频包格式标识包括指示所述音频包的音频类型为音床类型的信息;子元素区,包括:第一引用信息、第二引用信息和绝对距离,所述第一引用信息包括渲染时与所述音频包相关的音频通道所采用的音频通道格式信息,所述第二引用信息包括渲染时与所述音频包相关的音频包所采用的音频包格式信息,所述绝对距离指示为预设无效值,所述预设无效值用于表征渲染时所述音床类型的音频包不存在对应的距离。所述音频包格式的元数据描述了音床类型的音频包格式,在通道中能够实现三维声音的复现,从而提高了声音场景的质量。
附图说明
[0016]图1为本公开实施例中提供了一种三维声音频制作模型的示意图;
[0017]图2为本公开实施例1中提供了一种音频包格式的元数据的结构示意图;
[0018]图3为本公开实施例2中提供的一种音频包格式的元数据的产生方法的流程图;
[0019]图4为本公开实施例3提供的一种电子设备的结构示意图。
具体实施方式
[0020]以下实施例用于说明本公开,但不用来限制本公开的范围。
[0021]元数据(Metadata)是描述数据的结构特性的信息,而元数据支持的功能包括指示存储位置、历史数据、资源查找或文件记录。
[0022]如图1所示,三维声音频制作模型由一组制作元素组成,每个制作元素均通过元数据描述音频制作对应阶段的数据的结构特性的信息,三维声音频制作模型包括内容制作部分和格式制作部分。
[0023]内容制作部分的制作元素包括:音频节目元素、音频内容元素、音频对象元素和音轨唯一标识元素。
[0024]所述音频节目包括叙述、声音效果和背景音乐,音频节目引用一个或多个音频内容,音频内容组合在一起以构建为完整的音频节目。所述音频节目元素也就是制作音频节目,生成音频节目的元数据用于描述音频节目的结构特性的信息。
[0025]所述音频内容描述音频节目的一个组成部分(例如背景音乐)的内容,并引用一个或多个音频对象将内容与其格式联系起来。所述音频内容元素也就是制作音频内容,生成音频内容的元数据用于描述音频内容的结构特性的信息。
[0026]所述音频对象用于建立内容、格式和使用音轨唯一标识元素的资源之间的关系,并确定实际音轨的音轨唯一标识。所述音频对象元素也就是制作音频对象,生成音频对象的元数据用于描述音频对象的结构特性的信息。
[0027]所述音轨唯一标识元素也就是制作音轨唯一标识,生成音轨唯一标识的元数据用于描述音轨唯一标识的结构特性的信息。
[0028]格式制作部分的制作元素包括:音频包格式元素、音频通道格式元素、音频流格式元素、音频轨道格式元素。
[0029]所述音频包格式是将音频对象和原始音频数据依据通道分组打包时所采用的格式,其中,音频包格式中能够包括嵌套的音频包格式。所述音频包格式元素也就是制作音频包数据。所述音频包数据中包括音频包格式的元数据,所述音频包格式的元数据用于描述音频包格式的结构特性的信息。
[0030]所述音频通道格式表示单个音频采样序列,可以对其执行某种操作,例如,在场景中渲染对象的移动。音频通道格式中能够包括嵌套的音频通道格式。所述音频通道格式元素也就是制作音频通道数据。所述音频通道数据中包括音频通道格式的元数据,所述音频通道格式的元数据用于描述音频通道格式的结构特性的信息。
[0031]音频流,是渲染通道、对象、高阶环境音组件或包所需的音轨的组合。所述音频流格式用于建立音频轨道格式集和音频通道格式集或音频包格式之间的关系。所述音频流格式元素也就是制作音频流数据。所述音频流数据中包括音频流格式的元数据,所述音频流格式的元数据用于描述音频流格式的结构特性的信息。
[0032]所述音频轨道格式对应于存储介质中单个音轨中的一组样本或数据,用于描述原始音频数据的轨道格式,及渲染器的解码信号。音频轨道格式来自音频流格式,用于识别成功解码音轨数据所需的音轨本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频包格式的元数据,其特征在于,包括:属性区,包括音频包的音频包格式标识和音频包格式名称,所述音频包格式标识包括指示所述音频包的音频类型为音床类型的信息;子元素区,包括:第一引用信息、第二引用信息和绝对距离,所述第一引用信息包括渲染时与所述音频包相关的音频通道所采用的音频通道格式信息,所述第二引用信息包括渲染时与所述音频包相关的音频包所采用的音频包格式信息,所述绝对距离指示为预设无效值,所述预设无效值用于表征渲染时所述音床类型的音频包不存在对应的距离。2.根据权利要求1所述的音频包格式的元数据,其特征在于,所述属性区还包括指示渲染时向上引用的音频对象或音频包格式采用音频通道的音频类型。3.根据权利要求1所述的音频包格式的元数据,其特征在于,所述属性区还包括指示渲染时向下引用的音频通道格式或音频包格式采用音频通道的通道类型标签。4.根据权利要求1所述的音频包格式的元...

【专利技术属性】
技术研发人员:吴健
申请(专利权)人:赛因芯微北京电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1