一种音频流元数据和生成方法、电子设备及存储介质技术

技术编号:32528756 阅读:9 留言:0更新日期:2022-03-05 11:22
本公开涉及一种音频流元数据和生成方法、电子设备及存储介质。音频流元数据,包括:属性区,包括音频流名称、音频流标识和音频流格式描述信息;子元素区,包括音频通道格式引用信息和音频包格式引用信息的其中之一,还包括音频轨道格式引用信息。音频数据在渲染时在空间中能够实现三维声音的复现,从而提高了声音场景的质量。景的质量。景的质量。

【技术实现步骤摘要】
一种音频流元数据和生成方法、电子设备及存储介质


[0001]本公开涉及音频处理的
,尤其涉及一种音频流元数据和生成方法、电子设备及存储介质。

技术介绍

[0002]随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器系统则对多个通道进行排序约束,进而环绕6.1扬声器系统、环绕7.1扬声器系统等使音频处理千变万化,把正确的信号传递给合适的扬声器形成相互牵连的效果。因此,随着声音变得更具沉浸感和交互性,音频处理的复杂性也大大增加。
[0003]音频声道(或声道),是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。而声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。例如,在环绕5.1扬声器系统中包括6个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器;在环绕7.1扬声器系统中包括8个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器。
[0004]因此,当前扬声器系统实现的效果依赖于扬声器的数量和空间位置。例如,双声道扬声器系统无法实现环绕5.1扬声器系统的效果。
[0005]本公开提供了一种音频流元数据和构造方法,以便提供一种能够解决上述技术问题的元数据。

技术实现思路

[0006]本公开的目的在于提出一种音频流元数据和生成方法、电子设备及存储介质,以解决上述技术问题之一。
[0007]为实现上述目的,本公开第一方面提供了一种音频流元数据,包括:
[0008]属性区,包括音频流名称、音频流标识和音频流格式描述信息;
[0009]子元素区,包括音频通道格式引用信息和音频包格式引用信息的其中之一,还包括音频轨道格式引用信息。
[0010]为实现上述目的,本公开第二方面提供了一种音频流元数据的生成方法,包括:
[0011]响应于用户针对音频流元数据的设置操作,生成包括如第一方面所述音频流元数据。
[0012]为实现上述目的,本公开第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
[0013]所述存储器,用于存储一个或多个程序;
[0014]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器生成包括如第一方面所述音频流元数据。
[0015]为实现上述目的,本公开第四方面提供了一种包含计算机可执行指令的存储介
质,所述计算机可执行指令在由计算机处理器生成包括如第一方面所述音频流元数据。
[0016]由上可见,本公开的音频流元数据,可以指示音频轨道格式和音频通道格式之间的关系,或音频轨道格式和音频包格式之间的关系。以在空间中能够实现三维声音的复现,从而提高了声音场景的质量。
附图说明
[0017]图1为本公开实施例1中提供了一种三维声音频制作模型的示意图;
[0018]图2为本公开实施例2中的一种音频流元数据的生成方法的流程图;
[0019]图3为本公开实施例3提供的一种电子设备的结构示意图。
具体实施方式
[0020]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0021]如图1所示,三维声音频制作模型由一组制作元素组成,每个制作元素用于描述音频制作的一个阶段,三维声音频制作模型包括内容制作部分和格式制作部分。
[0022]其中,所述内容制作部分包括:音频节目元素、音频内容元素、音频对象元素和音轨唯一标识元素;所述格式制作部分包括:音频包格式元素、音频通道格式元素、音频流格式元素和音频轨道格式元素;
[0023]所述音频节目元素引用至少一个所述音频内容元素;所述音频内容元素引用至少一个音频对象元素;所述音频对象元素引用对应的所述音频包格式元素和对应的所述音轨唯一标识元素;所述音轨唯一标识元素引用对应的所述音频轨道格式元素和对应的所述音频包格式元素;
[0024]所述音频包格式元素引用至少一个所述音频通道格式元素;所述音频流格式元素引用对应的所述音频通道格式元素和对应的所述音频包格式元素;所述音频轨道格式元素和对应的所述音频流格式元素相互引用。元素间的引用关系在图1中以箭头表示。
[0025]音频节目可以包括但不限于叙述、声音效果和背景音乐,所述音频节目元素可以用于描述节目,所述节目包括至少一个内容,所述音频内容元素用于描述所述音频节目元素中对应的一个内容。音频节目元素可以引用一个或多个音频内容元素,音频内容元素组合在一起以构建为完整的音频节目元素。
[0026]所述音频内容元素描述音频节目的一个组成部分(例如背景音乐)的内容,并引用一个或多个音频对象元素将内容与其格式联系起来。
[0027]所述音频对象元素用于建立内容、格式和有价值的信息,并确定实际音轨的音轨唯一标识。
[0028]格式制作部分包括:音频包格式元素、音频通道格式元素、音频流格式元素、音频轨道格式元素。
[0029]所述音频包格式元素,可以用于描述所述音频对象元素和原始音频数据依据通道分组打包时采用的格式。
[0030]所述音频通道格式元素可以用于表示单个音频采样序列和对其执行的预设操作,
例如,在场景中渲染对象的移动。所述音频通道格式元素可以包含至少一个音频块格式元素。音频块格式元素可以视为音频通道格式元素的子元素,所以,音频通道格式元素和音频块格式元素之间为一种包含关系。
[0031]所述音频轨道格式元素对应于单个音轨中的一组样本或数据,用于描述原始音频数据的格式,及渲染器的解码信号,还用于识别成功解码音轨数据所需的音轨组合。
[0032]通过三维声音频制作模型对原始音频数据进行制作后生成包含元数据的合成音频数据。
[0033]所述元数据(Metadata)是描述数据特性的信息,元数据支持的功能包括指示存储位置、历史数据、资源查找或文件记录。
[0034]合成音频数据以通信方式传输到远端后,由远端基于元数据对合成音频数据进行渲染,还原原始声音场景。
[0035]图1中示出了内容制作部分、格式制作部分和BW64(Broadcast Wave

64bit,64位广播波)文件之间的划分。内容制作部分和格式制作部分都构成了XML格式的元数据,它通常包含在BW64文件的一个块(“axml”块)中。底部的BW64文件部分包含“通道分配(chna)”块,它是一个查找表,用于连接元数据和文件中的音频节目。
[0036]内容制作部分描述音频的
技术实现思路
,例如它是否包含对话或特定语言,以及响度元数据。格式部分描述音频曲目的通道类型以及它们是如何组合在一起的,例如立体声对中的左声道和右声道。内容制作部分的元索通常本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频流元数据,其特征在于,包括:属性区,包括音频流名称、音频流标识和音频流格式描述信息;子元素区,包括音频通道格式引用信息和音频包格式引用信息的其中之一,还包括音频轨道格式引用信息。2.根据权利要求1所述的音频流元数据,其特征在于,所述音频流标识包括:用于指示所述音频流中包含的音频类型的音频类型标识和用于指示所述音频流对应的音频通道格式的音频通道标识。3.根据权利要求1所述的音频流元数据,其特征在于,所述音频流格式描述信息,包括格式标签和/或格式定义。4.根据权利要求1所述的音频流元数据,其特征在于,若所述子元素区包括所述音频通道格式引用信息,所述音频流元数据设置为基于所述音频轨道格式引用信息和所述音频通道格式引用信息,指示音频轨道格式集和音频通道格式集之间的关系;若所述子元素区包括所述音频包格式引用信息,所述音频流元数据设置为基于所述音频轨道格式引用信息和所述音频包格式引用信息,指示音频轨道格式集和音频包格式之间的关系。5.根据权利要求1所述的音频流元数据,其特征在于,对于非...

【专利技术属性】
技术研发人员:吴健
申请(专利权)人:赛因芯微北京电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1