串行音频元数据帧生成方法、装置、设备及存储介质制造方法及图纸

技术编号:33122191 阅读:17 留言:0更新日期:2022-04-17 00:26
本申请涉及一种串行音频元数据帧生成方法、装置、设备及存储介质,该方法包括:获取串行音频元数据帧的帧头子元素和音频格式扩展子元素;将所述帧头子元素置于所述串行音频元数据帧的头部,将所述音频格式扩展子元素置于所述帧头子元素之后,生成所述串行音频元数据帧;其中,所述帧头子元素包括帧格式元素和传输音频接口格式元素,所述音频格式扩展子元素包括规定的音频模型元数据。以生成串行音频模式下的串行音频元数据帧,实现声音模型元数据的工作流。的工作流。的工作流。

【技术实现步骤摘要】
串行音频元数据帧生成方法、装置、设备及存储介质


[0001]本申请涉及音频处理的
,尤其涉及一种串行音频元数据帧生成方法、装置、设备及存储介质。

技术介绍

[0002]随着科技的发展,音频变得越来越复杂。由早期的单声道音频演变成立体声,工作重心也注重左右声道的正确处理方式。但环绕声出现后,处理过程开始变得复杂。而环绕5.1扬声器系统则对多个通道进行排序约束,进而环绕6.1扬声器系统、环绕7.1扬声器系统等使音频处理千变万化,把正确的信号传递给合适的扬声器形成相互牵连的效果。因此,随着声音变得更具沉浸感和交互性,音频处理的复杂性也大大增加。
[0003]音频声道(或声道),是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号。而声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。例如,在环绕5.1扬声器系统中包括6个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器;在环绕7.1扬声器系统中包括8个不同空间位置的音频信号,每个独立的音频信号被用于驱动对应空间位置的扬声器。
[0004]因此,当前扬声器系统实现的效果依赖于扬声器的数量和空间位置。例如,双声道扬声器系统无法实现环绕5.1扬声器系统的效果。

技术实现思路

[0005]本申请的目的在于提出一种串行音频元数据帧生成方法、装置、设备及存储介质,以生成串行音频模式下的串行音频元数据帧,实现声音模型元数据的工作流。
[0006]本申请第一方面提供了一种串行音频元数据帧生成方法,包括
[0007]获取串行音频元数据帧的帧头子元素和音频格式扩展子元素;
[0008]将所述帧头子元素置于所述音频格式扩展子元素的前部,生成所述串行音频元数据帧;
[0009]其中,所述帧头子元素包括帧格式元素和传输音频接口格式元素,所述音频格式扩展子元素包括规定的音频模型元数据。
[0010]本申请第二方面提供了一种串行音频元数据帧生成装置,包括:
[0011]获取模块,用于获取串行音频元数据帧的帧头子元素和音频格式扩展子元素;
[0012]帧生成模块,用于将所述帧头子元素置于所述音频格式扩展子元素的前部,生成所述串行音频元数据帧;
[0013]其中,所述帧头子元素包括帧格式元素和传输音频接口格式元素,所述音频格式扩展子元素包括规定的音频模型元数据。
[0014]本申请第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;
[0015]所述存储器,用于存储一个或多个程序;
[0016]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理
器实现如任意实施例提供的串行音频元数据帧生成方法。
[0017]本申请第四方面提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器实现如任意实施例提供的串行音频元数据帧生成方法。
[0018]由上可见,本申请串行音频元数据帧生成方法,生成串行音频模式下的串行音频元数据帧,在实时制作和流式音频应用将现有音频文件制作成帧,以便通过传送接口实时传送这些帧。
附图说明
[0019]图1为本申请实施例中提供了一种三维声音频模型的示意图;
[0020]图2为本申请实施例中的串行音频元数据帧生成方法的流程图;
[0021]图3为本申请实施例中的串行音频元数据帧生成装置的结构示意图;
[0022]图4为本申请实施例中的一种电子设备的结构示意图;
[0023]图5为本申请实施例中的串行音频元数据帧的音频模型元数据的结构;
[0024]图6为本申请实施例中的一个流中每个帧的元数据块结构示例;
[0025]图7为本申请实施例中的分割帧流中串行音频元数据结构。
具体实施方式
[0026]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0027]实施例
[0028]如图1所示,三维声音频模型由一组元素组成,每个元素用于描述音频制作的一个阶段,三维声音频模型包括内容部分和格式部分。
[0029]其中,所述内容部分包括:音频节目(audioProgramme)元素、音频内容(audioContent)元素、音频对象(audioObject)元素和音轨唯一标识(audioTrackUID)元素;所述格式部分包括:音频包格式(audioPackFormat)元素、音频通道格式(audioChannelFormat)元素、音频流格式(audioStreamFormat)元素和音频轨道格式(audioTrackFormat)元素;
[0030]所述音频节目元素引用至少一个所述音频内容元素;所述音频内容元素引用至少一个音频对象元素;所述音频对象元素引用对应的所述音频包格式元素和对应的所述音轨唯一标识元素;所述音轨唯一标识元素引用对应的所述音频轨道格式元素和对应的所述音频包格式元素;
[0031]所述音频包格式元素引用至少一个所述音频通道格式元素;所述音频流格式元素引用对应的所述音频通道格式元素和对应的所述音频包格式元素;所述音频轨道格式元素和对应的所述音频流格式元素相互引用。元素间的引用关系在图1中以箭头表示。
[0032]音频节目可以包括但不限于叙述、声音效果和背景音乐,所述音频节目元素可以用于描述节目,所述节目包括至少一个内容,所述音频内容元素用于描述所述音频节目元素中对应的一个内容。音频节目元素可以引用一个或多个音频内容元素,音频内容元素组合在一起以构建为完整的音频节目元素。
[0033]所述音频内容元素描述音频节目的一个组成部分(例如背景音乐)的内容,并引用一个或多个音频对象元素将内容与其格式联系起来。
[0034]所述音频对象元素用于建立内容、格式和有价值的信息,并确定实际音轨的音轨唯一标识。
[0035]格式部分包括:音频包格式元素、音频通道格式元素、音频流格式元素、音频轨道格式元素。
[0036]所述音频包格式元素,可以用于描述所述音频对象元素和原始音频数据依据通道分组打包时采用的格式。
[0037]所述音频通道格式元素可以用于表示单个音频采样序列和对其执行的预设操作,例如,在场景中渲染对象的移动。所述音频通道格式元素可以包含至少一个音频块格式元素。音频块格式元素可以视为音频通道格式元素的子元素,所以,音频通道格式元素和音频块格式元素之间为一种包含关系。
[0038]音频流,是渲染通道、对象、高阶环境音组件或包所需的音轨的组合。所述音频流格式元素用于建立音频轨道格式元素集和音频通道格式元素集之间的关系,或音频轨道格式集和音频包格式之间的关系。
[0039]所述音频轨道格式元素对应于单个音轨中的一组样本或数据,用于描述原始音频数据的格式,及本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种串行音频元数据帧生成方法,其特征在于,包括:获取串行音频元数据帧的帧头子元素和音频格式扩展子元素;将所述帧头子元素置于所述串行音频元数据帧的头部,将所述音频格式扩展子元素置于所述帧头子元素之后,生成所述串行音频元数据帧;其中,所述帧头子元素包括帧格式元素和传输音频接口格式元素,所述音频格式扩展子元素包括设定的音频模型元数据。2.根据权利要求1所述的方法,其特征在于,所述音频格式扩展子元素包括所述音频模型元数据中以下元素的至少一种:音频节目元素、音频内容元素、音频对象元素、音轨唯一标识元素、音频包格式元素、音频通道格式元素、音频流格式元素和音频轨道格式元素,其中,所述音频通道格式元素包含至少一个音频块格式元素。3.根据权利要求1所述的方法,其特征在于,获取到的所述帧头子元素中的所述帧格式元素用于描述包含音频模型元数据的帧的规格和相关音频帧的规格。4.根据权利要求3所述的方法,其特征在于,获取所述帧头子元素,包括:获取所述帧格式元素的属性和子元素,所述帧格式元素的属性包括:帧格式标识、帧开始时间、帧持续时间、帧类型、音频块格式定时参数时间模式和帧序列标识;所述帧格式元素的子元素包括:更改音频模型元素标识和元数据块音频模型元素引用信息。5.根据权利要求4所述的方法,其特征在于,所述串行音频元数据帧的帧类型包括完整帧、中间帧、分割帧、报头帧和全部帧;对于所述完整帧、中间帧、报头帧和全部帧,获取所述帧格式元素的属性,还包括:获取完整帧数;对于所述分割帧,获取所述帧格式元...

【专利技术属性】
技术研发人员:吴健
申请(专利权)人:赛因芯微北京电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1