一种符合数字电影规范的三维音频节目码流传输的方法技术

技术编号:14520176 阅读:104 留言:0更新日期:2017-02-01 23:24
本发明专利技术公开了一种符合数字电影技术规范(DCP)的三维音频节目码流传输的方法,包括:音频流转换:根据原始三维音频节目的声道数、声音对象数和格式信息来确定封装音频文件的声道数和格式信息;生成标识帧结构和格式信息的原始音频边信息;按照确定的封装音频文件格式输出封装音频文件;DCP打包;DCP解码;音频流逆转换,接收封装音频流数据,从所确定的原始音频边信息通路中搜索封装音频标识符,若找到,则判断为封装音频格式,该位置为封装音频帧结构的开始,根据边信息从接收到的音频数据中恢复出原始音频数据;音频处理和播放。本发明专利技术在能支持新的三维音频格式的前提下,仍能保证对传统的音频节目源(如5.1或7.1)的正确播放。

【技术实现步骤摘要】

本专利技术涉及数字电影音频的传输方法,具体涉及一种符合数字电影规范的三维音频节目码流传输的方法。
技术介绍
目前大部分数字电影播放服务器符合好莱坞主导制定的数字电影技术规范(DCI规范)。DCI规范要求数字电影播放系统的音频子系统支持24比特采样精度,16声道、采样率为48kHz或96kHz的音频文件,特别要支持常见的5.1声道和7.1声道的数字电影音频文件,同时能实现两种采样率的灵活切换。随着技术和需求的发展,电影音频技术已经从环绕声技术进入到沉浸式三维音频的新时代,杜比的Atoms全景声、Auro-3D三维声、DTS:X临境音、中国的WANOS全景声技术和中国多维声等都已经突破了7.1声道的限制,需要传输和呈现更多声道的音频数据。其中,Atmos和WANOS全景声技术在多声道的基础上,增加了大量的同步声音对象(即含有声音波形、声音运动轨迹和运动特性等的声音信号),以获得更好的听觉体验。目前,大部分数字电影播放服务器最多支持到16个声道,无法播放更多声道的节目源,这对新的数字电影音频技术和格式的应用造成了巨大障碍。一方面,制定和形成新的支持三维音频的数字电影播放技术规范需要时间,难以满足不断涌现的新的三维音频技术的发展需要,另一方面,将现有的数字电影播放服务器进行技术升级和替换,需要支付高昂成本且造成已有投资的浪费。而在很多三维音频(如WANOS、Atmos全景声)应用中,音频节目所包含的声道数通常多于16声道,并可能包含多个同步声音对象,此时,三维音频节目无法在目前常用的影院播放服务器上进行播放。DCI规范规定音频数据从打包、发行到存储都必须保持没有压缩的PCM格式,即制作端的音频文件中的数据与播放端数字电影播放服务器输出的音频流数据是一致的。
技术实现思路
专利技术目的:针对现有技术的不足,本专利技术提供一种符合数字电影规范的三维音频节目码流传输的方法,在能支持新的三维音频格式的前提下,仍能保证对5.1或7.1音频节目源的正确播放。技术方案:本专利技术所述符合数字电影规范的三维音频节目码流传输的方法,包括如下步骤:(1)音频流转换:根据原始三维音频节目的声道数、声音对象数和格式信息来确定封装音频文件的声道数和格式信息;生成标识帧结构和格式信息的原始音频边信息;将原始音频、封装音频按照时间长度分为若干帧进行处理,对于每一帧,从原始三维音频节目中读取该帧原始音频数据,映射到封装音频文件中所对应的该帧数据中,当原始音频数据所需的比特数少于其所映射到的封装音频文件中所对应的该帧数据的比特数时,将空余部分填零,其中原始音频边信息被映射到封装音频文件该帧中的原始音频边信息通路;按照确定的封装音频文件格式输出封装音频文件;(2)DCP打包:将封装音频文件与视频文件、文本文件、播放列表文件一起进行打包,生成符合DCI规范的DCP(DigitalCinemaPackage)包;(3)DCP解码:对DCP包进行处理,解码其中的视频、音频数据,并通过数字接口将封装音频流数据输出;(4)音频流逆转换:接收封装音频流数据,从所确定的原始音频边信息通路中搜索封装音频标识符,若找到,则判断为封装音频格式,该位置为封装音频帧结构的开始,根据边信息从接收到的封装音频流数据中恢复出原始音频数据,执行步骤(51),若没有找到封装音频标识符,则直接执行步骤(52);(51)音频处理和播放:对封装音频流进行解码、处理,按照原始音频的采样率、声道数、声音对象和设定的声场进行播放;(52)音频处理和播放:按照通用的数字电影音频处理过程对封装音频流数据进行播放。进一步完善上述技术方案,所述步骤(1)中首先判断原始三维音频节目是否能够通过符合DCI规范的音频文件进行传输,如果原始音频数据所需比特数大于其所映射到的封装音频文件中所对应的该帧数据的比特数时,对原始三维音频节目进行压缩编码,使编码后的码率低于封装音频文件的码率。进一步地,所述生成标识帧结构和格式信息的原始音频边信息包括封装音频标识符、原始音频格式信息、原始音频采样率、原始音频声道数、声道-通路映射信息。进一步地,所述封装音频标识符为用于标识封装音频的字符串。进一步地,所述三维音频节目从内容包括多声道节目、多个声道和多个声音对象的节目、多个声音对象的音频节目;所述三维音频节目从数据形式上包括一个音频文件或压缩码流文件,一组文件的集合,实时传输的音频流数据。进一步地,当所述三维音频节目为多声道节目时,所述步骤(1)中每帧原始三维音频节目至少包含N1*M1个字的信息,N1为声道数,M1=frame_t*samplerate1、frame_t为帧长、samplerate1为采样频率,每帧编码的边信息数据长度为M3个字,待传输的一帧原始音频信息为N1*M1+M3个字;当所述三维音频节目为多个声道和多个声音对象的节目时,每帧原始三维音频节目至少包含NA3个字的信息,每帧编码的边信息数据长度为M3,待传输的一帧原始音频信息为NA3+M3个字;对于封装音频文件整个通路的传输能力为每帧N2*M2个字,N2个声道的数据以dataout[i][j](0≤i≤N2-1,0≤j≤M2-1)表示,M2=frame_t*samplerate2,samplerate2为采样频率、frame_t为帧长。进一步地,当所述三维音频节目为多声道节目时,将每帧待传输的原始音频数据和原始音频边信息N1*M1+M3个字映射到封装音频文件中并填充N2*M2-(N1*M1+M3)个字;或将原始音频数据进行压缩编码,组织成N4个字的压缩码流streamin[j],将压缩码流的数据映射到封装音频文件中。进一步地,当所述三维音频节目为多个声道和多个声音对象的节目时,需要传输的数据每帧为NA3+M3个字,将一帧中原始音频数据、原始音频边信息映射到封装音频文件数据的方法包括直接将每帧需要传输的原始音频数据NA3个字和边信息M3个字直接加以组织并映射封装音频文件所对应的本帧数据中占用N2*M2个字中的NA3+M3个,并填充N2*M2-(NA3+M3)个字;或将原始文件数据进行压缩编码,组织成N4个字的压缩码流streamin[j],将压缩码流的数据映射到封装音频文件中。进一步地,当所述三维音频节目为多个声道和多个声音对象的节目时,将每帧待传输的原始音频数据和原始音频边信息NA3+M3个字映射到封装音频文件中并填充N2*M2-(NA3+M3)个字;或将原始文件数据进行压缩编码,组织成N5个字的压缩码流映射到封装音频文件中。进一步地,当所述三维音频节目为音频文件或压缩码流时,将一帧数据按内容分块,将封装音频文件中的两个或两个以上声道组合为复合通路,将原始音频数据的全部或一个分块或原始音频边信息映射到该复合通路;或将封装音频文件中的一个声道分为两个或两个以上子通路,将原始音频数据的全部或一个分块或原始音频边信息映射到任一子通路。进一地,当所述三维音频节目为包含声音对象的三维音频节目或三维音频压缩码流时,一帧原始音频包括三维音频的基础多声道数据、对象波形数据和声音轨迹信息,对一帧三维音频的码流数据分块,基础多声道数据作为第一个分块,对象波形数据作为第二个分块,帧头信息和声音轨迹信息作为第三个分块添加到原始音频边信息中、作为边信息的一部分,将边信息映射到特定本文档来自技高网
...

【技术保护点】
一种符合数字电影规范的三维音频节目码流传输的方法,其特征在于,包括如下步骤:(1)音频流转换:根据原始三维音频节目的声道数、声音对象数和格式信息来确定封装音频文件的声道数和格式信息;生成标识帧结构和格式信息的原始音频边信息;将原始音频、封装音频按照时间长度分为若干帧进行处理,对于每一帧,从原始三维音频节目中读取该帧原始音频数据,映射到封装音频文件中所对应的该帧数据中,当原始音频数据所需的比特数少于其所映射到的封装音频文件中所对应的该帧数据的比特数时,将空余部分填零,其中原始音频边信息被映射到封装音频文件该帧中的原始音频边信息通路;按照确定的封装音频文件格式输出封装音频文件;(2)DCP打包:将封装音频文件与视频文件、文本文件、播放列表文件一起进行打包,生成符合DCI规范的DCP包;(3)DCP解码:对DCP包进行处理,解码其中的视频、音频数据,并通过数字接口将封装音频流数据输出;(4)音频流逆转换:接收封装音频流数据,从所确定的原始音频边信息通路中搜索封装音频标识符,若找到,则判断为封装音频格式,该位置为封装音频帧结构的开始,根据边信息从接收到的封装音频流数据中恢复出原始音频数据,执行步骤(51),若没有找到封装音频标识符,则直接执行步骤(52);(51)音频处理和播放:对封装音频流进行解码、处理,按照原始音频的采样率、声道数、声音对象和设定的声场进行播放;(52)音频处理和播放:按照通用的数字电影音频处理过程对封装音频流数据进行播放。...

【技术特征摘要】
1.一种符合数字电影规范的三维音频节目码流传输的方法,其特征在于,包括如下步骤:(1)音频流转换:根据原始三维音频节目的声道数、声音对象数和格式信息来确定封装音频文件的声道数和格式信息;生成标识帧结构和格式信息的原始音频边信息;将原始音频、封装音频按照时间长度分为若干帧进行处理,对于每一帧,从原始三维音频节目中读取该帧原始音频数据,映射到封装音频文件中所对应的该帧数据中,当原始音频数据所需的比特数少于其所映射到的封装音频文件中所对应的该帧数据的比特数时,将空余部分填零,其中原始音频边信息被映射到封装音频文件该帧中的原始音频边信息通路;按照确定的封装音频文件格式输出封装音频文件;(2)DCP打包:将封装音频文件与视频文件、文本文件、播放列表文件一起进行打包,生成符合DCI规范的DCP包;(3)DCP解码:对DCP包进行处理,解码其中的视频、音频数据,并通过数字接口将封装音频流数据输出;(4)音频流逆转换:接收封装音频流数据,从所确定的原始音频边信息通路中搜索封装音频标识符,若找到,则判断为封装音频格式,该位置为封装音频帧结构的开始,根据边信息从接收到的封装音频流数据中恢复出原始音频数据,执行步骤(51),若没有找到封装音频标识符,则直接执行步骤(52);(51)音频处理和播放:对封装音频流进行解码、处理,按照原始音频的采样率、声道数、声音对象和设定的声场进行播放;(52)音频处理和播放:按照通用的数字电影音频处理过程对封装音频流数据进行播放。2.根据权利要求1所述的符合数字电影规范的三维音频节目码流传输的方法,其特征在于:所述步骤(1)中首先判断原始三维音频节目是否能够通过符合DCI规范的音频文件进行传输,如果原始音频数据所需比特数大于其所映射到的封装音频文件中所对应的该帧数据的比特数时,对原始三维音频节目进行压缩编码,使编码后的码率低于封装音频文件的码率。3.根据权利要求1或2所述的符合数字电影规范的三维音频节目码流传输的方法,其特征在于:所述生成标识帧结构和格式信息的原始音频边信息包括封装音频标识符、原始音频格式信息、原始音频采样率、原始音频声道数、声道-通路映射信息。4.根据权利要求3所述的符合数字电影规范的三维音频节目码流传输的方法,其特征在于:所述封装音频标识符为用于标识封装音频的字符串。5.根据权利要求1或2所述的符合数字电影规范的三维音频节目码流传输的方法,其特征在于:所述三维音频节目从内容上包括多声道节目,多个声道和多个声音对象的节目,多个声音对象的音频节目;所述三维音频节目从数据形式上包括一个音频文件或压缩码流文件,或一组文件的集合,或实时传输的音频流数据。6.根据权利要求5所述的符合数字电影规范的三维音频节目...

【专利技术属性】
技术研发人员:潘兴德吴超刚陈笑天
申请(专利权)人:南京青衿信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1