一种可变长度的全景声信号编解码方法技术

技术编号:18973482 阅读:17 留言:0更新日期:2018-09-19 04:03
本发明专利技术公开一种可变长度的全景声信号编解码方法,编码包括:计算所需编码全景声信号的音频样点数;将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;将整帧部分按标准方式编码,将短帧部分按短帧方式编码,将短帧的长度信息写在码流中的frame_length字段;解码包括:每次读取一个音频帧对应采样点数的码流数据;若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段进行解码。本发明专利技术能够在电影工程中对任意片段进行添加、删除、替换等操作,并可以完整、正确地进行编解码,而且不会影响已经编好的数据。

【技术实现步骤摘要】
一种可变长度的全景声信号编解码方法
本专利技术涉及一种全景声信号编解码处理
,具体涉及一种可变长度的全景声信号的编解码方法。
技术介绍
经过多年发展,立体声、5.1、7.1环绕声等系统已经获得了广泛的应用,这些系统因缺乏声音的高度信息,最多只能呈现二维的声音。在真实的世界中,全景声(也称三维声)是声音最真实的呈现和表达方式,无论自然界、艺术领域或视听娱乐领域,全景声都是未来的发展趋势。在现有的系统中,全景声可以是多声道信号(如9.1、11.1、13.1和22.2等),可以是多个声音对象,也可以是两者的组合。在全景声系统中,多声道信号可以是环绕声信号,如5.1、7.1等,也可以是多层多声道信号(即多层声道信号分布在不同高度平面)。例如,有些全景声系统采用中间层及顶层的两层平面,有些全景声系统采用三层系统等。有些全景声系统只有多层多声道信号,但没有声音对象,例如SMPTE的22.2三维声系统和AURO9.1系统等。有些全景声系统则既有多层多声道信号,也有声音对象,例如MPEG-H、DolbyAtmos和DTS:X系统。当然,作为一个极端的例子,全景声也可以全部是声音对象信号。一部全景声电影在制作、混录时普遍采用数字音频工作站(DigitalAudioWorkstation,DAW),比如ProTools、Nuendo、Cubase、LogicPro、AdobeAudition等。混录师可以将多声道音频和多个声音对象放入电影制作工程中,以达到全景声的听觉效果。电影在制作完毕后,需要对整部电影的音频数据进行符合全景声格式的音频编码,并将编码后的数据和视频一起封装成DCP包,拷贝至影院服务器,再通过全景声音频解码器播放出来,呈现给观众。目前,这种全景声音频编解码技术可以将整部电影完整、正确地编解码,在放映端效果甚好。但有时,当整部电影完成编码后,导演组会临时调整一些画面或场景,那么相应的音频数据也会发生变化,所以要对所有被修改的数据重新进行编码,同时不能影响已经编好的其他数据。按照现有的技术,音频编码的帧长是固定的,所以一旦音频数据重新组织后,必然会影响后面所有音频数据的组织方式。那么从修改的部分开始,直到电影结束,都需要重新编码,很浪费时间;而我们希望,仅重编修改过的部分。
技术实现思路
专利技术目的:本专利技术目的在于针对现有技术的不足,提供一种可变长度的全景声音频编解码方法,该方法在保证全景声电影能够完整、正确编解码的情况下,同时能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,从而在很大程度上对全景声音频编码技术进行了完善。技术方案:本专利技术所述可变长度的全景声信号编码方法,包括如下步骤:(1)计算所需编码全景声信号的音频样点数;(2)将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;(3)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段。上述编码方法输出码流的解码方法,包括如下步骤:(1)每次读取一个音频帧对应采样点数的码流数据;(2)若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段按如下规则进行解码:一个音频帧对应j个采样点数,当读取第m个音频帧时,在j个样点之内的第n个样点位置,遇到了长度为k的音频帧,k≤1024,判断(21)若n+k=1024,则输出第m帧音频数据;同时,若n>0,则在此之前先输出第m-1帧音频数据;(22)若n+k>1024,此时输出第m-1帧,等待下次读取数据时解码第m帧;(23)若n+k<1024,解码第m帧,并继续读取第m+1帧,令n=n+k,k=下一帧码流长度,然后重复步骤(21)、(22),直到n+k≥1024时,根据步骤(21)、(22)输出音频数据。采用上述编解码方法能够在电影工程中对任意片段进行添加、删除、替换等操作的前提下,依旧可以完整、正确地进行编解码,而且不会影响已经编好的数据,具体如下:插入操作的编码方法:(1)计算插入点处一个视频帧对应的音频样点数;(2)计算步骤(1)视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;(3)计算待插入视频帧的音频样点数;(4)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则插入起点的前一个音频帧也一同重新组织;(5)将步骤(4)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;(6)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;(7)将文件Data0拼接到步骤(6)输出的码流后面。插入操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。删除操作的编码方法:(1)计算删除开始点处一个视频帧对应的音频样点数;(2)计算步骤(1)视频帧对应的音频帧数;(3)计算删除终点对应的样点数;(4)计算删除终点对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;(5)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2),则删除起点的前一个音频帧也一同重新组织;(6)将步骤(5)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;(7)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;(8)将文件Data0拼接到步骤(7)输出的码流后面。删除操作的解码方法:(1)每次读取一个音频帧对应j个采样点数的码流数据;(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。替换操作的编码方法:(1)计算替换开始处一个视频帧对应的音频样点数;(2)计算步骤(1)视频帧对应的音频帧数;(3)计算替换终点处视频帧对应的音频样点数;(4)计算替换终点处视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;(5)计算所有需要重新组织的音频样点数;如果采用了前后帧在时域上有交叠的编码方法(如ac3、aac、avs2本文档来自技高网
...

【技术保护点】
1.一种可变长度的全景声信号编码方法,其特征在于,包括如下步骤:(1)计算所需编码全景声信号的音频样点数;(2)将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;(3)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段。

【技术特征摘要】
1.一种可变长度的全景声信号编码方法,其特征在于,包括如下步骤:(1)计算所需编码全景声信号的音频样点数;(2)将音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;(3)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段。2.一种用于权利要求1编码方法输出码流的解码方法,其特征在于,包括如下步骤:(1)每次读取一个音频帧对应采样点数的码流数据;(2)若码流数据对应的音频帧为整帧,按标准方式解码;若码流数据对应的音频帧包含有短帧,根据码流中长度信息frame_length字段按如下规则进行解码:一个音频帧对应j个采样点数,当读取第m个音频帧时,在j个样点之内的第n个样点位置,遇到了长度为k的音频帧,k≤1024,判断(21)若n+k=1024,则输出第m帧音频数据;同时,若n>0,则在此之前先输出第m-1帧音频数据;(22)若n+k>1024,此时输出第m-1帧,等待下次读取数据时解码第m帧;(23)若n+k<1024,解码第m帧,并继续读取第m+1帧,令n=n+k,k=下一帧码流长度,然后重复步骤(21)、(22),直到n+k≥1024时,根据步骤(21)、(22)输出音频数据。3.根据权利要求1所述全景声信号编码方法进行插入视频帧的编码方法,其特征在于,包括如下步骤:(1)计算插入点处一个视频帧对应的音频样点数;(2)计算步骤(1)视频帧对应的音频帧数,并将计算所得音频帧数之后的数据另存为文件Data0;(3)计算待插入视频帧的音频样点数;(4)计算所有需要重新组织的音频样点数;(5)将步骤(4)计算所得音频样点数按采样点数划分为整帧,不满整帧部分的划分为短帧;(6)将整帧部分按标准方式编码,输出对应样点数的码流;将短帧部分按短帧方式编码,输出短帧对应样点数的码流,将短帧的长度信息乘以位深和AES通道数后写在码流中的frame_length字段;(7)将文件Data0拼接到步骤(6)输出的码流后面。4.一种用于权利要求3所述编码方法输出码流的解码方法,其特征在于,包括如下步骤:(1)每次读取一个音频帧对应j个采样点数的码流数据;(2)若码流数据对应的音频帧为整帧,按标准方式解码;若读取的第m个音频帧包含有短帧,根据码流中长度信息frame_length字段,读取短帧长度k个数据并解码短帧;(3)读取第m+1帧数据,将第m帧中(j-k)个数据、第m+1帧中k个数据合并后按标准方式解码;(4)重复步骤(3),继续读取下一帧数据直至所有数据解码完毕。5.根据权利要求1所述全景声信号编码方法进行删除视频帧的编码方法,其特征在于,包括如下步骤:(1)计算删除开始点处一个视频帧对应的音频样点数;(2)计算步骤(1)视频帧...

【专利技术属性】
技术研发人员:潘兴德黄旭吴超刚陈笑天
申请(专利权)人:全景声科技南京有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1