利用AES/EBU信道传输三维声信号的编解码器及其编解码方法技术

技术编号:18303056 阅读:83 留言:0更新日期:2018-06-28 12:35
本发明专利技术公开一种利用AES/EBU信道传输三维声信号的编解码器及其编解码方法,包括下混及基础声道划分模块,用于接收基础声道和/或声音对象,按照下混方案进行下混和基础声道划分操作,输出下混兼容基础声道数据、扩展基础声道、基础声道划分边信息;扩展编码模块用于接收声音对象、下混方案、扩展基础声道、基础声道划分边信息,输出扩展编码数据;扩展编码数据再组织模块,用于接收扩展编码数据并进行重组操作;DCP打包模块,用于接收下混兼容基础声道数据和重组后的扩展编码数据并按照DCP规范打成DCP码流。本发明专利技术能够更好地兼容已有的环绕声电影播放系统,同时具备三维声的输出能力。

Codec and its encoding and decoding method for transmitting three dimensional acoustic signals using AES/EBU channel

The invention discloses a codec and codec method of using AES/EBU channel to transmit three dimensional sound signals, including lower mixing and basic sound channel partition module, used for receiving basic sound channel and / or sound object, and using the lower mixing scheme to divide the underlying channel division operation, output the mixed basic sound channel data, and expand the base. An extension coding module is used to receive sound objects, a hybrid scheme, an extended basic sound channel, a basic channel to divide the edge information, to output extended coded data, and to expand coded data to reorganize modules for receiving extended coded data and reorganizing operations; the DCP packaging module is used for receiving. The underlying mix is compatible with the basic channel data and the reformed extended coding data, and the DCP code stream is generated according to the DCP specification. The invention can better be compatible with the existing surround sound movie playing system, and has the output ability of three-dimensional sound.

【技术实现步骤摘要】
利用AES/EBU信道传输三维声信号的编解码器及其编解码方法
本专利技术涉及一种三维声编解码处理
,具体涉及一种利用AES/EBU信道传输三维声信号的编解码器及其编解码方法。
技术介绍
经过多年发展,立体声、5.1、7.1环绕声等系统已经获得了广泛的应用,这些系统因缺乏声音的高度信息,最多只能呈现二维的声音。在真实的世界中,三维声是声音最真实的呈现和表达方式,无论自然界、艺术领域或视听娱乐领域,三维声都是未来的发展趋势。在现有的系统中,三维声可以是多声道信号(如9.1、11.1、13.1和22.2等),可以是多个声音对象,也可以是两者的组合。在三维声系统中,多声道信号可以是环绕声信号,如5.1、7.1等,也可以是多层多声道信号(即多层声道信号分布在不同高度平面)。例如,有些三维声系统采用中间层及顶层的两层平面,有些三维声系统采用三层系统等。有些三维声系统只有多层多声道信号,但没有声音对象,例如SMPTE的22.2三维声系统和AURO9.1系统等。有些三维声系统则既有多层多声道信号,也有声音对象,例如MPEG-H、DolbyAtmos和DTS:X系统。当然,作为一个极端的例子,三维声也可以全部是声音对象信号。三维声作为刚刚出现的新技术和系统,还没有获得广泛的应用,其推广需要一个很长的发展阶段。因立体声、环绕声系统的普遍存在,三维声系统只有最大限度的兼容已经普遍存在的立体声或环绕声系统,才能获得市场的接受,并逐步成为主流。
技术实现思路
专利技术目的:本专利技术目的在于针对现有技术的不足,提供一种利用AES/EBU信道传输三维声信号的编解码方法,该方法可以更好兼容已有电影系统的内容制作和影院放映,同时具备三维声的输出能力。技术方案:本专利技术所述的三维声编码器,包括:下混及基础声道划分模块,用于接收基础声道和/或声音对象,按照下混方案进行下混和基础声道划分操作,输出下混兼容基础声道数据、扩展基础声道、基础声道划分边信息;扩展编码模块用于接收声音对象、下混方案、扩展基础声道、基础声道划分边信息,输出扩展编码数据;扩展编码数据再组织模块,用于接收扩展编码数据并进行重组操作;DCP打包模块,用于接收下混兼容基础声道数据和重组后的扩展编码数据并按照DCP规范打成DCP码流。进一步完善上述技术方案,在采用系统自适应选择的下混方案时,所述下混及基础声道划分模块包括下混模块和基础声道划分模块,下混模块用于接收基础声道和声音对象,输出下混兼容基础声道数据和下混方案,基础声道划分模块用于接收基础声道、下混模块生成的下混方案,输出扩展基础声道、基础声道划分边信息。进一步地,在采用外部输入确定的下混方案时,所述下混及基础声道划分模块包括下混模块和基础声道划分模块,下混模块用于接收基础声道、声音对象、外部输入的下混方案,输出下混兼容基础声道数据;基础声道划分模块用于接收基础声道、外部输入的下混方案,输出扩展基础声道、基础声道划分边信息。所述扩展编码模块采用有损编码或无损编码进行编码,在采用有损编码和外部输入确定的下混方案时,所述下混及基础声道划分模块包括下混模块和基础声道划分模块,基础声道划分模块用于接收基础声道和外部输入的下混方案,输出所述扩展基础声道和基础声道划分边信息;在采用有损编码时通过有损扩展解码模块将其输出的扩展编码数据进行解码,解码的扩展基础声道、解码的基础声道划分边信息、解码的下混方案、解码的声音对象与所述基础声道输入至下混模块,下混模块输出所述下混兼容基础声道数据。进一步地,所述下混模块按照下混方案将基础声道、声音对象下混为下混兼容基础声道,下混兼容基础声道信号分为基础声道下混分量、声音对象下混分量,基础声道下混分量分为扩展基础声道下混分量、兼容基础声道下混分量。所述下混模块采用PAN系统或WFS系统或Ambisonic系统或者功能类似的下混系统执行下混操作。进一步地,所述基础声道划分模块将基础声道划分为兼容基础声道、扩展基础声道,采用的基础声道划分方案根据基础声道的声道配置、所要兼容的多声道系统及下混映射函数确定,如根据对应下混声道的划分方法确定或者根据基于QR分解的划分方法确定。根据对应下混声道的划分方法确定采用的基础声道划分方案包括:S11:令集合Sbedt=Sbed,Ssrt=Ssr,基础声道信号集合下混兼容基础声道信号集合fb(k,i)为下混映射函数;S12:遍历集合Ssrt,找出一个满足如下关系的下混兼容基础声道k:对于所有属于Sc中的声道n,有fb(k,n)=0;若没有找到,执行步骤S15;S13:对于步骤S12中的下混兼容基础声道k,遍历集合Sbedt,找出fb(k,m)不为0且fb(k,m)可逆的基础声道m,若没有找到,执行步骤S15;S14:将步骤S13中找到的基础声道m加入到集合Sc中,得到新的Sc,从Ssrt中去除下混兼容基础声道k,得到新的Ssrt,从Sbedt中去除所有满足fb(k,i)不为0的基础声道i,得到新的Sbedt,若新的Ssrt、新的Sbedt都不为空,跳转到步骤S12,若新的Ssrt、新的Sbedt为空,则执行步骤S15;S15:Sc或Sc的子集作为基础声道集合Sbed的兼容基础声道集合。根据基于QR分解的划分方法确定的基础声道划分方案具体包括:S21:令Sbedc=Sbed,Sbed为基础声道信号集合;S22:采用矩阵运算形式表达Sbedc的下混:Hs_bedcop=HAc*Hbc,Hs_bedcop为Sbedc下混形成的下混分量组成的矩阵,Hbc为Sbedc中基础声道信号组成的矩阵,HAc为Sbedc下混系数矩阵;S23:对HAc进行QR分解,得HAc=Q*HR,其中Q为一个Ns×Ns的酉矩阵,HR是一个Ns×Nbc的上三角矩阵;S24:设M=min(Ns,Nbc),Ns为基础声道下混的声道数、Nbc为Sbedc的声道数,如果对于HR中每一个n=1…M,都满足r(n,n)>0,执行步骤S25;否则,对于每一个n=1…M,如果HR中r(n,n)=0,将Sbedc中第n个声道从Sbedc中剔除形成新的集合Sbedc‘,令Sbedc=Sbedc‘并执行步骤S22;S25:保留Sbedc中n=1…M的声道组成的集合,该集合或集合的子集作为基础声道集合Sbed的兼容基础声道集合。进一步地,所述下混兼容基础声道数据占用nn/2个AES/EBU信道数进行传输,其中nn为下混兼容基础声道的声道数,所述扩展编码数据占用mm个AES/EBU信道数进行传输,mm≤(8-nn/2);所述扩展编码数据重组后每帧的大小等于mm个AES/EBU信道传输能力ll,ll=mm*L*K*N,ll以字节为单位,L为一个AES/EBU信道能够传输的PCM声道数、K为单个扩展基础声道或声音对象进行编码时一帧的音频样本点数、N为一个音频样本点占用的字节数。为在AES/EBU信道实时传输扩展编码数据,所述扩展编码数据再组织模块对扩展编码数据进行重组操作:在每帧扩展编码数据的帧头添加音频标识头,在每帧扩展编码数据尾部填充数据使总帧长等于ll,将总帧长为ll的扩展编码数据等份成mm份子帧。采用上述三维编码器进行三维声编码方法,包括如下步骤:按照下混方案将基础声道和/或声音对象下混为所兼容的下混兼容基础声道数据,将基本文档来自技高网...
利用AES/EBU信道传输三维声信号的编解码器及其编解码方法

【技术保护点】
1.一种三维声编码器,其特征在于,包括:下混及基础声道划分模块,用于接收基础声道和/或声音对象,按照下混方案进行下混和基础声道划分操作,输出下混兼容基础声道数据、扩展基础声道、基础声道划分边信息;扩展编码模块用于接收声音对象、下混方案、扩展基础声道、基础声道划分边信息,输出扩展编码数据;扩展编码数据再组织模块,用于接收扩展编码数据并进行重组操作;DCP打包模块,用于接收下混兼容基础声道数据和重组后的扩展编码数据并按照DCP规范打成DCP码流。

【技术特征摘要】
1.一种三维声编码器,其特征在于,包括:下混及基础声道划分模块,用于接收基础声道和/或声音对象,按照下混方案进行下混和基础声道划分操作,输出下混兼容基础声道数据、扩展基础声道、基础声道划分边信息;扩展编码模块用于接收声音对象、下混方案、扩展基础声道、基础声道划分边信息,输出扩展编码数据;扩展编码数据再组织模块,用于接收扩展编码数据并进行重组操作;DCP打包模块,用于接收下混兼容基础声道数据和重组后的扩展编码数据并按照DCP规范打成DCP码流。2.根据权利要求1所述的三维声编码器,其特征在于:所述下混及基础声道划分模块包括下混模块和基础声道划分模块,下混模块用于接收基础声道和声音对象,输出下混兼容基础声道数据和下混方案,基础声道划分模块用于接收基础声道、下混模块生成的下混方案,输出扩展基础声道、基础声道划分边信息。3.根据权利要求1所述的三维声编码器,其特征在于:所述下混及基础声道划分模块包括下混模块和基础声道划分模块,下混模块用于接收基础声道、声音对象、外部输入的下混方案,输出下混兼容基础声道数据;基础声道划分模块用于接收基础声道、外部输入的下混方案,输出扩展基础声道、基础声道划分边信息。4.根据权利要求1所述的三维声编码器,其特征在于:所述下混及基础声道划分模块包括下混模块和基础声道划分模块,基础声道划分模块用于接收基础声道和外部输入的下混方案,输出所述扩展基础声道和基础声道划分边信息;所述扩展编码模块采用有损编码或无损编码,在采用有损编码时通过有损扩展解码模块将其输出的扩展编码数据进行解码,解码的扩展基础声道、解码的基础声道划分边信息、解码的下混方案、解码的声音对象与所述基础声道输入至下混模块,下混模块输出所述下混兼容基础声道数据。5.根据权利要求2至4任一所述三维声编码器,其特征在于:所述下混模块按照下混方案将基础声道、声音对象下混为下混兼容基础声道,下混兼容基础声道信号分为基础声道下混分量、声音对象下混分量,基础声道下混分量分为扩展基础声道下混分量、兼容基础声道下混分量。6.根据权利要求2至4任一所述的三维声编码器,其特征在于:所述基础声道划分模块将基础声道划分为兼容基础声道、扩展基础声道;所述基础声道划分模块采用的基础声道划分方案根据基础声道的声道配置、所要兼容的多声道系统及下混映射函数确定,如根据对应下混声道的划分方法确定或者根据基于QR分解的划分方法确定。7.根据权利要求6所述的三维声编码器,其特征在于:根据对应下混声道的划分方法确定的基础声道划分方案包括:S11:令集合Sbedt=Sbed,Ssrt=Ssr,基础声道信号集合下混兼容基础声道信号集合fb(k,i)为下混映射函数;S12:遍历集合Ssrt,找出一个满足如下关系的下混兼容基础声道k:对于所有属于Sc中的声道n,有fb(k,n)=0;若没有找到,执行步骤S15;S13:对于步骤S12中的下混兼容基础声道k,遍历集合Sbedt,找出fb(k,m)不为0且fb(k,m)可逆的基础声道m,若没有找到,执行步骤S15;S14:将步骤S13中找到的基础声道m加入到集合Sc中,得到新的Sc,从Ssrt中去除下混兼容基础声道k,得到新的Ssrt,从Sbedt中去除所有满足fb(k,i)不为0的基础声道i,得到新的Sbedt,若新的Ssrt、新的Sbedt都不为空,跳转到步骤S12,若新的Ssrt、新的Sbedt为空,则执行步骤S15;S15:Sc或Sc的子集作为基础声道集合Sbed的兼容基础声道集合。8.根据权利要求6所述的后向兼容式三维声编码器,其特征在于:根据基于QR分解的划分方法确定的基础声道划分方案包括:S21:令Sbedc=Sbed,Sbed为基础声道信号集合;S22:采用矩阵运算形式表达Sbedc的下混:Hs_bedcop=HAc*Hbc,Hs_bedcop为Sbedc下混形成的下混分量组成的矩阵,Hbc为Sbedc中基础声道信号组成的矩阵,HAc为Sbedc下混系数矩阵;S23:对HAc进行QR分解,得HAc=Q*HR,其中Q为一个Ns×Ns的酉矩阵,HR是一个Ns×Nbc的上三角矩阵;S24:设M=min(Ns,Nbc),Ns为基础声道下混的声道数、Nbc为Sbedc的声道数,如果对于HR中每一个n=1…M,都满足r(n,n)>0,执行步骤S25;否则,对于每一个n=1…M,如果HR中r(n,n)=0,将Sbedc中第n个声道从Sbedc中剔除形成新的集合Sbedc‘,令Sbedc=Sbedc‘并执行步骤S22;S25:保留Sbedc中n=1…M的声道组成的集合,该集合或集合的子集作为基础声道集合Sbed的兼容基础声道集合。9.根据权利要求1所述的三维声编码器,其特征在于:所述下混兼容基础声道数据占用nn/2个AES/EBU信道数进行传输,其中nn为下混兼容基础声道的声道数,所述扩展编码数据占用mm个AES/EBU信道数进行传输,mm≤(8-nn/2);所述扩展编码数据重组后每帧的大小等于mm个AES/EBU信道传输能力ll,ll=mm*L*K...

【专利技术属性】
技术研发人员:潘兴德陈笑天吴超刚
申请(专利权)人:南京青衿信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1