用于解码声音或声场的高阶高保真度立体声响复制(HOA)表示的方法技术

技术编号:22566728 阅读:44 留言:0更新日期:2019-11-16 12:45
本公开涉及用于解码声音或声场的高阶高保真度立体声响复制(HOA)表示的方法。当对HOA数据帧表示进行压缩时,在每个通道信号被感知地编码(16)之前对其实施增益控制(15,151)。增益值作为边信息以差分的方式被传输。然而,为了开始对这样的流式压缩HOA数据帧表示进行解码,需要绝对增益值,应当以最小数量的比特对该绝对增益值进行编码。为了确定这样的最小整数比特量{βe),在空间域中将HOA数据帧表示(C(k))渲染为位于单位球体上的虚拟扬声器信号,随后对HOA数据帧表示(C(k))进行归一化。然后,将最小整数比特数设置为(AA)。

A method of high order high fidelity stereo sound reproduction (HOA) representation for decoding sound or sound field

The present disclosure relates to a method for decoding a high-order high fidelity stereo sound reproduction (HOA) representation of a sound or sound field. When the Hoa data frame representation is compressed, gain control (15151) is applied to each channel signal before it is perceptually encoded (16). The gain value is transmitted as edge information in a differential manner. However, in order to start decoding such a streaming compressed HOA data frame representation, an absolute gain value is required, which should be encoded with a minimum number of bits. In order to determine such a minimum integer bit size {\u03b2 E), the Hoa data frame representation (C (k)) is rendered as a virtual speaker signal located on the unit sphere in the spatial domain, and then the Hoa data frame representation (C (k)) is normalized. Then, set the minimum number of integer bits to (AA).

【技术实现步骤摘要】
用于解码声音或声场的高阶高保真度立体声响复制(HOA)表示的方法本申请是申请号为201580035125.0、申请日为2015年6月22日、专利技术名称为“针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的设备”的专利技术专利申请的分案申请。
本专利技术涉及用于针对HOA数据帧表示的压缩而确定表示与所述HOA数据帧中的特定数据帧的通道信号相关联的非差分增益值所需的最小整数比特数的设备。
技术介绍
表示为HOA的高阶高保真度立体声响复制提供了表示三维声音的一种可能性。其他技术是波场合成(WFS)或如22.2的基于通道的方法。与基于通道的方法相比,HOA表示提供了与特定扬声器设置无关的优点。然而,这种灵活性是以在特定扬声器设置上回放HOA表示所需要的解码过程为代价的。与所需扬声器的数量通常很大的WFS方法相比,HOA也可以被呈现为仅包括几个扬声器的设置。HOA的另一个优点是还可以采用相同的表示而不必对耳机的双耳渲染进行任何修改。HOA基于通过截断的球面谐波函数(SH)展开来表示复合谐波平面波幅度的空间密度。每个展开系数是角频率的函数,角频率可以由时域函数等效地表示。因此,在不失一般性的情况下,完整的HOA声场表示实际上可以被假设成由O个时域函数组成,其中,O表示展开系数的数量。这些时域函数在下文中将被等效地称为HOA系数序列或HOA通道。HOA表示的空间解析度随着展开的最大阶数N的增长而提高。遗憾的是,展开系数O的数量随着阶数N呈二次方增长,特别地,O=(N+1)2。例如,使用阶数N=4的典型HOA表示需要O=25个HOA(展开)系数。假设期望的单声道采样率为fS并且每个采样的比特数为Nb,则用于传输HOA表示的总比特率由O·fS·Nb确定。以采用每采样Nb=16比特的fS=48kHz采样率传输阶数为N=4的HOA表示,导致19.2MBits/s的比特率,该比特率对于许多实际应用(例如流式传输)来说是非常高的。因此,对HOA表示进行压缩是非常可取的。先前,在EP2665208A1、EP2743922A1、EP2800401Al中提出了HOA声场表示的压缩,参见2014年1月的MPEG-H3D音频的ISO/IECJTC1/SC29/WG11、N14264、WD1-HOA文本。这些方法的共同点在于:它们都执行声场分析并且将给定的HOA表示分解成方向分量和残余环境分量。一方面,最终压缩的表示被假设成由若干量化信号组成,这些量化信号由方向信号和基于向量的信号的感知编码以及环境HOA分量的相关系数序列产生。另一方面,最终压缩的表示包括与量化信号相关的附加边信息,根据其压缩版本重构HOA表示需要所述边信息。在被传递至感知编码器之前,要求这些中间时域信号具有在[-1,1]的值范围内的最大幅度,这是为实现当前可用的感知编码器而产生的要求。为了当对HOA表示进行压缩时满足该要求,在感知编码器之前使用平滑地衰减或放大输入信号的增益控制处理单元(参见EP2824661A1和上面提到的ISO/IECJTC1/SC29/WG11N14264文献)。所产生的信号修改被假设成是可逆的并且被逐帧地应用,其中特别地,连续帧之间的信号幅度的变化被假设成“2”的幂。为了便于该信号修改在HOA解压缩器中的倒置,相应的归一化边信息包括在总边信息中。该归一化边信息可以由底数为“2”的指数构成,这些指数描述了两个连续帧之间的相对幅度变化。由于连续帧之间的较小幅度变化比较大幅度变化更有可能发生,因此根据上面提到的ISO/IECJTCl/SC29/WG11N14264文献利用游程运行长度编码(runlengthcode)对这些指数进行编码。
技术实现思路
例如,在从开始至结束没有任何时间跳跃地对单个文件解压缩的情况下,在HOA解压缩中使用差分编码的幅度变化来重构原始信号幅度是可行的。然而,为了便于随机访问,独立的访问单元必须存在于编码表示(其通常是比特流)中以使得能够与来自在先帧的信息无关地从期望的位置(或至少在其附近)开始解压缩。这种独立的访问单元必须包含由增益控制处理单元引起的从第一帧一直到当前帧的总绝对幅度变化(即,非差分增益值)。假设两个连续帧之间的幅度变化是“2”的幂,则通过底数为“2”的指数来描述总绝对幅度变化就足够了。为了对该指数进行高效编码,在应用增益控制处理单元之前了解信号的可能的最大增益是必要的。然而,该知识高度依赖于对要压缩的HOA表示的值范围的约束规范。遗憾的是,MPEG-H3D音频文献ISO/IECJTC1/SC29/WG11N14264仅提供用于输入HOA表示的格式的描述,而没有对值范围设定任何约束。本专利技术要解决的问题是提供表示非差分增益值所需的最小整数比特数。该问题通过权利要求1中公开的设备来解决。在相应的从属权利要求中公开了本专利技术的有利的附加实施方式。本专利技术确立了输入HOA表示的值范围与信号在HOA压缩器中应用增益控制处理单元之前的可能的最大增益之间的相互关系。基于该相互关系,针对输入HOA表示的值范围的给定规范、针对底数为“2”的指数的有效编码来确定所需比特的量,以在访问单元内描述由增益控制处理单元引起的从第一帧一直到当前帧的修改信号的总绝对幅度变化(即,非差分增益值)。此外,一旦计算用于对指数编码的所需比特量的规则被确定,本专利技术就使用用于验证给定HOA表示是否满足所需值范围约束的处理,使得给定HOA表示能够被正确压缩。原则上,本专利技术的设备适合于针对HOA数据帧表示的压缩而确定用于表示所述HOA数据帧中的特定HOA数据帧的通道信号的非差分增益值所需的最小整数比特数βe,其中,每个帧中的每个通道信号包括一组采样值,并且其中,给所述HOA数据帧中的每个HOA数据帧的每个通道信号分配差分增益值,并且这样的差分增益值引起当前HOA数据帧中的通道信号的采样值的幅度相对于前一HOA数据帧中的通道信号的采样值变化,并且其中,这样的增益调整的通道信号在编码器中被编码,并且其中,所述HOA数据帧表示在空间域中被渲染为O个虚拟扬声器信号wj(t),其中,虚拟扬声器的位置位于单位球体上并且旨在均匀分布在该单位球体上,所述渲染通过矩阵乘法w(t)=(Ψ)-1·c(t)来表示,其中,w(t)是包含所有虚拟扬声器信号的向量,Ψ是虚拟扬声器位置模矩阵,并且c(t)是所述HOA数据帧表示的相应HOA系数序列的向量,并且其中,所述HOA数据帧表示被归一化,使得所述设备包括:-通过以下操作a)、b)、c)中的一个或更多个从所述归一化HOA数据帧表示中形成所述通道信号的装置:a)为了表示所述通道信号中的主要声音信号,将所述HOA系数序列c(t)的向量乘以混合矩阵A,混合矩阵A的欧几里德范数不大于“1”,其中,混合矩阵A表示所述归一化HOA数据帧表示的系数序列的线性组合;b)为了表示所述通道信号中的环境分量cAMB(t)、从所述归一化HOA数据帧表示中减去所述主要声音信号以及选择所述环境分量cAMB(t)的系数序列的至少一部分,其中,||cAMB(本文档来自技高网
...

【技术保护点】
1.一种用于解码声音或声场的压缩高阶高保真度立体声响复制(HOA)声音表示的方法,所述方法包括:/n接收包含所述压缩HOA表示的比特流并且解码所述压缩HOA表示以确定感知解码信号

【技术特征摘要】
20140627 EP 14306024.21.一种用于解码声音或声场的压缩高阶高保真度立体声响复制(HOA)声音表示的方法,所述方法包括:
接收包含所述压缩HOA表示的比特流并且解码所述压缩HOA表示以确定感知解码信号相关联的增益校正指数ei(k)以及增益校正异常标记βi(k);
在通道重分配期间,重新分配经增益校正的信号帧以便重构主要声音信号的帧以及环境HOA分量的中间表示的帧CI,AMB(k),
其中,被应用于前一个帧中的传输通道的信号的最小整数比特数βe基于:



其中,N是阶数,NMAX是感兴趣的最大阶数,是所述虚拟扬声器的方向,O=(N+1)2是HOA系数序列的数量,并且K是所述模矩阵的欧几里德范数的平方||Ψ||22与O的比值,<...

【专利技术属性】
技术研发人员:亚历山大·克鲁格斯文·科尔东
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1