增强一阶高保真度立体声响复制信号的方向性的方法和装置制造方法及图纸

技术编号:12308705 阅读:73 留言:0更新日期:2015-11-11 17:49
来自提供被称为B格式信号的一阶高保真度立体声响复制信号的麦克风的记录提供对声音方向性的有限认知。声源被感知为比它们实际的更宽,特别是对于偏离中心的收听位置,并且声源往往被定位成来自最靠近的扬声器位置。在增强一阶高保真度立体声响复制信号的方向性的方法和装置中,从较低阶高保真度立体声响复制输入信号(10)提取(SFA)另外的方向性信息(22,23)。使用另外的方向性信息来估计更高阶高保真度立体声响复制系数(25a),然后将其与输入信号的系数结合(CS)。从而增强高保真度立体声响复制信号的方向性,这在将高保真度立体声响复制信号解码成大声扬声器信号时得到空间源定位的增加的精确度。得到的输出信号具有比输入信号更多的能量。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及高保真度立体声响复制(Ambisonics)音频信号处理和声学的领域。
技术介绍
高保真度立体声响复制是在2D和3D两者中,根据声压来描述音频场景,并且使用出众的空间分辨率来处理复杂音频场景的记录、制作、传送和回放的技术。在高保真度立体声响复制中,空间音频场景由傅立叶-贝塞尔级数(Fourier-Besselseries)的系数来描述。已知有提供被称为B格式信号的一阶高保真度立体声响复制信号的麦克风阵列。但是,将一阶高保真度立体声响复制信号解码并且呈现给2D环绕或3D的扬声器布置只提供对声音方向性的有限认知。声源往往被感知为比它们实际的更宽。特别是对于偏离中心的收听位置,声源往往被定位成来自最靠近的扬声器位置,而不是它们在扬声器之间的想要的虚拟位置。一阶高保真度立体声响复制(B格式)信号由声压的傅立叶-贝塞尔级数描述的四个系数构成,其形成3D声场表示。这些是W信道(单声道混合或零阶)以及X、Y、Z信道(一阶)。更高阶信号使用更多的系数,这在将系数解码成扬声器信号时增加空间源定位的精确度。但是,这样的更高阶信号并不包括在由麦克风阵列提供的B格式信号中。定向音频编码(DirectionalAudioCoding,DirAC)是用于表示或再现音频信号的已知技术[5,9]。其使用B格式解码器,B格式解码器将直达声(directsound)从扩散声(diffusesound)分离,然后使用基于矢量的幅度平移(Vector-BasedAmplitudePanning,VBAP)对频域中的直达声进行选择性放大,并且在合成滤波之后最终在其输出处提供扬声器信号。图1a)示出基于DirAC的B格式解码的结构。B格式信号10是时域信号,并且在分析滤波器组(analysisfilterbank)AFBD中被滤波成K个频带11。声场分析块SFAD估计扩散估计(diffusenessestimate)Ψ(fk)13和到达方向(directions-of-arrival,DoA)12。DoA是针对带k的特定中频处的源的方向的方位角φ(fk)和倾斜角Θ(fk)。一阶高保真度立体声响复制解码器AmbD将高保真度立体声响复制信号呈现为L个扬声器信号14。直达-扩散分离块DDS使用根据扩散估计13确定的滤波器将一阶高保真度立体声响复制信号分离成L个直达声信号15和L个扩散声信号16。通过将解码器AmbD的输出14与根据扩散估计13获得的相乘来得出L个扩散声信号16。根据与的乘法来得出定向信号。进一步使用被称作矢量基幅度平移(VectorBaseAmplitudePanning,VBAP)[8]的技术来处理直达声信号15。在VBAP单元VP中,乘以(每个频带中的)每个扬声器信号的增益值以根据DoA12和扬声器的位置,将直达声平移(pan)到所期望的方向。通过解相关滤波DF对扩散信号16进行解相关,并且将解相关的扩散信号17添加到从VPAB单元VP获得的直达声信号。合成滤波器组SFBD将频带与可以由L个扬声器再现的时域信号19结合。应用用于时间整合的平滑滤波器(未在图1中示出)以计算扩散估计Ψ(f)13和平滑由VBAP得出的增益值。图1b)示出声场分析块SFAD的细节。B格式信号表示原点(观察位置,r=0)处的频域中的声场。声强描述声场中动能和势能的传输。在声场中,并非所有的声能的局部运动都对应于净传输。活动强度(activeintensity)Ia(时间平均的声学强度,DoA~Ia)是有向净能量传输的速率(三个笛卡尔(Cartesian)方向的每个单位时间的能量)。在活动强度分析块AIAD中获得B格式信号11的活动强度11a,并且将其提供给扩散分析块DABD和DoA分析块DOAABD,其分别输出DoA12和扩散估计13。在[9]中对DirAC进行更多的描述,基础理论在[5]中描述。
技术实现思路
将期望增强诸如B格式麦克风记录这样的一阶高保真度立体声响复制信号的方向性。对于更逼真的回放,或者对于将真实记录的声音与其他更高阶内容混合(例如对打算针对不同扬声器设置回放的电影声音进行配音),期望这样的方向性增强。本专利技术所要解决的一个问题是增强一阶高保真度立体声响复制信号或B格式信号的方向性,即使在这样的信号的更高阶系数不可用的情况下也是如此。根据本专利技术,可以通过选择性地放大直达声分量同时不改变扩散声分量来解决这个以及其他问题。当选择性地放大直达声时,获得具有增加的阶的高保真度立体声响复制格式化的信号是有利的,因为它可以容易地与其他高保真度立体声响复制格式化的信号混合。使用本专利技术,能够增加一阶高保真度立体声响复制信号的阶,从而仅考虑定向声分量。这再次得到高保真度立体声响复制格式化的信号,但是具有更高的阶(亦即,至少二阶)。原则上,所公开的用于增强一阶高保真度立体声响复制信号的方向性的方法根据一阶系数信息得出更高阶的系数,并且将得出的更高阶的系数添加到高保真度立体声响复制信号。因此,有利地维持(除了在一个实施例中的重新格式化之外)一阶高保真度立体声响复制信号的一阶系数信息(亦即,零阶系数和一阶系数)。换句话说,从较低阶的高保真度立体声响复制信号中提取另外的方向性信息,并且使用另外的方向性信息来估计更高阶的系数。由此,增强高保真度立体声响复制信号的方向性,这在将高保真度立体声响复制信号解码成扬声器信号时得到空间源定位的增加的精确度。本专利技术的一个效果是所得到的输出信号具有比输入信号更多的能量。本专利技术涉及一种增强输入信号的方向性的方法,输入信号是一阶高保真度立体声响复制信号并且具有零阶和一阶系数,如在权利要求1中所定义的那样。本专利技术还涉及一种增强具有零阶和一阶的系数的一阶高保真度立体声响复制信号的方向性的装置,如在权利要求9中所定义的那样。另外,本专利技术涉及一种计算机可读存储介质,其上存储有计算机可读的指令,所述指令当在计算机上被执行时使计算机执行如权利要求1所定义的增强具有零阶和一阶的系数的一阶高保真度立体声响复制信号的方向性的方法。要注意的是,尽管未在本文中显式地提及,但是任何给定阶的高保真度立体声响复制信号通常不仅包括给定阶的系数,而且包括所有较低阶的系数。例如,二阶HOA信号不仅包括二阶的系数,而且包括零阶和一阶的系数。在相关的权利要求书、下面的描述和附图中公开本专利技术的有利实施例。附图说明参考附图来描述本专利技术的示例性实施例,在附图中:图1本文档来自技高网
...

【技术保护点】
一种增强输入信号(10)的方向性的方法,输入信号(10)是一阶高保真度立体声响复制信号并且具有零阶和一阶的系数,所述方法包括以下步骤:在分析滤波器组(AFB)中对输入信号(10)进行滤波(s1),其中获得作为一阶高保真度立体声响复制信号的频域表示的四个频域信道(21),并且其中频域信道(21)中的一个第一频域信道(20)表示零阶系数并且三个剩余的频域信道(21)表示一阶系数;执行(s2)四个频域信道(21)的声场分析(SFA),由此获得源方向(22)和扩散估计(23);在滤波器(F)中对具有零阶系数的第一频域信道(20)进行滤波(s3),其中使用扩散估计(23)并且其中获得直达声分量(24);在更高阶高保真度立体声响复制编码器(HOAe)中以具有预先定义的阶(No)的高保真度立体声响复制格式对直达声分量(24)进行编码(s4),其中使用源方向(22)并且其中获得以预先定义的阶(No)的高保真度立体声响复制格式的编码的直达声(25),预先定义的阶(No)至少为二,并且以预先定义的阶(No)的高保真度立体声响复制格式的编码的直达声包括高于一阶的阶的高保真度立体声响复制系数;从所获得的以预先定义的阶(No)的高保真度立体声响复制格式的编码的直达声中选择(s5)二阶或更高阶的高保真度立体声响复制系数(25a),其中省略一阶和零阶的系数;以及在结合与合成单元(CS)中结合(s6)表示来自编码的直达声的所选择的二阶或更高阶的高保真度立体声响复制系数(25a)的信号(26)与输入信号(10),其中获得具有增强的方向性的增强的至少二阶的高保真度立体声响复制信号(29)。...

【技术特征摘要】
【国外来华专利技术】2013.03.22 EP 13305352.01.一种增强输入信号(10)的方向性的方法,输入信号(10)是一阶高
保真度立体声响复制信号并且具有零阶和一阶的系数,所述方法包括以下步
骤:
在分析滤波器组(AFB)中对输入信号(10)进行滤波(s1),其中获
得作为一阶高保真度立体声响复制信号的频域表示的四个频域信道(21),
并且其中频域信道(21)中的一个第一频域信道(20)表示零阶系数并且三
个剩余的频域信道(21)表示一阶系数;
执行(s2)四个频域信道(21)的声场分析(SFA),由此获得源方向(22)
和扩散估计(23);
在滤波器(F)中对具有零阶系数的第一频域信道(20)进行滤波(s3),
其中使用扩散估计(23)并且其中获得直达声分量(24);
在更高阶高保真度立体声响复制编码器(HOAe)中以具有预先定义的
阶(No)的高保真度立体声响复制格式对直达声分量(24)进行编码(s4),
其中使用源方向(22)并且其中获得以预先定义的阶(No)的高保真度立体
声响复制格式的编码的直达声(25),预先定义的阶(No)至少为二,并且
以预先定义的阶(No)的高保真度立体声响复制格式的编码的直达声包括高
于一阶的阶的高保真度立体声响复制系数;
从所获得的以预先定义的阶(No)的高保真度立体声响复制格式的编码
的直达声中选择(s5)二阶或更高阶的高保真度立体声响复制系数(25a),
其中省略一阶和零阶的系数;以及
在结合与合成单元(CS)中结合(s6)表示来自编码的直达声的所选择
的二阶或更高阶的高保真度立体声响复制系数(25a)的信号(26)与输入
信号(10),其中获得具有增强的方向性的增强的至少二阶的高保真度立体
声响复制信号(29)。
2.根据权利要求1所述的方法,其中结合(s6)来自编码的直达声的所
选择的二阶或更高阶的高保真度立体声响复制系数(25a)与输入信号(10)
的步骤包括以下步骤:
在频域结合器单元(CBf)中结合(s61)四个频域信道(21,21’,28)
的高保真度立体声响复制系数与来自编码的直达声的所选择的二阶或更高

\t阶的高保真度立体声响复制系数(25a)的所选择的频率系数(25a),其中
获得作为至少二阶的高保真度立体声响复制信号的频域表示的信号(37);
以及
在合成滤波器组(SFB’)中对所获得的信号(37)进行滤波(s64),其
中获得具有至少二阶的系数的增强更高阶高保真度立体声响复制信号的时
域表示(29)。
3.根据权利要求1所述的方法,其中结合(s6)来自编码的直达声的所
选择的二阶或更高阶的高保真度立体声响复制系数(25a)与输入信号(10)
的步骤包括以下步骤:
在合成滤波器组(SFB)中对来自编码的直达声的所选择的二阶或更高
阶的高保真度立体声响复制系数(25a)进行滤波(s62),其中获得包括二
阶或更高阶的系数的增强更高阶高保真度立体声响复制信号的时域表示
(26);以及
在时域结合器(CBt)中结合(s66)表示输入信号(10)的高保真度立
体声响复制系数与二阶或更高阶的增强更高阶高保真度立体声响复制信号
的时域表示(26),其中获得相比于输入信号(10)具有增强的方向性的至
少二阶的高保真度立体声响复制信号的时域表示(29)。
4.根据权利要求1-3中的任一项所述的方法,其中在以具有预先定义的
阶(No)的高保真度立体声响复制格式对直达声分量(24)进行编码(s4)
的步骤中,更高阶高保真度立体声响复制编码器(HOAe)使用B格式。
5.根据权利要求1-4中的任一项所述的方法,其中在以具有预先定义的
阶(No)的高保真度立体声响复制格式对直达声分量(24)进行编码(s4)
的步骤中,更高阶高保真度立体声响复制编码器(HOAe)使用不同于B格
式的高保真度立体声响复制格式,还包括以下步骤:
在结合(s7)的步骤之前,在HOA格式适配单元(HFA)中根据不同
于B格式的高保真度立体声响复制格式来重新格式化(s63)输入信号(10),
其中获得输入信号(10)的重新格式化的高保真度立体声响复制系数,
并且其中在结合(s64)的步骤中,结合器(CB)结合输入信号(10)的重
新格式化的高保真度立体声响复制系数与二阶或更高阶的增强更高阶高保
真度立体声响复制信号的时域表示(28)。
6.根据权利要求1-5中的任一项所述的方法,其中执行(s2)四个频域

\t信道(21)的声场分析(SFA)的步骤包括以下步骤:
执行(s21)四个频域信道(21)的活动强度分析(AIA),其中获得表
示活动强度(11a)的值;
执行(s22)四个频域信道(21)的扩散分析(DA),其中获得扩散估
计(23);以及
执行(s23)表示活动强度(11a)的值的到达方向(DOA)分析,其中
获得源方向(22)。
7.根据权利要求1-6中的任一项所述的方法,还包括以下步骤:混合
(MX)增强的至少二阶的高保真度立体声响复制信号(29)与另外的更高
阶或不同高保真度立体声响复制格式的HOA输入信号(30),其中获得包括
输入信号(10)与所述另外的HOA输入信号(30)的混合的HOA信号(...

【专利技术属性】
技术研发人员:J贝姆
申请(专利权)人:汤姆逊许可公司
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1