增强一阶高保真度立体声响复制信号的方向性的方法和装置制造方法及图纸

技术编号：12308705 阅读：73 留言：0更新日期：2015-11-11 17:49

来自提供被称为B格式信号的一阶高保真度立体声响复制信号的麦克风的记录提供对声音方向性的有限认知。声源被感知为比它们实际的更宽，特别是对于偏离中心的收听位置，并且声源往往被定位成来自最靠近的扬声器位置。在增强一阶高保真度立体声响复制信号的方向性的方法和装置中，从较低阶高保真度立体声响复制输入信号(10)提取(SFA)另外的方向性信息(22，23)。使用另外的方向性信息来估计更高阶高保真度立体声响复制系数(25a)，然后将其与输入信号的系数结合(CS)。从而增强高保真度立体声响复制信号的方向性，这在将高保真度立体声响复制信号解码成大声扬声器信号时得到空间源定位的增加的精确度。得到的输出信号具有比输入信号更多的能量。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及高保真度立体声响复制(Ambisonics)音频信号处理和声学的领域。
技术介绍
高保真度立体声响复制是在2D和3D两者中，根据声压来描述音频场景，并且使用出众的空间分辨率来处理复杂音频场景的记录、制作、传送和回放的技术。在高保真度立体声响复制中，空间音频场景由傅立叶-贝塞尔级数(Fourier-Besselseries)的系数来描述。已知有提供被称为B格式信号的一阶高保真度立体声响复制信号的麦克风阵列。但是，将一阶高保真度立体声响复制信号解码并且呈现给2D环绕或3D的扬声器布置只提供对声音方向性的有限认知。声源往往被感知为比它们实际的更宽。特别是对于偏离中心的收听位置，声源往往被定位成来自最靠近的扬声器位置，而不是它们在扬声器之间的想要的虚拟位置。一阶高保真度立体声响复制(B格式)信号由声压的傅立叶-贝塞尔级数描述的四个系数构成，其形成3D声场表示。这些是W信道(单声道混合或零阶)以及X、Y、Z信道(一阶)。更高阶信号使用更多的系数，这在将系数解码成扬声器信号时增加空间源定位的精确度。但是，这样的更高阶信号并不包括在由麦克风阵列提供的B格式信号中。定向音频编码(DirectionalAudioCoding，DirAC)是用于表示或再现音频信号的已知技术[5，9]。其使用B格式解码器，B格式解码器将直达声(directsound)从扩散声(diffusesound)分离，然后使用基于...

【技术保护点】
一种增强输入信号(10)的方向性的方法，输入信号(10)是一阶高保真度立体声响复制信号并且具有零阶和一阶的系数，所述方法包括以下步骤：在分析滤波器组(AFB)中对输入信号(10)进行滤波(s1)，其中获得作为一阶高保真度立体声响复制信号的频域表示的四个频域信道(21)，并且其中频域信道(21)中的一个第一频域信道(20)表示零阶系数并且三个剩余的频域信道(21)表示一阶系数；执行(s2)四个频域信道(21)的声场分析(SFA)，由此获得源方向(22)和扩散估计(23)；在滤波器(F)中对具有零阶系数的第一频域信道(20)进行滤波(s3)，其中使用扩散估计(23)并且其中获得直达声分量(24)；在更高阶高保真度立体声响复制编码器(HOAe)中以具有预先定义的阶(No)的高保真度立体声响复制格式对直达声分量(24)进行编码(s4)，其中使用源方向(22)并且其中获得以预先定义的阶(No)的高保真度立体声响复制格式的编码的直达声(25)，预先定义的阶(No)至少为二，并且以预先定义的阶(No)的高保真度立体声响复制格式的编码的直达声包括高于一阶的阶的高保真度立体声响复制系数；从所获得的以预先...

【技术特征摘要】
【国外来华专利技术】2013.03.22 EP 13305352.01.一种增强输入信号(10)的方向性的方法，输入信号(10)是一阶高
保真度立体声响复制信号并且具有零阶和一阶的系数，所述方法包括以下步
骤：
在分析滤波器组(AFB)中对输入信号(10)进行滤波(s1)，其中获
得作为一阶高保真度立体声响复制信号的频域表示的四个频域信道(21)，
并且其中频域信道(21)中的一个第一频域信道(20)表示零阶系数并且三
个剩余的频域信道(21)表示一阶系数；
执行(s2)四个频域信道(21)的声场分析(SFA)，由此获得源方向(22)
和扩散估计(23)；
在滤波器(F)中对具有零阶系数的第一频域信道(20)进行滤波(s3)，
其中使用扩散估计(23)并且其中获得直达声分量(24)；
在更高阶高保真度立体声响复制编码器(HOAe)中以具有预先定义的
阶(No)的高保真度立体声响复制格式对直达声分量(24)进行编码(s4)，
其中使用源方向(22)并且其中获得以预先定义的阶(No)的高保真度立体
声响复制格式的编码的直达声(25)，预先定义的阶(No)至少为二，并且
以预先定义的阶(No)的高保真度立体声响复制格式的编码的直达声包括高
于一阶的阶的高保真度立体声响复制系数；
从所获得的以预先定义的阶(No)的高保真度立体声响复制格式的编码
的直达声中选择(s5)二阶或更高阶的高保真度立体声响复制系数(25a)，
其中省略一阶和零阶的系数；以及
在结合与合成单元(CS)中结合(s6)表示来自编码的直达声的所选择
的二阶或更高阶的高保真度立体声响复制系数(25a)的信号(26)与输入
信号(10)，其中获得具有增强的方向性的增强的至少二阶的高保真度立体
声响复制信号(29)。
2.根据权利要求1所述的方法，其中结合(s6)来自编码的直达声的所
选择的二阶或更高阶的高保真度立体声响复制系数(25a)与输入信号(10)
的步骤包括以下步骤：
在频域结合器单元(CBf)中结合(s61)四个频域信道(21，21’，28)
的高保真度立体声响复制系数与来自编码的直达声的所选择的二阶或更高

\t阶的高保真度立体声响复制系数(25a)的所选择的频率系数(25a)，其中
获得作为至少二阶的高保真度立体声响复制信号的频域表示的信号(37)；
以及
在合成滤波器组(SFB’)中对所获得的信号(37)进行滤波(s64)，其
中获得具有至少二阶的系数的增强更高阶高保真度立体声响复制信号的时
域表示(29)。
3.根据权利要求1所述的方法，其中结合(s6)来自编码的直达声的所
选择的二阶或更高阶的高保真度立体声响复制系数(25a)与输入信号(10)
的步骤包括以下步骤：
在合成滤波器组(SFB)中对来自编码的直达声的所选择的二阶或更高
阶的高保真度立体声响复制系数(25a)进行滤波(s62)，其中获得包括二
阶或更高阶的系数的增强更高阶高保真度立体声响复制信号的时域表示
(26)；以及
在时域结合器(CBt)中结合(s66)表示输入信号(10)的高保真度立
体声响复制系数与二阶或更高阶的增强更高阶高保真度立体声响复制信号
的时域表示(26)，其中获得相比于输入信号(10)具有增强的方向性的至
少二阶的高保真度立体声响复制信号的时域表示(29)。
4.根据权利要求1-3中的任一项所述的方法，其中在以具有预先定义的
阶(No)的高保真度立体声响复制格式对直达声分量(24)进行编码(s4)
的步骤中，更高阶高保真度立体声响复制编码器(HOAe)使用B格式。
5.根据权利要求1-4中的任一项所述的方法，其中在以具有预先定义的
阶(No)的高保真度立体声响复制格式对直达声分量(24)进行编码(s4)
的步骤中，更高阶高保真度立体声响复制编码器(HOAe)使用不同于B格
式的高保真度立体声响复制格式，还包括以下步骤：
在结合(s7)的步骤之前，在HOA格式适配单元(HFA)中根据不同
于B格式的高保真度立体声响复制格式来重新格式化(s63)输入信号(10)，
其中获得输入信号(10)的重新格式化的高保真度立体声响复制系数，
并且其中在结合(s64)的步骤中，结合器(CB)结合输入信号(10)的重
新格式化的高保真度立体声响复制系数与二阶或更高阶的增强更高阶高保
真度立体声响复制信号的时域表示(28)。
6.根据权利要求1-5中的任一项所述的方法，其中执行(s2)四个频域

\t信道(21)的声场分析(SFA)的步骤包括以下步骤：
执行(s21)四个频域信道(21)的活动强度分析(AIA)，其中获得表
示活动强度(11a)的值；
执行(s22)四个频域信道(21)的扩散分析(DA)，其中获得扩散估
计(23)；以及
执行(s23)表示活动强度(11a)的值的到达方向(DOA)分析，其中
获得源方向(22)。
7.根据权利要求1-6中的任一项所述的方法，还包括以下步骤：混合
(MX)增强的至少二阶的高保真度立体声响复制信号(29)与另外的更高
阶或不同高保真度立体声响复制格式的HOA输入信号(30)，其中获得包括
输入信号(10)与所述另外的HOA输入信号(30)的混合的HOA信号(...

【专利技术属性】
技术研发人员：J贝姆，
申请(专利权)人：汤姆逊许可公司，
类型：发明
国别省市：法国;FR

全部详细技术资料下载我是这个专利的主人