目标空间音频参数和相关联的空间音频播放的确定制造技术

技术编号:24597635 阅读:50 留言:0更新日期:2020-06-21 03:50
一种用于空间音频信号处理的方法,包括:对于两个或更多个播放音频信号(102,202),确定用于提供空间音频再现的至少一个空间音频参数(108,110);在两个或更多个播放音频信号(102,202)之间确定至少一个音频信号关系参数(110,112,114),至少一个音频信号关系参数(110,112,114)与两个或更多个播放音频信号(102,202)之间的并且用于至少两个频带的通道间信号关系信息的确定相关联,以使得两个或更多个播放音频信号(102,202)被配置为基于至少一个空间音频参数(108,110)和至少一个音频信号关系参数(110,112,114)来再现。

Determination of target spatial audio parameters and associated spatial audio playback

【技术实现步骤摘要】
【国外来华专利技术】目标空间音频参数和相关联的空间音频播放的确定
本申请涉及用于频带中声场相关参数估计的装置和方法,但并不排它地涉及用于对音频编码器和解码器的时频域声场相关参数估计的装置和方法。
技术介绍
参数空间音频处理是音频信号处理的一个领域,其中,使用一组参数来描述声音的空间方面。例如,在从麦克风阵列进行参数化空间音频捕获时,从麦克风阵列信号估计一组参数是一种典型且有效的选择,该组参数诸如是频带中声音的方向、以及频带中被捕获声音的定向与非定向部分的比率。众所周知,这些参数很好地描述了在麦克风阵列的位置处的被捕获声音的感知空间特性。这些参数可相应地在空间声音的合成中使用,以用于双耳式耳机、扬声器、或诸如环绕立体声(Ambisonics)的其它格式。因此,频带中的方向和直接总能量比率是对空间音频捕获特别有效的参数化。包括频带中的方向参数和频带中的能量比率参数(指示声音的定向性)的参数集也可被用作用于音频编解码器的空间元数据。例如,这些参数可从麦克风阵列捕获的音频信号来估计,并且例如可从麦克风阵列信号生成立体声信号以与空间元数据一起传达。立体声信号例如可用EVS或AAC编码器来编码。解码器可将音频信号解码成PCM信号,并(使用空间元数据)处理频带中的声音以获得空间输出,例如,双耳输出。前述的解决方案尤其适用于编码来自麦克风阵列(例如,在移动电话、VR相机、独立麦克风阵列中)的被捕获空间声音。然而,可期望这种编码器除了麦克风阵列捕获的信号之外还具有其它输入类型,例如,扬声器信号、音频对象信号、或环绕立体声信号。r>分析一阶环绕立体声(FOA)输入用于空间元数据提取已经在与定向音频编码(DirAC)和谐波平面波展开(Harpex)有关的科学文献中进行了详尽的记录。这是因为存在直接提供FOA信号(更准确地:其变体,B格式信号)的麦克风阵列,并且因此分析这种输入已经成为该领域的研究重点。编码器的另一个输入也是多通道扬声器输入,诸如5.1或7.1通道环绕声输入。然而,可以容易地证明如上所述的元数据表示不能传达诸如在许多系统中常规使用的5.1或7.1混音的多通道输入的所有相关方面。这些方面与录音工程师用于生成艺术环绕声扬声器混音的方法有关。具体地,录音工程师可使用声音在两个或更多个方向上的相干再现,这是不能通过利用频段中的方向和比率元数据的声场相关参数化很好地解释的场景。因此,需要更有效的元数据参数以更准确地传达多通道输入的相关方面。
技术实现思路
根据第一方面,提供一种用于空间音频信号处理的方法,其包括:对于两个或更多个播放音频信号,确定用于提供空间音频再现的至少一个空间音频参数;在两个或更多个播放音频信号之间确定至少一个音频信号关系参数,至少一个音频信号关系参数与两个或更多个播放音频信号之间的并且用于至少两个频带的通道间信号关系信息的确定相关联,以使得两个或更多个播放音频信号被配置为基于至少一个空间音频参数和至少一个音频信号关系参数来再现。在两个或更多个播放音频信号之间确定至少一个音频信号关系参数可包括:确定至少一个相干性参数,至少一个相干性参数与两个或更多个播放音频信号之间的并且用于至少两个频带的通道间相干性信息的确定相关联。对于两个或更多个播放音频信号,确定用于提供空间音频再现的至少一个空间音频参数可包括:对于两个或更多个播放音频信号,确定至少一个方向参数和至少一个能量比率。该方法还可包括:从两个或更多个播放音频信号确定下混合信号,其中,两个或更多个播放音频信号可以是基于至少一个空间音频参数、至少一个相干性参数、和/或下混合信号来再现的。在两个或更多个播放音频信号之间确定至少一个相干性参数可包括:确定扩展相干性参数,其中,扩展相干性参数可以是基于在空间上与所识别的播放音频信号相邻的两个或更多个播放音频信号之间的通道间相干性信息来确定的,所识别的播放音频信号是基于至少一个空间音频参数来识别的。确定扩展相干性参数可包括:确定立体度参数,立体度参数与指示两个或更多个播放音频信号使用在空间上与所识别的播放音频信号相邻的两个播放音频信号来相干地再现相关联,所识别的播放音频信号是在空间上最接近至少一个方向参数的播放音频信号;确定相干平移参数,相干平移参数与指示两个或更多个播放音频信号使用在空间上与所识别的播放音频信号相邻的至少两个或更多个播放音频信号来相干地再现相关联;以及基于立体度参数和相干平移参数,生成扩展相干性参数。基于立体度参数和相干平移参数,生成扩展相干性参数可包括:当立体度参数和相干平移参数中的任意一个大于0.5并且相干平移参数大于立体度参数时,将扩展相干性参数设置为以下中的最大值:0.5,以及0.5加上立体度参数与相干平移参数之差;或者否则,将扩展相干性参数设置为立体度参数和相干平移参数中的最大值。确定立体度参数可包括:计算与两个或更多个播放音频信号相关联的协方差矩阵;确定在空间上最接近至少一个方向参数的播放音频信号和与最接近至少一个方向参数的播放音频信号相关联的在空间上相邻的播放音频信号对;基于协方差矩阵,确定最接近至少一个方向参数的通道和相邻的播放音频信号对的能量;确定相邻的播放音频信号对的能量与在空间上最接近至少一个方向的播放音频信号和播放音频信号对的组合的能量之间的比率;对协方差矩阵进行归一化;以及基于播放音频信号对之间的归一化相干性乘以播放音频信号对的能量与在空间上最接近至少一个方向的播放音频信号和播放音频信号对的组合的能量之间的比率,生成立体度参数。确定相干平移参数可包括:确定在空间上最接近至少一个方向的播放音频信号与播放音频信号对中的每一个播放音频信号之间的归一化相干性值;选择归一化相干性值中的最小值,最小值描述播放音频信号之间的相干性;确定用于描述能量如何均匀分布的能量分布参数;以及基于归一化相干性值中的最小值与能量分布参数的乘积,生成相干平移参数。确定至少一个相干性参数可包括:确定环绕相干性参数,其中,环绕相干性参数是基于两个或更多个播放音频信号之间的通道间相干性来确定的。确定环绕相干性参数可包括:计算与两个或更多个播放音频信号相关联的协方差矩阵;监视具有最大能量的播放音频信号,最大能量是基于协方差矩阵和其它播放音频信号的子集来确定的,其中,子集是在1与小于具有次最大能量的播放音频信号的总数的数量之间的确定数量;以及基于选择在具有最大能量的播放音频信号与次最大能量播放音频信号中的每一个之间确定的归一化相干性中的最小值,生成环绕参数。该方法还可包括:基于至少一个相干性参数,修改至少一个能量比率。基于至少一个相干性参数,修改至少一个能量比率可包括:基于在空间上与所识别的播放音频信号相邻的两个或更多个播放音频信号之间的通道间相干性信息,确定第一替代能量比率,其中所识别的播放音频信号是基于至少一个空间音频参数来识别的;基于在所识别的播放音频信号与在空间上与所识别的播放音频信号相邻的两个或更多个播放音频信号之间的通道间相干性信息,确定第二替代能量比率;以及基于至少一个能量比率、第一替代能量比率和第本文档来自技高网...

【技术保护点】
1.一种用于空间音频信号处理的方法,包括:/n对于两个或更多个播放音频信号,确定用于提供空间音频再现的至少一个空间音频参数;/n在所述两个或更多个播放音频信号之间确定至少一个音频信号关系参数,所述至少一个音频信号关系参数与所述两个或更多个播放音频信号之间的并且用于至少两个频带的通道间信号关系信息的确定相关联,以使得所述两个或更多个播放音频信号被配置为基于所述至少一个空间音频参数和所述至少一个音频信号关系参数来再现。/n

【技术特征摘要】
【国外来华专利技术】20171106 GB 1718341.91.一种用于空间音频信号处理的方法,包括:
对于两个或更多个播放音频信号,确定用于提供空间音频再现的至少一个空间音频参数;
在所述两个或更多个播放音频信号之间确定至少一个音频信号关系参数,所述至少一个音频信号关系参数与所述两个或更多个播放音频信号之间的并且用于至少两个频带的通道间信号关系信息的确定相关联,以使得所述两个或更多个播放音频信号被配置为基于所述至少一个空间音频参数和所述至少一个音频信号关系参数来再现。


2.根据权利要求1所述的方法,其中,在所述两个或更多个播放音频信号之间确定至少一个音频信号关系参数包括:确定至少一个相干性参数,所述至少一个相干性参数与所述两个或更多个播放音频信号之间的并且用于所述至少两个频带的通道间相干性信息的确定相关联。


3.根据权利要求2所述的方法,其中,对于所述两个或更多个播放音频信号,确定用于提供所述空间音频再现的所述至少一个空间音频参数包括:对于所述两个或更多个播放音频信号,确定至少一个方向参数和至少一个能量比率。


4.根据权利要求2和3中任一项所述的方法,还包括:
从所述两个或更多个播放音频信号确定下混合信号,其中,所述两个或更多个播放音频信号是基于所述至少一个空间音频参数、所述至少一个相干性参数、和/或所述下混合信号来再现的。


5.根据权利要求2至4中任一项所述的方法,其中,在所述两个或更多个播放音频信号之间确定至少一个相干性参数包括:确定扩展相干性参数,其中,所述扩展相干性参数是基于在空间上与所识别的播放音频信号相邻的两个或更多个播放音频信号之间的通道间相干性信息来确定的,所识别的播放音频信号是基于所述至少一个空间音频参数来识别的。


6.根据在从属于权利要求3时的权利要求5所述的方法,其中,确定扩展相干性参数包括:
确定立体度参数,所述立体度参数与指示所述两个或更多个播放音频信号使用在空间上与所识别的播放音频信号相邻的两个播放音频信号来相干地再现相关联,所识别的播放音频信号是在空间上最接近所述至少一个方向参数的播放音频信号;
确定相干平移参数,所述相干平移参数与指示所述两个或更多个播放音频信号使用在空间上与所识别的播放音频信号相邻的至少两个或更多个播放音频信号来相干地再现相关联;以及
基于所述立体度参数和所述相干平移参数,生成所述扩展相干性参数。


7.根据权利要求6所述的方法,其中,基于所述立体度参数和所述相干平移参数,生成所述扩展相干性参数包括:
当所述立体度参数和所述相干平移参数中的任意一个大于0.5并且所述相干平移参数大于所述立体度参数时,将所述扩展相干性参数设置为以下中的最大值:0.5,以及0.5加上所述立体度参数与所述相干平移参数之差;或者
否则,将所述扩展相干性参数设置为所述立体度参数和所述相干平移参数中的最大值。


8.根据权利要求5和6中任一项所述的方法,其中,确定所述立体度参数包括:
计算与所述两个或更多个播放音频信号相关联的协方差矩阵;
确定在空间上最接近所述至少一个方向参数的播放音频信号和与最接近所述至少一个方向参数的所述播放音频信号相关联的在空间上相邻的播放音频信号对;
基于所述协方差矩阵,确定最接近所述至少一个方向参数的通道和所述相邻的播放音频信号对的能量;
确定所述相邻的播放音频信号对的能量与在空间上最接近所述至少一个方向的所述播放音频信号和所述播放音频信号对的组合的能量之间的比率;
对所述协方差矩阵进行归一化;以及
基于所述播放音频信号对之间的归一化相干性乘以所述播放音频信号对的能量与在空间上最接近所述至少一个方向的所述播放音频信号和所述播放音频信号对的组合的能量之间的比率,生成所述立体度参数。


9.根据权利要求8所述的方法,其中,确定所述相干平移参数包括:
确定在空间上最接近所述至少一个方向的所述播放音频信号与所述播放音频信号对中的每一个播放音频信号之间的归一化相干性值;
选择所述归一化相干性值中的最小值,所述最小值描述所述播放音频信号之间的相干性;
确定用于描述所述能量如何均匀分布的能量分布参数;以及
基于所述归一化相干性值中的所述最小值与所述能量分布参数的乘积,生成所述相干平移参数。


10.根据权利要求2至9中任一项所述的方法,其中,确定至少一个相干性参数包括:确定环绕相干性参数,其中,所述环绕相干性参数是基于两个或更多个播放音频信号...

【专利技术属性】
技术研发人员:MV·莱蒂南J·维卡莫
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:芬兰;FI

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1