用于音频信号解码的解码矩阵的确定方法和装置制造方法及图纸

技术编号:19391301 阅读:19 留言:0更新日期:2018-11-10 02:55
本公开涉及用于音频信号解码的解码矩阵的确定方法和装置。对于解码,需要特定于给定的扬声器设置并且使用已知的扬声器位置生成的解码矩阵。针对已知位置处的L个扬声器对声场格式的经编码的音频信号进行解码的改进方法包括以下步骤:将至少一个虚拟扬声器的位置添加(10)到L个扬声器的位置;生成(11)3D解码矩阵(D’),其中使用L个扬声器的位置(公式I)和至少一个虚拟位置(公式II);对3D解码矩阵(D’)进行向下混合(12);以及使用规模缩减的3D解码矩阵(公式III)对经编码的音频信号(i14)进行解码(14)。结果,获得多个经解码的扬声器信号(q14)。

Method and device for determining decoding matrix for audio signal decoding

The present disclosure relates to a method and a device for determining a decoding matrix for decoding audio signals. For decoding, a decoding matrix that is specific to a given speaker setting and generated using a known speaker location is required. An improved method for decoding coded audio signals in sound field format by L loudspeakers at known locations includes the following steps: adding (10) the position of at least one virtual loudspeaker to the position of L loudspeakers; generating (11) 3D decoding matrix (D'), which uses the position of L loudspeakers (formula I) and at least one virtual one. Quasi-position (Formula II); downward mixing of 3D decoding matrix (D') (12); and decoding of coded audio signal (i14) using scaled-down 3D decoding matrix (Formula III). As a result, a plurality of decoded loudspeaker signals (q14) are obtained.

【技术实现步骤摘要】
用于音频信号解码的解码矩阵的确定方法和装置本申请是申请号为201480056122.0、申请日为2014年10月20日、专利技术名称为“使用2D设置对高保真度立体声响复制音频声场表示进行解码以便音频回放的方法和装置”的专利技术专利申请的分案申请。
本专利技术涉及对音频声场表示进行解码,特别是对经高保真度立体声响复制(Ambisonics)格式化的音频表示,进行解码以便使用2D或近2D设置进行音频回放的方法和装置。
技术介绍
准确定位是任何空间音频再现系统的关键目标。这样的再现系统非常适用于会议系统、比赛或者受益于3D声音的其他虚拟环境。3D中的声音场景能够被合成或捕获为自然声场。诸如例如高保真度立体声响复制这样的声场信号携带所期望的声场的表示。需要解码处理以从声场表示获得个体扬声器信号。对经高保真度立体声响复制格式化的信号进行解码也被称为“呈现”。为了合成音频场景,需要涉及空间扬声器布置的平移功能(panningfunction)以便获得给定声源的空间定位。为了记录自然声场,需要麦克风阵列以捕获空间信息。高保真度立体声响复制方法是非常适合于实现这一点的工具。基于声场的球谐函数分解,经高保真度立体声响复制格式化的信号携带所期望的声场的表示。虽然基本的高保真度立体声响复制格式或B格式使用零阶和一阶的球谐函数,但是所谓高阶高保真度立体声响复制(HigherOrderAmbisonics,HOA)还使用至少二阶的球谐函数。扬声器的空间布置被称为扬声器设置。对于解码处理,需要解码矩阵(也被称为呈现矩阵),其特定于给定的扬声器设置并且使用已知的扬声器位置来生成。常用的扬声器设置是使用两个扬声器的立体声设置、使用五个扬声器的标准环绕设置以及使用多于五个扬声器的环绕设置的扩展。然而,这些熟知的设置受限于二维(2D),例如没有再现高度信息。用于能够再现高度信息的已知扬声器设置的呈现在声音定位和着色方面具有缺点:或者空间垂直平移以非常不均匀的响度被感知,或者扬声器信号具有强的旁瓣,这对于偏离中心的收听位置特别不利。因此,在将HOA声场描述呈现给扬声器时,所谓的能量保持(energy-preserving)的呈现设计是优选的。这意味着信号声源的呈现导致恒定能量的扬声器信号,而与源的方向无关。换句话说,扬声器呈现器保持由高保真度立体声响复制表示携带的输入能量。来自专利技术人的国际专利公开WO2014/012945A1[1]描述针对3D扬声器设置具有良好的能量保持和定位性质的HOA呈现器设计。然而,虽然该方法对覆盖所有方向的3D扬声器设置工作得非常好,但是对于2D扬声器设置(像例如5.1环绕这样的),一些源方向衰减。这特别适用于没有放置扬声器的方向,例如来自顶部。在F.Zotter和M.Frank的“All-RoundAmbisonicPanningandDecoding”[2]中,如果在由扬声器建立的凸包中存在漏洞,则添加“想象的”扬声器。然而,对于在真实扬声器上的回放,省略针对该想象的扬声器所得到的信号。这样,来自该方向(亦即,未安置真实扬声器的方向)的源信号仍然将衰减。而且,那篇论文仅示出想象扬声器的使用以便与VBAP(矢量基幅度平移)一起使用。
技术实现思路
因此,仍然存在的问题是针对2D(2维)扬声器设置设计能量保持的高保真度立体声响复制呈现器,其中,来自没有放置扬声器的方向的声源较少地衰减或者根本不衰减。2D扬声器设置可以被分类为扬声器的仰角在所定义的小范围内(例如,<10°)使得它们接近于水平面的设置。本说明书描述用于针对规则的或者不规则的空间扬声器分布对经高保真度立体声响复制格式化的音频声场表示进行呈现/解码的解决方案,其中,呈现/解码提供高度改良的定位和着色性质并且是能量保持的,并且其中,甚至来自没有扬声器可用的方向的声音也被呈现。有利地,来自没有扬声器可用的方向的声音以与在扬声器在相应的方向上可用的情况下应具有的能量和感知响度基本上相同的能量和感知响度来呈现。当然,这些声源的精确定位是不可能的,因为没有扬声器在其方向上可用。具体地,至少一些所描述的实施例提供用于获得对HOA格式的声场数据进行解码的解码矩阵的新方式。因为至少该HOA格式描述不直接与扬声器位置相关的声场,并且将要获得的扬声器信号未必是以基于信道的音频格式,所以HOA信号的解码总是与呈现音频信号紧密相关。原则上,这也适用于其他音频声场格式。因此,本公开涉及对声场相关的音频格式进行解码和呈现。术语解码矩阵和呈现矩阵被用作同义词。为了获得具有良好的能量保持性质的用于给定设置的解码矩阵,在没有扬声器可用的位置处添加一个或多个虚拟扬声器。例如,为了获得用于2D设置的改进的解码矩阵,在顶部和底部(对应于仰角角度+90°和-90°,并且2D扬声器以近似0°仰角来放置)添加两个虚拟扬声器。对于该虚拟3D扬声器设置,设计满足能量保持性质的解码矩阵。最后,将来自用于虚拟扬声器的解码矩阵的加权因子与对2D设置的真实扬声器的恒定增益混合。根据一个实施例,通过以下来生成用于将高保真度立体声响复制格式的音频信号呈现或解码到扬声器的给定集合的解码矩阵(或呈现矩阵):通过使用常规方法并且使用修改的扬声器位置来生成第一初步解码矩阵,其中,修改的扬声器位置包括扬声器的给定集合的扬声器位置以及至少一个添加的虚拟扬声器位置;以及对第一初步解码矩阵进行向下混合(downmix),其中,与至少一个添加的虚拟扬声器有关的系数被移除并且被分给与扬声器的给定集合的扬声器有关的系数。在一个实施例中,接着是对解码矩阵进行归一化的随后步骤。得到的解码矩阵适合于将高保真度立体声响复制信号呈现或解码到扬声器的给定集合,其中,甚至来自不存在扬声器的位置的声音也以正确的信号能量被再现。这是由于改进的解码矩阵的结构。优选地,第一初步解码矩阵是能量保持的。在一个实施例中,解码矩阵具有L行和O3D列。行数对应于2D扬声器设置中的扬声器的数量,列数对应于根据O3D=(N+1)2而取决于HOA阶数N的高保真度立体声响复制系数O3D的数量。2D扬声器设置的解码矩阵的系数的每个是至少第一中间系数和第二中间系数的和。第一中间系数通过能量保持的3D矩阵设计方法针对2D扬声器设置的当前扬声器位置来获得,其中,能量保持的3D矩阵设计方法使用至少一个虚拟扬声器位置。第二中间系数通过乘以加权因子g的根据所述能量保持的3D矩阵设计方法针对所述至少一个虚拟扬声器位置而获得的系数来获得。在一个实施例中,加权因子g根据来计算,其中,L是2D扬声器设置中的扬声器的数量。在一个实施例中,本专利技术涉及计算机可读存储介质,其上存储有可执行指令以使计算机执行包括上面或在权利要求书中公开的方法的步骤的方法。在权利要求9中公开利用该方法的装置。在从属权利要求、下面的描述和附图中公开有利的实施例。附图说明参照附图来描述本专利技术的示例性实施例,附图中:图1示出根据一个实施例的方法的流程图;图2示出经向下混合的HOA解码矩阵的示例性结构;图3示出获得和修改扬声器位置的流程图;图4示出根据一个实施例的装置的框图;图5示出由常规解码矩阵产生的能量分布;图6示出由根据实施例的解码矩阵产生的能量分布;以及图7示出对于不同频带单独优化的解码矩阵的使用。具体实施方式图本文档来自技高网
...

【技术保护点】
1.一种确定用于针对L个扬声器对经编码的高保真度立体声响复制格式的音频信号进行解码的解码矩阵的方法,包括:将至少一个虚拟扬声器的至少一个虚拟位置添加到L个扬声器的位置以形成修改的扬声器位置的集合,所述修改的扬声器位置的集合包括所述至少一个虚拟扬声器的至少一个虚拟位置以及所述L个扬声器的位置;基于所述L个扬声器的位置和所述至少一个虚拟位置确定第一矩阵,其中第一矩阵具有关于所确定的扬声器位置和虚拟扬声器位置的系数;确定第二矩阵,其中关于虚拟扬声器位置的系数被加权和分配给与所确定的扬声器位置有关的系数,并且其中第二矩阵被获得具有关于所确定的扬声器位置的系数,其中基于加权因子

【技术特征摘要】
2013.10.23 EP 13290255.21.一种确定用于针对L个扬声器对经编码的高保真度立体声响复制格式的音频信号进行解码的解码矩阵的方法,包括:将至少一个虚拟扬声器的至少一个虚拟位置添加到L个扬声器的位置以形成修改的扬声器位置的集合,所述修改的扬声器位置的集合包括所述至少一个虚拟扬声器的至少一个虚拟位置以及所述L个扬声器的位置;基于所述L个扬声器的位置和所述至少一个虚拟位置确定第一矩阵,其中第一矩阵具有关于所确定的扬声器位置和虚拟扬声器位置的系数;确定第二矩阵,其中关于虚拟扬声器位置的系数被加权和分配给与所确定的扬声器位置有关的系数,并且其中第二矩阵被获得具有关于所确定的扬声器位置的系数,其中基于加权因子对关于虚拟扬声器位置的系数进行加权,其中L是扬声器的数量;以及基于所述第二矩阵的归一化确定解码矩阵。2.一种确定用于针对L个扬声器对经编码的高保真度立体声响复制格式的音频信号进行解码的解码矩阵的装置,包括:添加...

【专利技术属性】
技术研发人员:F基勒J贝姆
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1