空间音频参数编码和相关联的解码的确定制造技术

技术编号:33121982 阅读:14 留言:0更新日期:2022-04-17 00:25
一种装置,包括被配置为执行以下操作的部件:生成针对时频块的空间音频信号定向元数据参数;生成基于第一量化分辨率(203)编码的针对时频块的编码空间音频信号定向元数据参数(108);将用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数(108)的比特数量与所确定的比特数量进行比较;当用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数(108)的比特数量小于所确定的比特数量(217)时,输出或存储基于第一量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数(108);当用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数(108)的比特数量大于所确定的比特数量,并且所确定的比特数量与用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数(108)的比特数量之差小于所确定的比特数量在所确定的阈值(217)内时,生成基于第二量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数(108);当用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数(108)的比特数量大于所确定的比特数量,并且所确定的比特数量与用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数(108)的比特数量之差大于所确定的阈值时,生成基于第三量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数(108),其中,第三量化分辨率被确定为使得用于基于第三量化分辨率编码的针对时频块的编码空间音频信号定向参数的比特数量始终等于或小于所确定的比特数量(217)。小于所确定的比特数量(217)。小于所确定的比特数量(217)。

【技术实现步骤摘要】
【国外来华专利技术】空间音频参数编码和相关联的解码的确定


[0001]本申请涉及用于声场相关参数编码的装置和方法,但非排他地涉及用于音频编码器和解码器的时频域方向相关参数编码的装置和方法。

技术介绍

[0002]参数空间音频处理是使用一组参数来描述声音的空间方面的音频信号处理领域。例如,在从麦克风阵列进行参数化空间音频捕获时,从麦克风阵列信号估计一组参数是一种典型且有效的选择,该组参数诸如是频带中声音的方向、以及频带中被捕获声音的定向与非定向部分的比率。众所周知,这些参数很好地描述了在麦克风阵列的位置处的被捕获声音的感知空间特性。这些参数可以相应地在空间声音的合成中使用,以用于双耳式耳机、扬声器、或诸如全景环绕声(Ambisonics)之类的其他格式。
[0003]因此,频带中的方向和直接与总能量比(direct

to

total energy ratio)是对空间音频捕获特别有效的参数化。
[0004]包括频带中的方向参数和频带中的能量比率参数(指示声音的方向性)的参数集也可以被用作用于音频编解码器的空间元数据(其还可以包括其他参数,诸如相干性(coherence)、扩展相干性(spread coherence)、方向数量、距离等)。例如,这些参数可以从麦克风阵列捕获的音频信号来估计,并且例如可以从麦克风阵列信号生成立体声信号以与空间元数据一起传送。立体声信号例如可以用AAC编码器来编码。解码器可以将音频信号解码成PCM信号,并(使用空间元数据)处理频带中的声音以获得空间输出,例如,双耳输出。
[0005]前述解决方案尤其适合于对来自(例如,移动电话、VR相机、独立麦克风阵列中的)麦克风阵列的捕获空间声音进行编码。然而,可期望这种编码器除了麦克风阵列捕获的信号之外还具有其他输入类型,例如,扬声器信号、音频对象信号、或Ambisonics信号。
[0006]分析一阶Ambisonics(FOA)输入用于空间元数据提取已经在与定向音频编码(DirAC)和谐波平面波展开(Harpex)有关的科学文献中进行了详尽的记录。这是因为存在直接提供FOA信号(更准确地:其变体,B格式信号)的麦克风阵列,并因此分析这种输入已经成为该领域的研究重点。
[0007]用于编码器的另一输入也是多通道扬声器输入,诸如5.1或7.1通道环绕声输入。
[0008]然而,关于元数据的定向分量,针对每个所考虑的时间/频率子带,其可以包括所得到的方向的仰角、方位角(以及能量比率,其是1

扩散度(1

diffuseness))。这些定向分量的量化是当前的研究课题。

技术实现思路

[0009]根据第一方面提供一种装置,其包括被配置为执行以下操作的部件:生成针对时频块的空间音频信号定向元数据参数;生成基于第一量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数;将用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数的比特数量与所确定的比特数量进行比较;当用于基于第一量化分辨率
编码的针对时频块的编码空间音频信号定向参数的比特数量小于所确定的比特数量时,输出或存储基于第一量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数;当用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数的比特数量大于所确定的比特数量,并且所确定的比特数量与用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数的比特数量之差小于所确定的比特数量在所确定的阈值内时,生成基于第二量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数;当用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数的比特数量大于所确定的比特数量,并且所确定的比特数量与用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数的比特数量之差大于所确定的阈值时,生成基于第三量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数,其中,第三量化分辨率被确定为使得用于基于第三量化分辨率编码的针对时频块的编码空间音频信号定向参数的比特数量始终等于或小于所确定的比特数量。
[0010]被配置为生成基于第一量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数的该部件可以被配置为:确定第一量化分辨率以用于空间音频信号定向元数据参数的值与索引值之间的映射;基于使用第一量化分辨率的映射,生成与空间音频信号定向元数据参数相关联的索引;基于是固定速率编码还是熵编码使用更少的比特数量,使用固定速率编码或熵编码来对索引进行选择性地编码。
[0011]被配置为确定第一量化分辨率以用于空间音频信号定向元数据参数的值与索引值之间的映射的该部件可以被配置为:基于与空间音频信号定向元数据参数相关联的能量比率值,确定第一量化分辨率以用于空间音频信号定向元数据参数的值与索引值之间的映射。
[0012]被配置为当所确定的比特数量与用于基于第一量化分辨率编码的针对时频块的编码空间音频信号定向参数的比特数量之差在所确定的阈值内时,生成基于第二量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数的该部件被配置为:确定第二量化分辨率以用于空间音频信号定向元数据参数的值与索引值之间的映射;基于针对使用第一量化分辨率被固定速率编码的空间音频信号定向元数据参数的使用第二量化分辨率的映射,生成与空间音频信号定向元数据参数相关联的索引。
[0013]该部件可以进一步被配置为:基于针对空间音频信号定向元数据参数的使用第一量化分辨率的映射,输出或存储与空间音频信号定向元数据参数相关联的熵编码索引;以及基于针对空间音频信号定向元数据参数的使用第二量化分辨率的映射,输出或存储与空间音频信号定向元数据参数相关联的固定速率编码索引。
[0014]该部件可以进一步被配置为:对编码索引进行排序,以使得熵编码索引在固定速率编码索引的前面。
[0015]该部件可以进一步被配置为:当使用第一量化分辨率或第二量化分辨率时,生成指示符。
[0016]被配置为生成基于第三量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数的该部件可以被配置为:基于用于使用第三量化分辨率的固定速率编码的比特数量始终等于或小于所确定的比特数量,确定第三量化分辨率以用于空间音频信号定向元数据参数的值与索引值之间的映射;基于使用第三量化分辨率的映射,生成与空间音频信
号定向元数据参数相关联的索引;以及基于是固定速率编码还是熵编码使用更少的比特数量,使用固定速率编码或熵编码来对索引进行选择性地编码。
[0017]该部件可以进一步被配置为:输出基于是固定速率编码还是熵编码使用更少的比特数量而使用固定速率编码或熵编码选择性地编码的索引。
[0018]该部件可以进一步被配置为:在确定第三量化分辨率时,生成指示符。
[0019]根据第二方面提供一种装置,其包括被配置为执行以下操作的部件:接收针对时频块的编码空间音频信号定向元数据参数;接收指示符,该指示符被配置为标识编本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种装置,包括被配置为执行以下操作的部件:生成针对时频块的空间音频信号定向元数据参数;生成基于第一量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数;将用于基于所述第一量化分辨率编码的针对所述时频块的所述编码空间音频信号定向参数的比特数量与所确定的比特数量进行比较;当用于基于第一量化分辨率编码的针对时频块的所述编码空间音频信号定向参数的所述比特数量小于所确定的比特数量时,输出或存储基于所述第一量化分辨率编码的针对所述时频块的所述编码空间音频信号定向元数据参数;当用于基于所述第一量化分辨率编码的针对所述时频块的所述编码空间音频信号定向参数的所述比特数量大于所述所确定的比特数量,并且所述所确定的比特数量与用于基于所述第一量化分辨率编码的针对所述时频块的所述编码空间音频信号定向参数的所述比特数量之间的差小于所确定的比特数量在所确定的阈值内时,生成基于第二量化分辨率编码的针对所述时频块的编码空间音频信号定向元数据参数;当用于基于所述第一量化分辨率编码的针对所述时频块的所述编码空间音频信号定向参数的所述比特数量大于所述所确定的比特数量,并且所述所确定的比特数量与用于基于所述第一量化分辨率编码的针对所述时频块的所述编码空间音频信号定向参数的所述比特数量之间的所述差大于所述所确定的阈值时,生成基于第三量化分辨率编码的针对所述时频块的编码空间音频信号定向元数据参数,其中,所述第三量化分辨率被确定为使得用于基于所述第三量化分辨率编码的针对所述时频块的所述编码空间音频信号定向参数的比特数量始终等于或小于所述所确定的比特数量。2.根据权利要求1所述的装置,其中,被配置为生成基于第一量化分辨率编码的针对时频块的编码空间音频信号定向元数据参数的所述部件被配置为:确定所述第一量化分辨率以用于所述空间音频信号定向元数据参数的值与索引值之间的映射;基于使用所述第一量化分辨率的所述映射,生成与所述空间音频信号定向元数据参数相关联的索引;基于是固定速率编码还是熵编码使用更少的比特数量,使用所述固定速率编码或所述熵编码来对所述索引进行选择性地编码。3.根据权利要求2所述的装置,其中,被配置为确定所述第一量化分辨率以用于所述空间音频信号定向元数据参数的值与索引值之间的映射的所述部件被配置为:基于与所述空间音频信号定向元数据参数相关联的能量比率值,确定所述第一量化分辨率以用于所述空间音频信号定向元数据参数的值与索引值之间的映射。4.根据权利要求2至3中任一项所述的装置,其中,被配置为当所述所确定的比特数量与用于基于所述第一量化分辨率编码的针对所述时频块的所述编码空间音频信号定向参数的所述比特数量之间的差在所确定的阈值内时,生成基于第二量化分辨率编码的针对所述时频块的编码空间音频信号定向元数据参数的所述部件被配置为:确定所述第二量化分辨率以用于所述空间音频信号定向元数据参数的值与索引值之间的映射;基于针对使用所述第一量化分辨率被固定速率编码的空间音频信号定向元数据参数
的使用所述第二量化分辨率的所述映射,生成与所述空间音频信号定向元数据参数相关联的索引。5.根据权利要求4所述的装置,所述部件进一步被配置为:基于针对空间音频信号定向元数据参数的使用所述第一量化分辨率的所述映射,输出或存储与所述空间音频信号定向元数据参数相关联的熵编码索引;以及基于针对空间音频信号定向元数据参数的使用所述第二量化分辨率的所述映射,输出或存储与所述空间音频信号定向元数据参数相关联的固定速率编码索引。6.根据权利要求5所述的装置,所述部件进一步被配置为:对所述编码索引进行排序,以使得所述熵编码索引在所述固定速率编码索引的前面。7.根据权利要求1至6中任一项所述的装置,其中,所述部件进一步被配置为:当使用所述第一量化分辨率或所述第二量化分辨率时,生成指示符。8.根据权利要求1至7中任一项所述的装置,其中,被配置为生成基于第三量化分辨率编码的针对所述时频块的编码空间音频信号定向元数据参数的所述部件被配置为:基于用于使用所述第三量化分辨率的固定速率编码的比特数量始终等于或小于所述所确定的比特数量,确定所述第三量化分辨率以用于所述空间音频信号定向元数据参数的值与索引值之间的映射;基于使用所述第三量化分辨率的所述映射,生成与所述空间音频信号定向元数据参数相关联的索引;以及基于是固定速率编码还是熵编码使用更少的比特数量,使用所述固定速率编码或所述熵编码来对所述索引进行选择性地编码。9.根据权利要求8所述的装置,其中,所述部件进一步被配置为:输出基于是固定速率编码还是熵编码使用更少的比特数量而使用所述固定速率编码或所述熵编码选择性地编码的索引。10.根据权利要求1至9中任一项所述的装置,其中,所述部件进一步被配置为:当确定所述第三量化分辨率时,生成指示符。11.一种装置,包括被配置为执行以下操作的部件:接收针对时频块的编码空间音频信号定向元数据参数;接收指示符,所述指示符被配置为标识所述编码空间音频信号定向元数据参数是否是基于始终等于或小于所确定的比特数量的量化分辨...

【专利技术属性】
技术研发人员:A
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1