用于对降混合矩阵解码及编码的方法、编码器及解码器技术

技术编号:13333821 阅读:78 留言:0更新日期:2016-07-12 04:22
描述一种方法,该方法对用于将音频内容的多个输入声道(300)映射至多个输出声道(302)的降混合矩阵(306)进行解码,输入及输出声道(300,302)与位于相对于收听者位置的预定位置处的各个扬声器相关联,其中通过利用多个输入声道(300)的扬声器对(S1‑S9)的对称性以及多个输出声道(302)的扬声器对(S10‑S11)的对称性对降混合矩阵(306)进行编码。对表示经编码的降混合矩阵(306)的经编码的信息进行接收并解码以获得经解码的降混合矩阵(306)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术设及音频编码/解码的领域,尤其设及空间音频编码及空间音频对象编码, 例如,设及3D音频编解码器系统的领域。本专利技术的实施例设及用于对用于将音频内容的多 个输入声道映射至多个输出声道的降混合矩阵进行编码及解码的方法、设及用于呈现音频 内容的方法、设及用于对降混合矩阵进行编码的编码器、设及用于对降混合矩阵进行解码 的解码器、设及音频编码器W及设及音频解码器。
技术介绍
在本
中,空间音频编码工具是众所周知的并且,例如,在MPEG-surround 标准中已被标准化。空间音频编码从诸如在再现装备(setup)中通过其布置而识别的五个 或屯个声道(即左声道、中间声道、右声道、左环绕声道、右环绕声道W及低频增强声道)的 原始输入声道开始。空间音频编码器可从原始声道得到一个或多个降混合声道,且此外可 得到关于空间线索(cues)参数化数据,例如在声道相干数值中的声道间水平差异、声道间 相位差异、声道间时间差异等等。一个或多个降混合声道与指示空间线索的参数化旁侧信 息一起被传输至用于对降混合声道及相关联的参数化数据进行解码W最终获得原始输入 声道的近似版本的输出声道的空间音频解码器。声道在输出装备的布置可为固定的,例如, 5.1格式、7.1格式等等。同样,空间音频对象编码工具在此
中是众所周知的,且(例如)在MPEG SA0C(SA0C=空间音频对象编码)标准中被标准化。相比于空间音频编码从原始声道开始, 空间音频对象编码从音频对象开始,该音频对象不自动专用于某个擅染再现装备。相反,音 频对象在再现场景中的布置是灵活的且可由用户(例如)通过将某些擅染信息输入至空间 音频对象编码解码器中而设定。可选地或此外地,擅染信息可作为附加旁侧信息或元数据 而被传输,擅染信息可包括某个音频对象在再现设置中(例如,随时间)待被放置的位置处 的信息。为获得某个数据压缩,使用SAOC编码器对多个音频对象进行编码,SAOC编码器通过 根据某个降混合信息对对象进行降混合W从输入对象计算一个或多个传输声道。此外, SAOC编码器计算表示对象间线索(诸如,对象水平差异(OLD)、对象相干值等)的参数化旁侧 信息。如在SAC(SAC =空间音频编码)中,针对个别时间/频率平铺(time/打equency tiles) 计算对象间参数化数据。对于音频信号的某个帖(例如,1024或2048个样本),考虑多个频带 (例如,24、32或64个频带),W便为每个帖及每个频带提供参数化数据。举例而言,当音频片 段具有20个帖且当每个帖被细分成32个频带时,时间/频率平铺的数目为640。 在3D音频系统中,可能期望使用扩音器(loudspeaker)或扬声器(speaker)配置在 接收器处提供音频信号的空间印象,因为扩音器或扬声器配置在接收器处是可用的,但可 不同于用于原始音频信号的原始扬声器配置。在此情形下,根据哪些输入声道依据音频信 号的原始扬声器配置而被映射至根据接收器的扬声器配置定义的输出声道,需要进行转 换,该转换亦被称作"降混合"。
技术实现思路
本专利技术的目标在于提供用于为接收器提供降混合矩阵的改良方法。 此目标由根据权利要求1、2及20的方法、根据权利要求24的编码器、根据权利要求 26的解码器、根据权利要求28的音频编码器及根据权利要求29的音频解码器实现。 本专利技术基于W下发现:可通过利用对称性实现稳定的降混合矩阵的更有效率的编 码,可在关于与各个声道相关联的扬声器的放置的输入声道配置及输出声道配置中发现该 对称性。本专利技术的专利技术者已发现,利用此对称性允许将对称地布置的扬声器(例如,具有关 于收听者位置的具有相同仰角及具有相同绝对值但带有不同正负号的方位角的位置的那 些扬声器)组合至降混合矩阵的共同行/列。此允许生成具有减小的尺寸的紧密降混合矩 阵,因此,当与原始降混合矩阵相比时,可更容易且更有效率地对该紧密降混合矩阵进行编 码。[000引根据实施例,不仅定义了对称扬声器组,且实际上创建了=类扬声器组(即,上述 的对称扬声器、中屯、扬声器及不对称扬声器),然后其可用于生成紧密表示。此方法为有利 的,因为它允许不同地且因此更有效率地处置来自各个类别的扬声器。 根据实施例,对紧密降混合矩阵进行编码包含:对与关于实际的紧密降混合矩阵 的信息分开的增益值进行编码。通过创建紧密显著性(significance)矩阵来对关于实际的 紧密降混合矩阵的信息进行编码,通过将输入及输出对称扬声器对中的每个并入一个组, 该紧密显著性矩阵关于紧密输入/输出声道配置指示非零增益的存在。此方法为有利的,因 为它允许基于行程长度方案的显著性矩阵的有效率的编码。 根据实施例,可提供模板矩阵,该模板矩阵类似于紧密降混合矩阵,其中模板矩阵 的矩阵元素中的条目大体上对应于紧密降混合矩阵中的矩阵元素中的条目。大体而言,在 编码器及解码器处提供此模板矩阵,且此模版矩阵与紧密降混合矩阵的不同之处仅在于矩 阵元素的减少的数目,从而通过利用此模板矩阵将逐元素地XOR应用至紧密显著性矩阵,将 大幅减少矩阵元素的数目。此方法为有利的,因为它允许再次使用(例如)行程长度方案更 进一步地增大对显著性矩阵进行编码的效率。 根据又一实施例,编码进一步基于正常扬声器是否仅混合至正常扬声器且WE扬 声器仅混合至LFE扬声器的指示。此为有利的,因为它进一步改良了显著性矩阵的编码。 根据又一实施例,至于行程长度编码所应用于的一维向量,提供紧密显著性矩阵 或上述XOR运算的结果W将其转换为成串的零,其中一跟随其后,此为有利地,因为它提供 用于对信息进行编码的极有效率的可能性。为实现更有效率的编码,根据实施例,将有限哥 伦布-莱斯编码应用于行程长度值。 根据另一实施例,对于每个输出扬声器组,指示对称性及可分离性的属性是否适 用于生成其的所有对应的输入扬声器组。此为有利的,因为它指示在(例如)由左扬声器及 右扬声器组成的扬声器组中,输入声道组中的左扬声器仅被映射至对应的输出扬声器组中 的左声道,输入声道组中的右扬声器仅被映射至输出声道组中的右扬声器,且不存在自左 声道至右声道的混合。此允许由单一增益值替换原始降混合矩阵的2X2子矩阵中的四个增 益值,该单一增益值可被引入至紧密矩阵中,或在紧密矩阵为显著性矩阵的情况下可被单 独地编码。在任何情况下,待编码的增益值的总数减少。因此,对称性及可分离性的信号发 送的(signaled)属性为有利的,因为它们允许对与输入及输出扬声器组中的每对相对应的 子矩阵进行有效率地编码。 根据实施例,为了对增益值进行编码,使用信号发送的最小及最大增益W及信号 发送的期望精度W特定次序创建可能增益的列表。W常用增益位于列表或表格的开始处的 此次序创建增益值。此为有利的,因为它允许通过将用于对增益值进行编码的最短码字应 用于最频繁使用的增益而对增益值进行有效率地编码。 根据实施例,可在列表中提供生成的增益值,列表中的每个条目具有与其相关联 的索引。当对增益值进行编码而非对实际值进行编码时,增益的索引被编码。此可(例如)通 过应用有限哥伦布-莱斯编码方法来进行。此增益值的处置为有利的,因为它允许对其进行 有效率地编码。 根据实施例,可连同降混合矩阵一起本文档来自技高网
...

【技术保护点】
一种用于对用于将音频内容的多个输入声道(300)映射至多个输出声道(302)的降混合矩阵(306)进行解码的方法,所述输入及输出声道(300,302)与位于相对于收听者位置的预定位置处的各个扬声器相关联,其中通过利用所述多个输入声道(300)的扬声器对(S1‑S9)的对称性以及所述多个输出声道(302)的扬声器对(S10‑S11)的对称性对所述降混合矩阵(306)进行编码,所述方法包含:接收表示经编码的降混合矩阵(306)的经编码的信息;以及对所述经编码的信息进行解码以获得经解码的降混合矩阵(306)。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:弗洛林·基多阿希姆·孔茨伯恩哈德·格里尔
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1