用于使用多声道下混合/上混合情况的参数化概念的多实例空间音频对象编码的解码器及方法技术

技术编号:11685067 阅读:108 留言:0更新日期:2015-07-06 16:58
提供了一种用于根据包括三个或更多个下混合声道的下混合信号生成包括一个或更多个音频输出声道的音频输出信号的解码器,其中,下混合信号对三个或更多个音频对象信号进行编码。解码器包括:输入声道路由器(110),用于接收所述三个或更多个下混合声道以及用于接收边信息;以及至少两个声道处理单元(121,122),用于生成至少两个经处理的声道以获得一个或更多个音频输出声道。输出声道路由器(110)被配置成将所述三个或更多个下混合声道中的至少两个中的每一个馈送至所述至少两个声道处理单元(121,122)中的至少一个中,以使得所述至少两个声道处理单元中的每一个接收所述三个或更多个下混合声道中的一个或更多个,并且使得所述至少两个声道处理单元(121,122)中的每一个接收少于所述三个或更多个下混合声道的总数的下混合声道。所述至少两个声道处理单元(121,122)中的每个声道处理单元被配置成根据边信息并且根据由所述声道处理单元从输入声道路由器接收的所述三个或更多个下混合声道中的至少两个中的所述一个或更多个,生成所述至少两个经处理的声道中的一个或更多个。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于使用多声道下混合/上混合情况的参数化概念的多实例空间音 频对象编码(M-SAOC)的解码器及方法。
技术介绍
在现代数字音频系统中,允许对接收器侧的所传送内容的音频对象相关修改是主 要趋势。这些修改包括:在经由空间分布的扬声器进行多声道回放的情况下对音频信号的 所选部分的增益修改和/或指定音频对象的空间重新布置。这可以通过将音频内容的不同 部分单独地传递至不同的扬声器来实现。 换言之,在音频处理、音频传输和音频存储领域中,允许关于面向对象的音频内容 回放的用户交互的期望在不断增加,并且存在以下需求:利用多声道回放的扩展可能性来 单独渲染音频内容或音频内容的一部分,以提高听觉印象。由此,多声道音频内容的使用为 用户带来了显著的改善。例如,可以获得三维听觉印象,三维听觉印象能够在娱乐应用中带 来提高了的用户满意度。然而,因为可以通过使用多声道音频回放来提高讲话者清晰度,所 以在专业环境中(例如,在电话会议应用中)多声道音频内容也有用。另外的可能的应用 是向聆听者提供音乐片段以单独地调节不同部分(也称作"音频对象")或轨道(如有声部 分或不同乐器)的回放电平和/或空间位置。用户可以出于以下原因而执行这样的调节: 个人品味、为了更容易地转录音乐片段的一个或更多个部分、教育目的、卡拉OK录音、排练 等。 例如脉冲编码调制(PCM)数据或甚至压缩的音频格式的形式的所有数字多声道 或多对象音频内容的直接离散传输要求非常高的比特率。然而,还期望以高效比特率的方 式来传输和存储音频数据。因此,人们愿意接受音频品质与比特率要求之间的合理折衷以 避免由多声道/多对象应用引起的过度资源负荷。 近来,在音频编码领域中,用于多声道/多对象音频信号的比特率高效传输/存储 的参数化技术已经由例如运动图像专家组(MPEG)和其他组织提出。一个示例是作为面向 声道的方法的MPEG环绕声(MPS)或作为面向对象的方法的MPEG空间音频对象编码(SAOC)。另外的面向对象的方法被称为"通知的源分离 (informedsourceseparation) " 。这些技术旨在基 于声道/对象和另外的描述所传输/所存储的音频场景和/或音频场景中的音频源对象的 边信息的下混合,重建期望的输出音频场景或期望的音频源对象。 以时间-频率选择性方式来进行对这样的系统中的声道/对象相关的边信息的 估计和应用。因此,这样的系统使用时频变换,如离散傅里叶变换OFT)、短时傅里叶变换 (STFT)或滤波器组如正交镜像滤波器(QMF)组等。图2中示出了使用MPEGSA0C的示例的 这样的系统的基本原理。 在STFT的情况下,时间维度由时间块的数量来表示,而谱维度通过谱系数("频率 点")的数量被捕获。在QMF的情况下,时间维度由时间隙的数量来表示,频谱维度通过子 带的数量来捕获。如果通过随后的第二滤波器级的应用来提高QMF的谱分辨率,则整个滤 波器组被称为混合QMF,并且高分辨率的子带被称为混合子带。 如上面已经描述的,在SAOC中,以时间-频率选择性方式来执行一般的处理,并且 在每个频带内可以被描述如下,如图2中所示: -作为编码器处理的一部分,使用由元素屯rdN,P构成的下混合矩阵将N个输入 音频对象信号8广*%下混合成P个声道Xl~Xp。另外,编码器提取描述输入音频对象(边 信息估计器(SM)模块)的特征的边信息。针对MPEGSAOC,关于彼此的对象功率的关系是 这样的边信息的最基本的形式。 -传输/存储下混合信号和边信息。为此,可以例如使用公知的感知音频编码器 (如MPEG-1/2层II或MPEG-1/2层III(亦称mp3)、MPEG-2/4高级音频编码(AAC)等)对 下混合音频信号进行压缩。 -在接收端,解码器概念地设法使用所传输的边信息根据(经解码的)下混合信号 来恢复原始的对象信号("对象分离")。然后,使用由图2中的系数巧^…^^描述的渲染 矩阵,将这些近似的对象信号& ...知混合成由M个音频输出声道所表示的目标 场景。在极端情况下,所期望的目标场景不仅可以是对混合之外的仅仅一个源信号的渲染 (源分离情况),而且可以是包括所传输的对象的任何其他的任意声学场景。例如,输出可 以是单声道、2声道立体声或5. 1多声道目标场景。 在音频编码领域中增加的带宽/可用存储空间以及持续的改进使得用户能够从 稳定增加的多声道音频产品的选择中进行选择。多声道5. 1音频格式已经是DVD和蓝光产 品中的标准。具有甚至更多的音频传输声道的新的音频格式(如MPEG-H3D音频)正在兴 起,MPEG-H3D音频将为终端用户提供高度的沉浸式音频体验。 目前,参数化音频对象编码方案被限定为最多两个下混合声道。这些方案可以在 一定程度上仅应用于对多声道混合的一些扩展,例如对仅仅两个所选的下混合声道。因此, 这些编码方案提供给用户按照他/她自己的偏好来调整音频场景的灵活性严重受限,例 如,关于改变体育评论员和体育广播中的氛围的音频电平。 此外,当前的音频对象编码方案在编码器侧的混合处理中仅提供有限的可变性。 混合处理受限于音频对象的时变混合,并且频变混合是不可行的。 因此,如果可以提供针对音频对象编码的改进的概念,则这将受到高度赞赏。
技术实现思路
本专利技术的目的是提供用于音频对象编码的改进了的概念。本专利技术的目的由根据权 利要求1的解码器、由根据权利要求16的方法以及由根据权利要求17的计算机程序来实 现。 提供了一种用于根据包括三个或更多个下混合声道的下混合信号来生成包括一 个或更多个音频输出声道的音频输出信号的解码器,其中,下混合信号对三个或更多个音 频对象信号进行编码。 解码器包括:输入声道路由器,其用于接收所述三个或更多个下混合声道以及用 于接收边信息;以及至少两个声道处理单元,其用于生成至少两个经处理的声道以获得一 个或更多个音频输出声道。 输入声道路由器被配置成将所述三个或更多个下混合声道中的至少两个中的每 一个馈送到所述至少两个声道处理单元中的至少一个中,以使得所述至少两个声道处理单 元中的每一个接收所述三个或更多个下混合声道中的一个或更多个,并且使得所述至少两 个声道处理单元中的每一个接收少于所述三个或更多个下混合声道的总数的下混合声道。 所述至少两个声道处理单元中的每个声道处理单元被配置成:根据边信息并且根 据由所述声道处理单元从输入声道路由器接收的所述三个或更多个下混合声道中的所述 至少两个中的所述一个或更多个,生成所述至少两个经处理的声道中的一个或更多个。 混合处理中更大的灵活性使得能够最佳地利用信号对象特征。可以产生关于所接 收的品质而针对解码器侧的参数化分离进行优化的下混合。 实施方式对任意数量的下混合/上混合声道的SAOC方案的参数化部分进行扩展。 专利技术方法还使得完全灵活地对音频对象进行混合成为可能。 根据实施方式,输入声道路由器可以被配置成将所述三个或更多个下混合声道中 的至少两个中的每一个馈送到所述至少两个声道处理单元中的恰好一个中。 在实施方式中,输入声道路由器可以被配置成:将所述三个或更多个下混合声道 中的每一个馈送到所述至少两个声道处理单元中的至少一个中,以使得所述三个或更多个 下混合声道中本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/CN104756186.html" title="用于使用多声道下混合/上混合情况的参数化概念的多实例空间音频对象编码的解码器及方法原文来自X技术">用于使用多声道下混合/上混合情况的参数化概念的多实例空间音频对象编码的解码器及方法</a>

【技术保护点】
一种解码器,所述解码器用于根据包括三个或更多个下混合声道的下混合信号生成包括一个或更多个音频输出声道的音频输出信号,其中,所述下混合信号对三个或更多个音频对象信号进行编码,其中,所述解码器包括:输入声道路由器(110),用于接收所述三个或更多个下混合声道以及用于接收边信息,以及至少两个声道处理单元(121,122,123,124,125,126),用于生成至少两个经处理的声道,以获得所述一个或更多个音频输出声道,其中,所述输入声道路由器(110)被配置成将所述三个或更多个下混合声道中的至少两个中的每一个馈送至所述至少两个声道处理单元(121,122,123,124,125,126)中的至少一个,以使得所述至少两个声道处理单元(121,122,123,124,125,126)中的每一个接收所述三个或更多个下混合声道中的一个或更多个,并且使得所述至少两个声道处理单元(121,122,123,124,125,126)中的每一个接收少于所述三个或更多个下混合声道的总数的下混合声道,其中,所述至少两个声道处理单元(121,122,123,124,125,126)中的每个声道处理单元被配置成:根据所述边信息并且根据由所述声道处理单元从所述输入声道路由器(110)接收的所述三个或更多个下混合声道中的所述至少两个中的所述一个或更多个,生成所述至少两个经处理的声道中的一个或更多个。...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:托尔斯滕·卡斯特纳于尔根·赫勒莱昂·特伦提夫奥利弗·赫尔穆特
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1