用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统技术方案

技术编号:17051893 阅读:36 留言:0更新日期:2018-01-17 18:57
本公开涉及用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统。以比特流(P)为基础,通过从比特流导出m通道核心信号(Y)和多通道编码参数(α)重构n通道音频信号(X),此处1≤m<n。从比特流还导出量化核心信号的编码器侧动态范围限制的预处理动态范围控制参数,即预处理DRC参数(DRC2)。在基于预处理DRC参数消除任何编码器侧动态范围限制的同时通过根据多通道编码参数的参数合成获得n通道音频信号。在特定的实施例中,重构进一步包括量化可能的解码器侧动态范围压缩的经补偿的后处理DRC参数的使用。优选地,由不同解码器侧组件执行编码器侧范围限制消除和范围压缩。消除和压缩可以由DRC预处理器协调。

A system for maintaining a reversible dynamic range control information associated with a parameter audio encoder

The present disclosure relates to a system for maintaining a reversible dynamic range control information associated with a parameter audio encoder. In the bit stream (P) as the foundation, through the M derived from the bit stream channel core signal (Y) and multi channel encoding parameters (alpha) reconstruction of N channel audio signal (X), where 1 < m < n. A preprocessing dynamic range control parameter, the preprocessing DRC parameter (DRC2), is also derived from the bit stream for the dynamic range limitation of the encoder side dynamic range of the quantized core signal. Based on preprocessing DRC parameters to eliminate the dynamic range limitation of any encoder side, N channel audio signal is obtained by synthesizing parameters of multi-channel coding parameters. In a particular embodiment, the reconfiguration further includes the use of a compensated post-processing DRC parameter that quantifies the possible dynamic range compression of the decoder side. Preferably, the encoder side limits and range compression are performed by the different decoder side components. The elimination and compression can be coordinated by the DRC preprocessor.

【技术实现步骤摘要】
用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统本申请是申请号为201380025886.9、申请日为2013年5月2日、专利技术名称为“用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统”的专利技术专利申请的分案申请。相关申请的交叉引用本申请要求2012年5月18日提交的美国临时专利申请No.61/649036、2012年7月25日提交的美国临时专利申请No.61/664507和2012年10月12日提交的美国临时专利申请No.61/713005的优先权,这些申请的全部内容通过引用并入此。
文中公开的本专利技术主要涉及视听媒体分布(distribution)。特别地,其涉及在解码期间允许较高比特率模式和较低比特率模式两者以及无缝模式转换的自适应分布格式。本专利技术进一步涉及用于根据该分布格式编码和解码信号的方法和设备。
技术介绍
已知参数立体声和多通道编码方法在收听质量方面可扩展且有效率,这使得它们在低比特率应用中特别有吸引力。然而,在比特率限制具有暂时性特性(如,网络抖动、负载变化)的情况下,可以通过使用自适应分布格式获得可用网络资源的所有好处,其中在正常条件期间使用相对较高的比特率且在网络功能差时使用较低比特率。现有的自适应分布格式和相关联的编码(解码)技术可从它们的带宽效率、计算效率、抗误码、算法延迟和进一步的在视听媒体分布中关于比特率切换事件对于正在享受被解码的媒体的人而言有多明显的角度被提高。传统解码器可以预期仍与较新的、专用的设备并行使用这一事实在向后兼容性必须被维持的范围内对这样的潜在提高造成限制。用于确保在视听信号回放期间更一致的动态范围的动态范围控制(DRC)技术在本领域广为人知。可以参见T.CarrollandJ.Riedmiller,“AudioforDigitalTevision”,publishedaschapter5.18ofE.A.Williamsetal.(eds.),NABEngineeringHandbook,10thed.(2007),AcademicPress和其中引用的参考文献以获得概述。这样的技术可以允许在信号本身以全动态范围广播时接收器修改视听信号的动态范围以适应相对不复杂的回放设备,实现更加完善的设备。DRC的简单实现可以使用编码在从0到1的间隔中的增益因子的元数据字段,解码器可以选择应用或不应用该因子。使用已知的DRC技术,被编码的视听信号可以和如下这样的元数据一起被传输,该元数据使得用户能够压缩或增大(boost)回放动态范围的能力以适应他或她的偏好或人工地使动态范围适应可用回放设备。然而,已知的DRC技术可能与自适应比特率编码方式不兼容,并且在两个比特率之间切换可能有时会伴随动态范围不一致,在传统设备中尤其如此。本专利技术解决了该顾虑。附图说明现在将参考附图描述本专利技术的实施例,其中:图1a、1b、3、7和10是根据本专利技术的示例实施例的音频编码系统的一般化框图。图2a、2b、2c、4、6和13是根据本专利技术的示例实施例的音频解码系统的一般化框图。图5示出了在音频编码系统中的参数分析级的一部分。图8图解了涉及相同长度的时间块的基于预处理和后处理DRC参数的的经补偿的后处理DRC参数值的计算。图9图解了涉及不同长度的时间块的基于预处理和后处理DRC参数的的经补偿的后处理DRC参数值的计算。图11和12示出了在音频解码系统中的参数合成级的一部分。所有图都是示意的且一般仅示出解释本专利技术所必要的部分,而其他部分可以被省略或仅被建议。除非另有指示,否则在不同图中的相似附图标记指代相似部分。具体实施方式Ⅰ.概述如此处使用的,“音频信号”可以是纯音频信号或视听信号或多媒体信号中的音频部分。本专利技术的示例实施例提出了允许以带宽经济方式的视听媒体的分布的方式和设备。特别地,示例性实施例提出了允许传统接收器和更现代的设备两者输出具有一致的对话水平(level)的音频部分的视听媒体分布的编码格式。特别地,示例性实施例提出了具有自适应比特率的编码格式,其中在两个比特率之间的切换不需要伴有尖锐的对话水平变化,否则它可能在回放期间成为音频信号或信号中的音频部分中可察觉的伪像。本专利技术的示例性实施例提供了具有在独立权利要求中阐述的特征的编码方法、编码器、解码方法、解码器、计算机程序产品和媒体编码格式。本专利技术的第一实施例提供了用于基于比特流P重构n通道音频信号X的解码系统。该解码系统至少可在参数编码模式中操作并包括:●解复用器,用于接收该比特流并输出编码核心信号和一或多个多通道编码参数,该一或多个多通道编码参数共同由α指示;●核心信号解码器,用于接收编码核心信号并输出m通道核心信号,其中1≤m<n;●参数合成级,用于接收核心信号和多通道编码参数,并且通过使用依赖多通道编码参数的增益形成核心信号的通道的线性组合以输出n通道信号。在该第一实施例中,该比特流进一步包括一或多个预处理DRC参数DRC2,其定量地表征已经在产生比特流的编码器中执行的动态范围限制操作。基于预处理DRC参数,该解码系统可操作以消除编码器侧动态范围限制。优选地,该信号被划分为时间块且该预处理DRC参数DRC2被定义为具有该信号的一个时间块的分辨率;因而,参数DRC2的每个值应用到至少一个时间块,且可能将每个时间块与特定于该时间块的特定值相关联。仍然在不偏离本专利技术范围的情况下,参数DRC2的值可以对于若干个连续块为常数。例如,参数DRC2的值可以仅每个时间帧(其包括多个时间块)更新一次,从而在该时间帧上参数DRC2为常数。与第一示例性实施例相关联的优点是该预处理DRC参数DRC2为解码系统提供了以如此的时间间隔将音频信号恢复为它的原始动态范围的选项,不管出于任何原因编码器已经按该时间间隔执行动态范围限制(或压缩)。该恢复可以相当于消除该动态范围限制,即,提高(或增大)该动态范围。在编码器中限制动态范围的一个可能原因可能是为了避免削波(clipping)。恢复是否被应用可以例如取决于人工输入的用户输入、自动检测的回放设备的特性、从外部源获得的目标DRC水平或其他因素。该目标DRC水平可以表达将由解码系统应用的原始后处理动态范围控制(由后处理DRC参数DRC1量化)的一部分。它可以由参数f∈[0,1]表示,该参数将待被应用的DRC的量从DRC1修改到f×DRC1(在对数单元中)。在一个简单的实施例中,该DRC2参数可以以在对数形式中表示为正dB值的宽谱(或宽带)增益因子的形式被编码,其量化信号已经经历的相对振幅减小。因此,假设DRC2=x&gt;0,在编码器侧的相对振幅变化是10-x/20&lt;1,所以该消除可以随后包含在解码器侧以10+x/20&gt;1对信号放大。实际的消除可以是完全的或部分的,取决于目标DRC水平以及输入DRC水平(或解码器输入DRC水平),即在没有任何动态范围压缩或动态范围增大情况下重构之后n通道音频信号将具有的DRC水平。输入DRC水平可以是减少了对应于预处理DRC参数DRC2的量的原始动态范围。目标DRC水平可以是减少了对应于参数f和后处理DRC参数DRC1的乘积,即f×DRC1(对数形式)的量的原始动态范围。在之前提到的简单实现中,条件f×DRC1&本文档来自技高网...
用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统

【技术保护点】
一种用于输入音频信号的动态范围控制(DRC)的控制方法,所述方法包括:通过解码系统接收具有输入音频信号和编码器生成的DRC元数据的比特流,所述编码器生成的DRC元数据包含多个DRC增益集合,所述多个DRC增益集合包括适于被应用于输入音频信号以防止削波或限制的第一DRC增益集合,和基于用户输入或回放设备的特性的自动检测或被应用于输入音频信号的目标DRC水平的第二DRC增益集合;以及选择性地将一个或多个DRC集合作为总增益的至少一部分应用于输入音频信号。

【技术特征摘要】
2012.05.18 US 61/649,036;2012.07.25 US 61/664,507;1.一种用于输入音频信号的动态范围控制(DRC)的控制方法,所述方法包括:通过解码系统接收具有输入音频信号和编码器生成的DRC元数据的比特流,所述编码器生成的DRC元数据包含多个DRC增益集合,所述多个DRC增益集合包括适于被应用于输入音频信号以防止削波或限制的第一DRC增益集合,和基于用户输入或回放设备的特性的自动检测或被应用于输入音频信号的目标DRC水平的第二DRC增益集合;以及选择性地将一个或多个DRC集合作为总增益的至少一部分应用于输入音频信号。2.根据权利要求1所述的方法,其中,所述总增益是至少部分地基于修改参数被确定的。3.根据权利要求1所述的方法,其中,输入音频信号包括多个时间帧,每个时间帧包括多个时间块;并且其中,所述第一DRC增益集合和所述第二DRC增益集合之一或两者包括被应用于输入音频信号中的特定时间块的特定增益值。4.根据权利要求1所述的方法,其中,输入音频信号包括多个时间帧,每个时间帧包括多个时间块;并且其中,所述第一DRC增益集合和所述第二DRC增益集合之一或两者包括要被应用于输入音频信号中的特定时间帧中的所有时间块的特定增益值。5.根据权利要求1所述的方法,其中,所述第一DRC增益集合代表预处理D...

【专利技术属性】
技术研发人员:J·瑞德米勒K·J·罗尔登K·克约尔林H·普恩哈根V·麦尔考特L·塞勒斯德姆
申请(专利权)人:杜比实验室特许公司杜比国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1