解码比特流以从该比特流产生音频输出信号的解码器设备制造技术

技术编号:23447850 阅读:55 留言:0更新日期:2020-02-28 21:31
提供一种用于解码比特流以从比特流产生音频输出信号的解码器设备,该比特流包含音频数据且选择地包含含有参考响度值的响度元数据,解码器设备包含:音频解码器设备,从音频数据重构音频信号;以及信号处理器,基于音频信号产生音频输出信号;其中信号处理器包含为调整该音频输出信号的水平的增益控制设备;其中增益控制设备包含产生响度值的参考响度解码器,其中在参考响度值存在于该比特流中的情况下,响度值是参考响度值;其中增益控制设备包含基于该响度值且基于音量控制值计算增益值的增益计算器,音量控制值是由允许使用者控制该音量控制值的外部使用者接口提供;其中增益控制设备包含基于增益值控制音频输出信号的响度的响度处理器。

A decoder device that decodes a bitstream to produce an audio output signal from the bitstream

【技术实现步骤摘要】
解码比特流以从该比特流产生音频输出信号的解码器设备本申请为国际申请日为2014年1月27日、国际申请号为PCT/EP2014/051484、专利技术名称为“用于新媒体设备上的具有及不具有嵌入式响度元数据的媒体的标准化音频播放的方法及装置”的中国国家阶段申请的分案申请,该中国国家阶段申请的进入国家阶段日为2015年9月24日、申请号为201480018076.5、专利技术名称为“用于新媒体设备上的具有及不具有嵌入式响度元数据的媒体的标准化音频播放的方法及装置”。
本专利技术涉及对在电子重现设备上以数字形式播放的音频、视频及多媒体内容的响度的控制,具体而言但非排他性地,涉及常发生在新媒体设备上的对播放响度的控制,其中内容是制作成具有及不具有嵌入式响度元数据。
技术介绍
在产生及传输音乐、视频及其它多媒体内容时,在不同歌曲间或在不同节目间执行响度标准化过程来确保消费者听到具有适当响度的音频信号。自早期的录音及电影以来,此操作在产生过程期间进行或经由用于剧场的重现标准来进行。当今在音乐及无线电广播业内的惯常做法是将响度调整为接近媒体的最大峰值水平的值,而在电影及电视业内的做法是使用比最大峰值水平低20dB至31dB的若干标准响度水平中的之一。在媒体汇流(mediaconvergence)之前的时代,消费者并未注意到上述情形,因为使用分开的设备或音量设定来播放每种类型的内容。随着用于播放音乐及电影内容两者的移动设备(诸如移动电话或可携式媒体播放器)的出现,若将未经修改的内容传输至设备,则生产实践中的此差异导致可能高达30dB的响度差异。当从一种类型的内容切换至另一种类型时,上述情形可能导致电影的音量太小或音乐的音量太大。相关趋势为,在录音的母带后期处理(mastering)期间经由使用强烈的动态范围压缩、限制及限幅(clipping)来增大许多类型的录制音乐的响度。此种母带后期处理是在仅考虑诸如光盘片的无损耗记录媒体的情况下进行,但是当今所售的大多数音乐是诸如MPEGAAC及MP3的有损耗的数据压缩格式。数据压缩过程可能引入在播放期间在解码器中重构的时域波形的变化,这种变化引起波形中超过信号的全尺度限值或最大峰值的过冲(overshoot)。在通常用于移动设备中的定点解码器(或饱和浮点解码器)中,上述情形可导致将过冲限幅至全尺度限值,从而引起重现信号中的额外可听见的限幅。在一些情况下,对音乐的强烈压缩及限幅是出于艺术目的进行,但更常见的是为了以下目的进行:通过使录音比其它录音“听起来更响”来增加录音的商业吸引力,或为了在所有倾听环境中(诸如在机场或嘈杂场所以及安静环境中)提供可被理解的内容。在电影及视频行业内,在一些类型中使用广泛音频动态范围来获得巨大效果及创造更具吸引力的体验。当经由杜比数位或MPEG-4AAC编码传送给消费者时,通常包括音频动态范围控制元数据,以便允许在存在嘈杂环境的情况下或在大声场景过于烦扰的情况下在接收器或播放器处选择地减小动态范围。由杜比数位来编码的DVD或BluRay内容中所包括的传统元数据或在由杜比数位(在先进电视系统委员会公司的音频压缩标准A/52中标准化)或MPEG-4AAC(在ISO/IEC14496-3及ETSITS101154中标准化)来编码的TV信号中所传输的传统元数据包括以下分量:1.单个静态元数据值,其指示节目的总体长期整合响度,在MPEG标准中称为节目参考水平。2.降混增益的静态元数据值,其用来控制多声道内容的降混以便经由立体声或单声道设备输出。3.动态范围控制增益或缩放因子之两个集合,其是在音频信号中针对用于多个频带或频区的每一经数据压缩的比特流帧加以发送。在行业术语中,一个集合是用于“轻度”压缩,且另一个集合用于“重度”压缩。所述轻度及重度DRC值的使用通常与在针对操作模式“线路模式”及“RF模式”所建立的解码器响度目标水平上的操作有关。针对此等模式的命名惯例及操作点是在数字媒体的初期建立的,在数字媒体的初期可能必需将数字音频转换为模拟信号,所述这些模拟信号发送基频缆线至后续设备上的线路输入端或经由RF载波传输至模拟电视机装置。这个元数据的使用允许在播放期间以非破坏性方式使重现适应于倾听环境。可用不同的元数据集合或完全不使用元数据来播放相同的流或文件,以便产生不同的动态范围。不同于使用仅存在于播放设备中的压缩器,使用元数据的动态范围控制允许创造性艺术家必要时在产生过程期间监视及控制压缩的性质。不幸的是,常常在诸如MPEGAAC或杜比数字家族的有损耗多媒体数字信号编解码器中实现的动态范围控制元数据不能对足够强的信号进行压缩以便与当代音乐的响度匹配,因为该元数据以音频压缩帧为基础影响信号的平均功率(可能在若干频带中),其中常见的帧周期为20ms至40ms。此逐帧增益控制不够快,以致于不能将信号的峰值与平均值之比减小至经高度处理的当代音乐的峰值与平均值之比。如[5]中所描述的,由Wolters等人用来解决此问题的方法是在播放设备中使用接在解码器后面的音频限制器来增加平均响度。此将解决响度匹配问题,以使得音乐及电影内容具有相等响度,但有若干缺点。当消费者在安静环境中(可能在安静房间内使用连接至扬声器的移动设备,或使用具有强隔音效果的头戴式耳机或入耳式耳机)播放内容时,电影内容被压缩的强烈程度将与音乐相同,这是不符合要求的。限制器亦在设备CPU或DSP上引入额外工作负载,从而缩短电池寿命。由Camerer等人在[6]中描述一种不同的方法,其提议将诸如ITU标准BS.1770-2中所描述的响度量测结果编码作为音乐文件中的元数据,并且将每一文件的播放标准化为设备的音量控制所设定的目标水平集合。此方法依靠先前的音乐响度标准化系统,诸如SoundCheck(www.apple.com)及ReplayGain(www.replaygain.org),这些所述系统是诸如iPod的一些音乐播放器的可选择的特征。在这些他们的方法中,提倡要求响度标准化预设为开启;然而,并未规定当使用者关闭响度标准化时出现什么情况,或更重要的是,当播放未用响度元数据来编码的内容时出现什么情况。假设所有内容在播放前将由播放设备或由安全的可信赖的散布者(诸如iTunes)进行分析。另外,关于调整内容的总体动态范围来使其适应于倾听环境并未作出规定。因此,本专利技术之一的目标是提供统一的方法来解决使以下两种内容的播放响度标准化的问题:电影/视频式内容,其可能具有广泛的动态范围及可能的嵌入式响度元数据;以及音乐或无线电/播客内容,其可能具有极窄的动态范围及强烈的压缩、限制及限幅,可能含有但很可能不含嵌入式响度元数据,由于消费者已经拥有或交换了大量先前音乐内容。本专利技术的另一目标是允许按消费者之倾听环境或品味来调整含有动态范围控制元数据的内容的动态范围。本专利技术的另一目标是预防有损耗的数据压缩音频解码器(诸如AAC、MP3或杜比数位解码器)中由信号分量变化引起的可能的限幅,这些变化是由数据压缩过程引入。本专利技术的另一目标是对音乐录制业提供轻微的激励本文档来自技高网...

【技术保护点】
1.一种用于解码比特流(1)以从该比特流产生音频输出信号(42)的解码器设备,该比特流(1)包含音频数据(2)且选择地包含含有参考响度值(4)的响度元数据(3),该解码器设备(41)包含:/n音频解码器设备(9),被配置为从该音频数据(2)重构音频信号(8);以及/n信号处理器(27),被配置为基于该音频信号(8)产生该音频输出信号(42),/n其中,该信号处理器(27)包含增益控制设备(10,15,28),该增益控制设备被配置为调整该音频输出信号(42)的响度水平,/n其中,该增益控制设备(10,15,28)包含参考响度解码器(10),该参考响度解码器被配置为产生响度值(37),其中,在该参考响度值(4)存在于该比特流(1)中的情况下,该响度值(37)是该参考响度值(4),/n其中,该增益控制设备(10,15,28)包含增益计算器(28),该增益计算器被配置为基于该响度值(37)且基于音量控制值(20)计算增益值(33),该音量控制值由允许使用者控制该音量控制值(20)的使用者接口提供,/n其中,该增益控制设备(10,15,28)包含响度处理器(15),该响度处理器被配置为基于该增益值(33)控制该音频输出信号(42)的该响度水平。/n...

【技术特征摘要】
20130128 US 61/757,6061.一种用于解码比特流(1)以从该比特流产生音频输出信号(42)的解码器设备,该比特流(1)包含音频数据(2)且选择地包含含有参考响度值(4)的响度元数据(3),该解码器设备(41)包含:
音频解码器设备(9),被配置为从该音频数据(2)重构音频信号(8);以及
信号处理器(27),被配置为基于该音频信号(8)产生该音频输出信号(42),
其中,该信号处理器(27)包含增益控制设备(10,15,28),该增益控制设备被配置为调整该音频输出信号(42)的响度水平,
其中,该增益控制设备(10,15,28)包含参考响度解码器(10),该参考响度解码器被配置为产生响度值(37),其中,在该参考响度值(4)存在于该比特流(1)中的情况下,该响度值(37)是该参考响度值(4),
其中,该增益控制设备(10,15,28)包含增益计算器(28),该增益计算器被配置为基于该响度值(37)且基于音量控制值(20)计算增益值(33),该音量控制值由允许使用者控制该音量控制值(20)的使用者接口提供,
其中,该增益控制设备(10,15,28)包含响度处理器(15),该响度处理器被配置为基于该增益值(33)控制该音频输出信号(42)的该响度水平。


2.根据前述权利要求所述的解码器设备,其中,在该参考响度值(4)不存在于该比特流(1)中的情况下,该响度值(33)为预设响度值。


3.根据前述权利要求所述的解码器设备,其中,该预设响度值被设定为介于-4dB与-10dB之间的值,特定而言,介于-6dB与-8dB之间,该值被称为全尺度振幅。


4.根据前述权利要求中的一项所述的解码器设备,其中,该信号处理器(27)包含动态范围控制设备(12,13,14),该动态范围控制设备被配置为调整该音频输出信号(42)的动态范围,
其中,该动态范围控制设备(12,13,14)包含动态范围控制开关(12),该动态范围控制开关被配置为从该响度元数据(3)导出至少一个动态范围控制值(6,7)且二者择一地输出所导出的动态范围控制值(6,7)中的一个或预设动态范围控制值(43...

【专利技术属性】
技术研发人员:罗伯特·布莱特
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1