当前位置: 首页 > 专利查询>苹果公司专利>正文

用于响度和动态范围控制的元数据制造技术

技术编号:12383591 阅读:91 留言:0更新日期:2015-11-25 14:51
向音频信号应用音频归一化增益值以产生归一化信号。处理该归一化信号以根据若干个预定义的DRC特性中的所选择的一个预定义的DRC特性来计算动态范围控制(DRC)增益值。对音频信号进行编码,并且提供DRC增益值作为与经编码的音频信号相关联的元数据。还描述了若干个其它实施例并要求对其进行保护。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】用于响度和动态范围控制的元数据 本非临时专利申请要求于2013年3月29日提交的美国临时专利申请61/806, 570 的较早提交日期的权益。 本专利技术的实施例总体上涉及音频信号的编码和解码以及使用与经编码的信号相 关联的元数据来改善消费电子最终用户设备中的经解码的信号的回放质量。还描述了其他 实施例。
技术介绍
数字音频内容出现在很多不同情况中,例如包括音乐和电影文件。在大部分情况 下,对音频信号进行编码以用于降低数据速率的目的,使得媒体文件或流的传输或递送消 耗更小的带宽并且更快,由此允许同时进行许多其他传输。可在不同类型的最终用户设备 中接收媒体文件或流,其中在通过内置或可拆卸扬声器向消费者进行呈现之前,对经编码 的音频信号进行解码。这样有助于满足消费者通过因特网获得数字媒体的需求。数字音频 节目的创建者和分销者有几种行业标准可用,可将其用于对音频内容进行编码和解码。这 包括由高级电视系统协会于2005年6月14日发布的数字音频压缩标准(AC-3, E-AC-3), 版本B,文档A/52B ( "ATSC标准")、欧洲电信标准协会基于IS0/IEC 13818-7中的MPEG-2 传输流的ETSI TS 101 154数字视频广播(DVB)、由国际标准化组织(ISO)发布的高级音频 编码(AAC) ( "MPEG-2AAC 标准")以及 IS0/IEC 14496-3( "MPEG-4 音频")。 越来越多的最终用户设备用于回放数字音频,包括台式计算机、膝上型计算机、便 携式手持设备(例如,智能电话)、家用电视和车载媒体系统。这些设备具有不同的模拟信 号路径、扬声器和声学环境。而且,音频信号的动态范围在不同节目之间有变化。此外,数 字音频节目的生产者(包括创建者,有时甚至包括分销者)常常希望通过以数字方式修改 音频信号来提高其节目的平均响度,使其平均响度高若干个dB。然而,这样做还需要降低所 得音频信号的峰值水平,以便避免剪辑(这会导致不期望的听觉失真)。这是使用动态范围 控制(DRC)来实现的,其压缩音频信号的高低水平,使得所得音频信号能够匹配在更窄的 包络(由此避免剪辑)内。不过,所有这些因素都带来一个问题:由最终用户感知到的响度 可能会在不同最终用户设备之间以及在同一设备上的连续节目之间都有显著变化,从而导 致回放期间的不愉快的用户体验。 软件工具诸如Apple Inc.的SoundCheck?程序自动调节歌曲的回放音量以希望 获得相同的感知响度,因此例如与1970年代的老歌相比,动态范围更小但平均响度更大的 近期流行唱片会被调低。而且,音频节目可包括与经编码的音频信号相关联并且描述相关 联的音频信号的元数据部分。元数据可包括由最终用户设备中的软件用于控制例如对话水 平、DRC和经解码的音频信号的任何下混频的信息,以便改变消费者在回放期间的体验。
技术实现思路
希望有一种系统性但仍然灵活的方式来使用任何常规编码/解码(编解码)和相 关联的元数据构造来控制向消费者递送的音频质量。在下文中更详细地描述了本专利技术的至 少如下实施例。 在一个实施例中,一种用于对音频信号编码的方法包括向音频信号应用音频归一 化增益值,以便产生归一化信号。处理归一化信号以针对归一化信号来计算多个动态范围 控制(DRC)增益值。根据若干个预定义的DRC特性中的所选择的一个预定义的DRC特性来 计算DRC增益值。对音频信号进行编码,并且提供增益值作为与经编码的信号相关联的元 数据。然后可在回放处理的解码级中将所提供的DRC增益值应用于经解码的音频信号,以 在回放期间调节经解码的音频信号的动态范围。 在另一个实施例中,几个预定义的DRC特性对于编码器和解码器设备是"已知" 的。将在编码设备中使用的DRC特性索引传送到解码器设备。这使得最终用户设备的解码 器设备能够根据本地参数来修改所提供的DRC增益值(用于压缩经解码的音频信号),该本 地参数例如用户输入(包括回放音量和/或响度归一化开关设置)、用户上下文(或使用最 终用户设备的条件,例如深夜、车中等)和待用于回放经解码的音频信号的数模转换器和 扬声器的动态范围。 在另一个实施例中,可在编码设备中计算关于例如多声道音频信号的DRC压缩版 本或下混频版本的响度信息或响度参数。然后可提供响度信息作为与经编码的多声道音频 信号相关联的元数据。在一个实施例中,在编码设备处,测量输入多声道音频信号的下混频 版本的响度参数,并且其中可能在先前向输入信号应用或未应用DRC的情况下已获得下混 频信号。 各种响度参数可由编码级与例如用于在编码级中产生下混频信号的下混频增益 一起提供,作为与输入信号的经编码的版本相关联的元数据。包含在元数据中的响度信息 可包括以下各项中的一者或多者:节目响度(如整个音频节目的主观响度度量中那样,例 如根据ITU BS. 1770所计算的)、真峰值(诸如根据ITU BS. 1770所测量得)、锚定响度、响 度范围、响度范围上限、最大瞬时响度和短期响度。这种元数据还可包括已选择以为输入音 频信号生成DRC增益值的DRC特性的索引,该DRC增益值也可包括在元数据中。 在解码设备中,DRC处理器能够基于1)在元数据中获得的DRC特性的索引,2)在 元数据中获得的DRC增益值,和3)本地参数例如包括用户输入诸如音量设置和响度归一化 开/关设置来为DRC调节或生成不同的增益值。于是,在回放处理期间可实时实现动态范 围控制,而无需解码设备计算经解码的音频信号的每帧响度值(或DRC输入水平)。在一个 实施例中,在对音频文件或流进行解码时,与音频文件或流相关联的元数据由运行于解码 器设备中的媒体播放器读取,并用于(在数模转换之前)自动(即,无需用户输入并且对于 用户而言是透明的)调节经解码的数字音频内容的响度。取决于用户输入和用户所选择的 回放模式的动态范围(例如,线外扬声器相对于内置扬声器),可这样做来改善用户回放音 频文件或流中的内容的体验。 在另一个实施例中,根据由用户设置的回放音量和/或由编码设备测量并经由元 数据提供的真峰值和/或基于目标净空(数字音频信号的峰值水平及其剪辑水平之间的差 异)来控制解码设备中所应用的DRC压缩量,目标净空值可在解码设备中基于用户回放音 量设置和可从用于回放的数模转换和扬声器设备获得的动态范围来计算。 在又一个实施例中,可在解码级中限定目标DRC特性,并且可通过i)找出使用哪 个编码级DRC特性,以及ii)比较两个DRC特性以确定如何修改所接收的DRC增益值来实 现这个目标。于是,在解码器处基于从元数据所提取的DRC特性索引(指向由编码器使用 的DRC特性)、在编码级处设置的所提取的DRC增益值,并基于表示采用不同目标DRC特性 索引的特定本地条件来实时修改动态范围调节。 在另一个实施例中,产生关于DRC压缩音频内容信号的响度信息和/或混频音频 内容信号,并作为元数据嵌入经编码的多声道数字音频文件或流中。然后,在解码(在解码 级中)之后使用这一特定元数据,以通过定制经解码的多声道音频内容的下混频来改善用 户体验。 在又一个实施例中,改变解码级中(在驱动扬声器之前向经解码的音频内容信 号)应用的DRC压缩量,以便避免本文档来自技高网
...

【技术保护点】
一种用于对音频信号进行编码的方法,包括:向音频信号应用音频归一化增益值以产生归一化信号;然后处理所述归一化信号以针对所述归一化信号计算多个动态范围控制(DRC)增益值,其中根据多个预定义的DRC特性中的所选择的一个预定义的DRC特性来计算所述DRC增益值;对所述音频信号进行编码;以及提供所述DRC增益值作为与经编码的音频信号相关联的元数据。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:F·鲍姆加特E·A·阿拉曼彻S·K·O·斯特罗默尔
申请(专利权)人:苹果公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1