使用高级频谱延拓降低量化噪声的压扩装置和方法制造方法及图纸

技术编号:18427997 阅读:22 留言:0更新日期:2018-07-12 02:22
本发明专利技术涉及使用高级频谱延拓降低量化噪声的压扩装置和方法。压缩过程通过如下压缩过程来减小初始音频信号的原始动态范围:使用定义的窗形状将初始音频信号分成多个片段,使用初始音频信号的频域样本的基于非能量的平均在频域中计算宽带增益,以及施加个体增益值以放大相对低强度的片段和衰减相对高强度的片段。被压缩的音频信号然后通过施加逆增益值以放大相对高强度的片段和衰减相对低强度的片段,而被扩展回基本上原始动态范围。使用QMF滤波器组来分析初始音频信号以获得频域表示。

【技术实现步骤摘要】
使用高级频谱延拓降低量化噪声的压扩装置和方法本申请是申请号为201480008819.0、申请日为2014年4月1日、专利技术名称为“使用高级频谱延拓降低量化噪声的压扩装置和方法”的专利技术专利申请的分案申请。相关申请的交叉引用本申请要求在2013年4月5日提交的美国临时专利申请No.61/809028以及在2013年9月12日提交的No.61/877167的优先权,其全文内容通过引用并入于此。
一个或更多个实施例一般涉及音频信号处理,更具体地说,涉及使用压缩/扩展(压扩(companding))技术降低音频编解码器中的编码噪声。
技术介绍
许多流行的数字声音格式利用丢弃数据中的一些来降低存储或数据速率要求的有损数据压缩技术。有损数据压缩的应用不仅降低源内容(例如,音频内容)的保真度,而且它也可能引入压缩伪影(artifact)形式的可察觉失真。在音频编码系统的背景下,这些声音伪影被称为编码噪声或量化噪声。数字音频系统根据定义的音频文件格式或流媒体音频格式,利用编解码器(编码器-解码器组件)来压缩和解压缩音频数据。编解码器实现试图以最小的比特数表示音频信号同时保持尽可能高的保真度的算法。在音频编解码器中典型地使用的有损压缩技术在人类听觉感知的心理声学模型上工作。音频格式通常涉及时/频域变换(例如,修正离散余弦变换-MDCT)的使用,并且使用诸如频率掩蔽或时间掩蔽之类的掩蔽效应,使得包括任何明显的量化噪声的某些声音被实际内容隐藏或掩蔽。大多数音频编码系统是基于帧的。在帧内,音频编解码器通常在频域中对编码噪声进行整形,使得它变得最难听得见。几种目前的数字音频格式利用这种长持续时间的帧,使得帧可以包含几个不同级别或强度的声音。因为编码噪声随着帧的演变在级别上通常是平稳的,所以编码噪声在帧的低强度部分期间可能是最能听得见。这种效应可以表现为预回声(pre-echo)失真,在该预回声失真中,高强度片段之前的静寂(或低级别信号)被解码的音频信号中的噪声淹没。这种效应可能在来自诸如响板或其他尖锐的打击声源之类的打击乐器的瞬态声音或脉冲中最显著。这种失真典型地由在频域中引入、在时域中遍布于编解码器的整个变换窗的量化噪声引起。目前用于避免或最小化预回声伪影的措施包括使用滤波器。但是,这种滤波器引入相位失真和时间拖尾(temporalsmearing)。另一种可能的解决方案包括使用较小的变换窗,但是这种方法可能显著地减小频率分辨率。在
技术介绍
部分中讨论的主题不应当仅仅因为在
技术介绍
部分中提到了而被认为是现有技术。类似地,在
技术介绍
部分中提及的或者与
技术介绍
部分的主题相关联的问题不应当被认为在现有技术中已预先认识到。
技术介绍
部分中的主题仅代表不同的方法,其自身也可以是专利技术。
技术实现思路
实施例针对一种通过经由如下过程将音频信号扩展到扩展的动态范围来处理接收到的音频信号的方法,所述过程包括:使用定义的窗形状将接收到的音频信号分成多个时间片段,使用音频信号的频域表示的基于非能量的平均来在频域中计算用于每个时间片段的宽带增益,以及将增益值施加到每个时间片段以获得扩展的音频信号。对施加到每个时间片段的宽带增益的增益值进行选择以具有放大相对高强度的片段和衰减相对低强度的片段的效果。对于该方法,接收到的音频信号包括经由如下压缩过程从原始动态范围压缩的原始音频信号,所述压缩过程包括使用定义的窗形状将原始音频信号分成多个时间片段,使用原始音频信号的频域样本的基于非能量的平均来在频域中计算宽带增益,以及将宽带增益施加到原始音频信号。在该压缩过程中,对施加给每个时间片段的宽带增益的增益值进行选择以具有放大相对低强度的片段和衰减相对高强度的片段的效果。扩展过程被配置为基本上恢复初始音频信号的动态范围,并且扩展过程的宽带增益可以基本上是压缩过程的宽带增益的逆。在实现通过扩展过程处理接收到的音频信号的方法的系统中,可以使用滤波器组(filterbank)组件来分析音频信号以获得其频域表示,并且所定义的用于分段成多个时间片段的窗形状可以与用于滤波器组的原型滤波器(prototypefilter)相同。类似地,在实现通过压缩过程处理接收到的音频信号的方法的系统中,可以使用滤波器组组件来分析原始音频信号以获得其频域表示,并且所定义的用于分段成多个时间片段的窗形状可以与用于滤波器组的原型滤波器相同。任一情况下的滤波器组可以是QMF组或短时傅里叶变换中的一个。在该系统中,在通过产生比特流的音频编码器和对比特流进行解码的解码器修正被压缩的信号之后,获得用于所述扩展过程的接收到的信号。编码器和解码器可以包括基于变换的音频编解码器的至少一部分。该系统还可以包括处理通过比特流接收到的并且确定所述扩展过程的激活状态的控制信息的组件。附图说明在下面的附图中,相同的附图标记用来表示相同的要素。虽然下面的附图描绘了各种示例,但是一种或更多种实现并不局限于附图中所描绘的示例。图1例示了在一个实施例下,用于在基于变换的音频编解码器中压缩和扩展音频信号的系统。图2A例示了在一个实施例下,被分成多个短时间片段的音频信号。图2B例示了在一个实施例下,图2A的在每个短时间片段上施加宽带增益之后的音频信号。图3A是例示了在一个实施例下压缩音频信号的方法的流程图。图3B是例示了在一个实施例下扩展音频信号的方法的流程图。图4是例示了在一个实施例下用于压缩音频信号的系统的框图。图5是例示了在一个实施例下用于扩展音频信号的系统的框图。图6例示了在一个实施例下音频信号到多个短时间片段的分割。具体实施方式描述使用压扩技术实现音频编解码器中的量化噪声的时间噪声整形的系统和方法。这些实施例包括使用在QMF域中实现的压扩算法来实现量化噪声的时间整形。所述过程包括期望的解码器压扩等级的编码器控制,以及超越单音调应用而延伸到立体声和多声道的压扩。在此描述的一个或更多个实施例的方面可以在处理用于穿过网络传输的音频信号的音频系统中实现,所述网络包括执行软件指令的一个或更多个计算机或处理设备。所描述的实施例的任何一个可以单独使用或者在任意组合中彼此一起使用。虽然各种实施例可能受在说明书中一个或更多个地方可能讨论或略为提及的现有技术的各种缺陷的启发,实施例不一定解决这些缺陷的任何一个。换句话说,不同的实施例可以解决在说明书中可能讨论的不同缺陷。一些实施例可以仅部分地解决在说明书中可能讨论的一些缺陷或仅一个缺陷,并且一些实施例可以不解决这些缺陷中的任何一个。图1例示了在一个实施例下,用于在基于编解码器的音频处理系统中降低量化噪声的压扩系统。图1例示了围绕包括编码器(或“核心编码器”)106和解码器(或“核心解码器”)112的音频编解码器建立的音频信号处理系统。编码器106将音频内容编码成用于在网络110上传输的数据流或信号,在那里它被解码器112解码以用于回放或进一步的处理。在一个实施例中,编解码器的编码器106和解码器112实现有损压缩方法以降低数字音频数据的存储和/或数据速率要求,并且这种编解码器可以实现为MP3、Vorbis、杜比数字(AC-3)、AAC或类似的编解码器。编解码器的有损压缩方法产生编码噪声,其中编码噪声通常随着由编解码器定义的帧的演变而具有平稳的级别。这种编码噪声经常在帧的低强度部分期间最能听本文档来自技高网
...

【技术保护点】
1.一种压缩包括多个声道的音频信号的方法,该方法包括:接收音频信号的时频平铺表示,其中音频信号的时频平铺表示包括音频信号到时隙的划分,其中每个时隙被划分为频率子带;以及对音频信号的时频平铺表示进行压缩以减小音频信号的动态范围;其中,对音频信号的时频平铺表示进行压缩包括:基于分组信息将音频信号的声道划分为离散声道子集;以及对于每个离散声道子集:计算针对音频信号的时频平铺表示的时隙的共享增益;以及向离散声道子集的每个声道的每个频率子带施加针对时隙的共享增益。

【技术特征摘要】
2013.04.05 US 61/809,028;2013.09.12 US 61/877,1671.一种压缩包括多个声道的音频信号的方法,该方法包括:接收音频信号的时频平铺表示,其中音频信号的时频平铺表示包括音频信号到时隙的划分,其中每个时隙被划分为频率子带;以及对音频信号的时频平铺表示进行压缩以减小音频信号的动态范围;其中,对音频信号的时频平铺表示进行压缩包括:基于分组信息将音频信号的声道划分为离散声道子集;以及对于每个离散声道子集:计算针对音频信号的时频平铺表示的时隙的共享增益;以及向离散声道子集的每个声道的每个频率子带施加针对时隙的共享增益。2.根据权利要求1所述的方法,其中音频信号的时频平铺表示是QMF域表示。3.根据权利要求2所述的方法,其中QMF域表示的每个时隙中的频率子带的数量为64。4.根据权利要求1所述的方法,其中对于相对低强度的时隙,施加所计算的增益放大音频信号,而对于相对高强度的时隙,施加所计算的增益衰减音频信号。5.根据权利要求1所述的方法,其中计算所述共享增益包括响应于控制信息而降低向音频信号施加的放大或衰减的量。6.根据权利要求1所述的方法,其中对音频信号的时频平铺表示进行压缩是响应于控制信息而启用或禁用的。7.根据权利要求1所述的方法,其中所述分组信息指示音频信号的所有声道在相同的离散声道子集中。8.根据权利要求1所述的方法,其中所述分组信息指示音频信号的每个声道在不同的离散声道子集中。9.一种用于压缩包括多个声道的音频信号的装置,该装置包括:第一接口,该第一接口接收音频信号的时频平铺表示,其中音频信号的时频平铺表示包括音频信号到时隙的划分,其中每个时隙被划...

【专利技术属性】
技术研发人员:P·何德林A·比斯沃斯M·舒格V·迈勒考特
申请(专利权)人:杜比实验室特许公司杜比国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1