使用高级频谱延拓降低量化噪声的压扩装置和方法制造方法及图纸

技术编号:12222520 阅读:93 留言:0更新日期:2015-10-22 00:53
实施例针对用于降低音频编解码器中的编码噪声的压扩方法和系统。压缩过程通过如下压缩过程来减小初始音频信号的原始动态范围:使用定义的窗形状将初始音频信号分成多个片段,使用初始音频信号的频域样本的基于非能量的平均在频域中计算宽带增益,以及施加个体增益值以放大相对低强度的片段和衰减相对高强度的片段。被压缩的音频信号然后通过施加逆增益值以放大相对高强度的片段和衰减相对低强度的片段,而被扩展回基本上原始动态范围。使用QMF滤波器组来分析初始音频信号以获得频域表示。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】 相关申请的交叉引用 本申请要求在2013年4月5日提交的美国临时专利申请No. 61/809028以及在 2013年9月12日提交的No. 61/877167的优先权,其全文内容通过引用并入于此。
-个或更多个实施例一般涉及音频信号处理,更具体地说,涉及使用压缩/扩展 (压扩(companding))技术降低音频编解码器中的编码噪声。
技术介绍
许多流行的数字声音格式利用丢弃数据中的一些来降低存储或数据速率要求的 有损数据压缩技术。有损数据压缩的应用不仅降低源内容(例如,音频内容)的保真度,而 且它也可能引入压缩伪影(artifact)形式的可察觉失真。在音频编码系统的背景下,这些 声音伪影被称为编码噪声或量化噪声。 数字音频系统根据定义的音频文件格式或流媒体音频格式,利用编解码器(编码 器-解码器组件)来压缩和解压缩音频数据。编解码器实现试图以最小的比特数表示音频 信号同时保持尽可能高的保真度的算法。在音频编解码器中典型地使用的有损压缩技术在 人类听觉感知的心理声学模型上工作。音频格式通常涉及时/频域变换(例如,修正离散 余弦变换-MDCT)的使用,并且使用诸如频率掩蔽或时间掩蔽之类的掩蔽效应,使得包括任 何明显的量化噪声的某些声音被实际内容隐藏或掩蔽。 大多数音频编码系统是基于帧的。在帧内,音频编解码器通常在频域中对编码噪 声进行整形,使得它变得最难听得见。几种目前的数字音频格式利用这种长持续时间的帧, 使得帧可以包含几个不同级别或强度的声音。因为编码噪声随着帧的演变在级别上通常是 平稳的,所以编码噪声在帧的低强度部分期间可能是最能听得见。这种效应可以表现为预 回声(pre-echo)失真,在该预回声失真中,高强度片段之前的静寂(或低级别信号)被解 码的音频信号中的噪声淹没。这种效应可能在来自诸如响板或其他尖锐的打击声源之类的 打击乐器的瞬态声音或脉冲中最显著。这种失真典型地由在频域中引入、在时域中遍布于 编解码器的整个变换窗的量化噪声引起。 目前用于避免或最小化预回声伪影的措施包括使用滤波器。但是,这种滤波器引 入相位失真和时间拖尾(temporalsmearing)。另一种可能的解决方案包括使用较小的变 换窗,但是这种方法可能显著地减小频率分辨率。 在
技术介绍
部分中讨论的主题不应当仅仅因为在
技术介绍
部分中提到了而被认 为是现有技术。类似地,在
技术介绍
部分中提及的或者与
技术介绍
部分的主题相关联的问 题不应当被认为在现有技术中已预先认识到。
技术介绍
部分中的主题仅代表不同的方法, 其自身也可以是专利技术。
技术实现思路
实施例针对一种通过经由如下过程将音频信号扩展到扩展的动态范围来处理接 收到的音频信号的方法,所述过程包括:使用定义的窗形状将接收到的音频信号分成多个 时间片段,使用音频信号的频域表示的基于非能量的平均来在频域中计算用于每个时间片 段的宽带增益,以及将增益值施加到每个时间片段以获得扩展的音频信号。对施加到每个 时间片段的宽带增益的增益值进行选择以具有放大相对高强度的片段和衰减相对低强度 的片段的效果。对于该方法,接收到的音频信号包括经由如下压缩过程从原始动态范围压 缩的原始音频信号,所述压缩过程包括使用定义的窗形状将原始音频信号分成多个时间片 段,使用原始音频信号的频域样本的基于非能量的平均来在频域中计算宽带增益,以及将 宽带增益施加到原始音频信号。在该压缩过程中,对施加给每个时间片段的宽带增益的增 益值进行选择以具有放大相对低强度的片段和衰减相对高强度的片段的效果。扩展过程被 配置为基本上恢复初始音频信号的动态范围,并且扩展过程的宽带增益可以基本上是压缩 过程的宽带增益的逆。 在实现通过扩展过程处理接收到的音频信号的方法的系统中,可以使用滤波器组 (filterbank)组件来分析音频信号以获得其频域表示,并且所定义的用于分段成多个时间 片段的窗形状可以与用于滤波器组的原型滤波器(prototypefilter)相同。类似地,在实 现通过压缩过程处理接收到的音频信号的方法的系统中,可以使用滤波器组组件来分析原 始音频信号以获得其频域表示,并且所定义的用于分段成多个时间片段的窗形状可以与用 于滤波器组的原型滤波器相同。任一情况下的滤波器组可以是QMF组或短时傅里叶变换中 的一个。在该系统中,在通过产生比特流的音频编码器和对比特流进行解码的解码器修正 被压缩的信号之后,获得用于所述扩展过程的接收到的信号。编码器和解码器可以包括基 于变换的音频编解码器的至少一部分。该系统还可以包括处理通过比特流接收到的并且确 定所述扩展过程的激活状态的控制信息的组件。【附图说明】 在下面的附图中,相同的附图标记用来表示相同的要素。虽然下面的附图描绘了 各种示例,但是一种或更多种实现并不局限于附图中所描绘的示例。 图1例示了在一个实施例下,用于在基于变换的音频编解码器中压缩和扩展音频 信号的系统。 图2A例示了在一个实施例下,被分成多个短时间片段的音频信号。 图2B例示了在一个实施例下,图2A的在每个短时间片段上施加宽带增益之后的 音频信号。 图3A是例示了在一个实施例下压缩音频信号的方法的流程图。 图3B是例示了在一个实施例下扩展音频信号的方法的流程图。 图4是例示了在一个实施例下用于压缩音频信号的系统的框图。 图5是例示了在一个实施例下用于扩展音频信号的系统的框图。 图6例示了在一个实施例下音频信号到多个短时间片段的分割。【具体实施方式】 描述使用压扩技术实现音频编解码器中的量化噪声的时间噪声整形的系统和方 法。这些实施例包括使用在QMF域中实现的压扩算法来实现量化噪声的时间整形。所述过 程包括期望的解码器压扩等级的编码器控制,以及超越单音调应用而延伸到立体声和多声 道的压扩。 在此描述的一个或更多个实施例的方面可以在处理用于穿过网络传输的音频信 号的音频系统中实现,所述网络包括执行软件指令的一个或更多个计算机或处理设备。所 描述的实施例的任何一个可以单独使用或者在任意组合中彼此一起使用。虽然各种实施例 可能受在说明书中一个或更多个地方可能讨论或略为提及的现有技术的各种缺陷的启发, 实施例不一定解决这些缺陷的任何一个。换句话说,不同的实施例可以解决在说明书中可 能讨论的不同缺陷。一些实施例可以仅部分地解决在说明书中可能讨论的一些缺陷或仅一 个缺陷,并且一些实施例可以不解决这些缺陷中的任何一个。 图1例示了在一个实施例下,用于在基于编解码器的音频处理系统中降低量化噪 声的压扩系统。图1例示了围绕包括编码器(或"核心编码器")106和解码器(或"核心解 码器")112的音频编解码器建立的音频信号处理系统。编码器106将音频内容编码成用于 在网络110上传输的数据流或信号,在那里它被解码器112解码以用于回放或进一步的处 理。在一个实施例中,编解码器的编码器106和解码器112实现有损压缩方法以降低数字 音频数据的存储和/或数据速率要求,并且这种编解码器可以实现为MP3、Vorbis、杜比数 字(AC-3)、AAC或类似的编解码器。编解码器的有损压缩方法产生编码噪声,其中编码噪声 通常随着由编解码器定义的帧的演变而具有平稳的级别。这种编码噪声经常在帧的低强本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/CN104995680.html" title="使用高级频谱延拓降低量化噪声的压扩装置和方法原文来自X技术">使用高级频谱延拓降低量化噪声的压扩装置和方法</a>

【技术保护点】
一种扩展音频信号的方法,包括:接收音频信号;以及通过扩展过程将音频信号扩展到扩展的动态范围,所述扩展过程包括:使用定义的窗形状将接收到的音频信号分成多个时间片段,使用音频信号的频域表示的基于非能量的平均来在频域中计算用于每个时间片段的宽带增益,以及向每个时间片段施加个体增益值以获得扩展的动态范围音频信号,其中个体增益值的施加放大相对高强度的片段并且衰减相对低强度的片段。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:P·何德林A·比斯沃斯M·舒格V·迈勒考特
申请(专利权)人:杜比实验室特许公司杜比国际公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利