语音与音频信号的改进的变换编码制造技术

技术编号:5388257 阅读:154 留言:0更新日期:2012-04-11 18:40
在对电信系统中的音频信号进行感知变换编码的方法中,执行以下步骤:确定表示时间分段的输入音频信号的时间到频率的变换的变换系数;基于所述确定的变换系数来确定所述输入音频信号的感知子带的频谱;基于所述确定的频谱来确定每个所述子带的掩蔽阈值;基于所述确定的掩蔽阈值来计算每个所述子带的标度因子;以及最后,适配每个所述子带的所述计算的标度因子以防止在感知上相关的子带的能量损失。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及诸如信号压縮和音频编码之类的信号处理,更特别地涉及改进的变换语音与音频编码以及相应的设备。
技术介绍
编码器是一种能够分析诸如音频信号之类的信号并以编码的形式输出信号的设 备、电路或计算机程序。所得到的信号通常用于传输、存储和/加密的目的。另一方面,解 码器是一种能够反转编码器操作的设备、电路或计算机程序,因为其接收编码的信号并输 出解码的信号。 在大多数现有技术的编码器(例如音频编码器)中,分析输入信号的每个帧并且 将其从时域变换到频域。这一分析的结果被量化和编码,并且然后根据应用进行传输或存 储。在接收侧(或者当使用所存储的编码信号时),后面是合成过程的相应解码过程使得有 可能在时域中恢复信号。 编解码器(编码器_解码器)通常用于压縮/解压縮信息(例如音频和视频数 据)以便通过带宽受限的通信信道进行高效的传输。 所谓的变换编码器或更一般而言变换编解码器通常基于时域到频域的变换,例如 DCT(离散余弦变换)、改进的离散余弦变换(MDCT)或相对于听觉系统特性允许更好编码效 率的某种其他重叠变换。变换编解码器的共同特性是,它们对重叠采样块(即重叠帧)进 行操作。由每个帧的变换分析或等效子带分析所产生的编码系数通常被量化和存储或者作 为比特流传输到接收侧。解码器一接收到比特流就执行解量化和逆变换以便重构信号帧。 所谓的感知(perc印tual)编码器使用接收目的地(即人类听觉系统)的有损编 码模型,而不是源信号的模型。因此,感知音频编码需要编码音频信号、结合听觉系统的心 理声学知识,以便优化/减少忠实再现原始音频信号所必需的比特数量。另外,感知编码试 图除去即不传输或近似人类接收者不能感知的信号部分,即与源信号的无损编码相对的有 损编码。该模型通常被称为心理声学模型。 一般来说,感知编码器将具有比波形编码器更 低的信噪比(SNR),并且具有比以相等比特率操作的无损编码器更高的感知质量。 感知编码器在不引入听得到的量化噪声的情况下使用剌激的掩蔽模式(masking pattern)来确定编码即量化每个频率子带所必需的最少比特数。 操作在频域中的现有感知编码器通常使用所谓的绝对听觉阈值(ATH)与掩蔽的 音调和类噪声扩散二者的组合,以便计算所谓的掩蔽阈值(MT) [1]。基于这样的瞬时掩蔽阈 值,现有的心理声学模型计算被用来定形原始频谱的标度因子,以使编码噪声被高能量级 分量掩蔽,例如听不到由编码器引入的噪声[2]。 感知建模已被广泛地用于高比特率音频编码中。标准化的编码器(例如MPEG-1层 III[3]、 MPEG-2高级音频编码[4])以128kbps的速率并且对于宽带音频相应地以64kbps 的速率来实现CD质量。不过,这些编解码器根据定义被强制低估掩蔽的量以确保仍然听 不到失真。而且,宽带音频编码器通常使用高复杂性的听觉(心理声学)模型,其在低比特率(低于64kbps)下不是非常可靠的。
技术实现思路
由于前面提到的问题,所以需要在保持低复杂性功能的同时在低比特率下可靠的改进的心理声学模型。 本专利技术克服了现有技术方案的这些和其他缺点。 基本上,在对电信系统中的音频信号进行感知变换编码的方法中,最初确定表示 时间分段的输入音频信号的时间到频率的变换的变换系数,基于所确定的变换系数来确定 输入音频信号的感知子带的频谱。随后,基于所述确定的频谱来确定每个子带的掩蔽阈值, 对于所确定的其各自的掩蔽阈值来计算每个子带的标度因子。最后,适配每个子带的所计 算的标度因子以防止由于用于感知上相关的子带的编码而产生的能量损失,即以便达到高 质量的低比特率编码。 当阅读下面对本专利技术实施例的描述时,将会认识到由本专利技术提供的更多优点。 附图说明 通过参考与附图一起得到的下面的描述,可以最好地理解本专利技术连同其更多的目 的和优点,其中 图1示出适合于全带音频编码的示例性编码器; 图2示出适合于全带音频解码的示例性解码器; 图3示出通用的感知变换编码器; 图4示出通用的感知变换解码器; 图5示出根据本专利技术的心理声学模型中的方法的一个流程图; 图6示出在根据本专利技术的方法的情况下的实施例的另一流程图; 图7示出在根据本专利技术的方法的情况下的实施例的又一流程图。縮写ATH绝对听觉阈值BS巴克谱DCT离散余弦变换DFT离散傅里叶变换ERB等效矩形带宽MDCT改进的离散余弦逆变换MT掩蔽阈值MDCT改进的离散余弦变换SF标度因子具体实施例方式本专利技术主要涉及变换编码,具体涉及子带编码。 为了简化对本专利技术实施例的下面描述的理解,下面将描述一些关键的定义。 电信中的信号处理有时利用压扩来作为利用有限的动态范围改善信号表示的一种方法。该术语是压縮和扩展的结合,由此指示信号的动态范围在传输之前被压縮并且 在接收机处被扩展到原始值。这允许具有大动态范围的信号通过具有较小动态范围能力的 设施来传输。 在下文中,将关于适合于ITU-T G. 722. 1全带编解码器扩展(现在被重新命名为 ITU-T G.719)的特定示例性且非限制性编解码器实现来描述本专利技术。在该特定实例中,编 解码器被呈现为低复杂性基于变换的音频编解码器,其优选地以48kHz的采样率操作,并 且提供范围从20Hz —直到20kHz的全音频带宽。编码器处理20ms帧上的输入16比特线 性PCM信号,并且编解码器具有40ms的总延迟。编码算法优选地是基于具有自适应时间分辨率、自适应比特分配和低复杂性格型矢量量化的变换编码。另外,解码器可以通过信号自 适应噪声填充或者带宽扩展来代替非编码的频谱分量。 图1是适合于全带音频编码的示例性编码器的框图。通过瞬态检测器来处理以 48kHz采样的输入信号。根据对瞬态的检测,对输入信号帧应用高频率分辨率或低频率分辨 率(高时间分辨率)变换。在稳态帧的情况下,自适应变换优选地是基于改进的离散余弦 变换(MDCT)。对于非稳态帧,使用更高时间分辨率变换,而不需要附加延迟并且在复杂性方 面具有非常小的开销。非稳态帧优选地具有等同于5ms帧的时间分辨率(尽管可以选择任 一任意的分辨率)。 将所获得的频谱系数分组成不等长度的频带会是有益的。可以估计每个频带的范 数(norm),并且所得到的包括所有频带的范数的频谱包络被量化和编码。然后通过量化的 范数来归一化(normalize)所述系数。量化的范数被进一步基于自适应频谱加权而调整并 且被用作比特分配的输入。基于为每个频带分配的比特来对归一化的频谱系数进行格型矢 量量化和编码。非编码的频谱系数的大小被估计、编码并且传输到解码器。优选地,对编码 的频谱系数以及编码的范数二者的量化指数应用霍夫曼编码。 图2是适合于全带音频解码的示例性解码器的框图。用于指示帧配置(即稳态或 瞬态)的瞬态标志被首先解码。频谱包络被解码,并且在解码器处使用相同的比特精确的 范数调整和比特分配算法以便重新计算比特分配,这对解码归一化的变换系数的量化指数 来说是必需的。 在解量化之后,优选地通过使用根据所接收的频谱系数(具有非零比特分配的频 谱系数)而建立的频谱填充码本来重新生成低频非编码的频谱系数(分配的零比特)。 噪声级调整指数可以被用来调整重新生成的系数的大小。优选地使用带宽本文档来自技高网
...

【技术保护点】
一种对电信系统中的音频信号进行感知变换编码的方法,其特征在于以下步骤:确定表示时间分段的输入音频信号的时间到频率的变换的变换系数;基于所述确定的变换系数来确定所述输入音频信号的感知子带的频谱;基于所述确定的频谱来确定每个所述子带的掩蔽阈值;基于所述确定的掩蔽阈值来计算每个所述子带的标度因子;适配每个所述子带的所述计算的标度因子以防止由于用于在感知上相关的子带的编码而产生的能量损失。

【技术特征摘要】
【国外来华专利技术】US 2007-8-27 60/968159;US 2008-4-11 61/044248一种对电信系统中的音频信号进行感知变换编码的方法,其特征在于以下步骤确定表示时间分段的输入音频信号的时间到频率的变换的变换系数;基于所述确定的变换系数来确定所述输入音频信号的感知子带的频谱;基于所述确定的频谱来确定每个所述子带的掩蔽阈值;基于所述确定的掩蔽阈值来计算每个所述子带的标度因子;适配每个所述子带的所述计算的标度因子以防止由于用于在感知上相关的子带的编码而产生的能量损失。2. 根据权利要求1所述的方法,其特征在于,所述适配步骤包括对每个所述子带的所 述计算的标度因子执行自适应的压扩、扩展和平滑。3. 根据权利要求2所述的方法,其特征在于,基于预定的量化器范围来执行所述适配步骤以实现编码过程中高效的比特分配,这将允许在几个数据速率下以高音频质量进行全 带音频编码。4. 根据权利要求1所述的方法,其特征在于,所述掩蔽阈值确定步骤还包括归一化所 述确定的掩蔽阈值,并且随后基于所述归一化的掩蔽阈值来计算所述标度因子。5. 根据权利要求2所述的方法,其特征在于归一化所...

【专利技术属性】
技术研发人员:M布赖恩德A塔莱布
申请(专利权)人:爱立信电话股份有限公司
类型:发明
国别省市:SE[瑞典]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1