当前位置: 首页 > 专利查询>诺基亚公司专利>正文

音频量化制造技术

技术编号:4462381 阅读:757 留言:0更新日期:2012-04-11 18:40
为了在音频信号编码的范围内支持预测或非预测量化的选择,确定音频信号片段的非预测量化产生的误差是否在预定的阈值之下。至少在确定音频信号片段的非预测量化产生的误差在预定阈值之下的情况下,提供用非预测量化进行量化的音频信号片段作为已编码音频信号的一部分。否则,提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般涉及音频编码领域,特别涉及音频量化领域。
技术介绍
音频编码器和解码器(编解码器)用于通信、多媒体和存储系统中的多种应用。音频编码器用于对例如语音等音频信号进行编码,特别是用于使得音频信号的高效传输或存储成为可能,而音频解码器基于所接收到的编码信号构建合成信号。 在实施编解码器时,因此,在保持合成信号的高质量的同时节省传输与存储容量成为目标。另外,关于传输误差的鲁棒性也是重要的,特别是基于互联网协议的语音(VoIP)与移动应用。另一方面,编解码器的复杂性受到应用平台的处理功率的限制。 在典型的语音编码器中,输入语音信号以片段(segment)——其被称为帧——为单位受到处理。通常,帧的长度为10-30ms。另外,后续帧的5-15ms的超前(lookahead)片段可能是可用的。帧可被进一步分为多个子帧。对于每个帧,编码器确定输入信号的参数表达。参数被量化并通过通信信道传输,或以数字形式存储在存储介质中。在接收端,解码器基于所接收的参数构建合成信号。 参数的构建和量化通常基于码本(codebook),码本包含对于量化工作最优的代码矢量。在许多情况下,较高的压缩比需要高度最优化的码本。通过使用来自之前帧的预测,常常能对给定的压缩比改进量化器的性能。这样的量化在下文中将被称为预测量化,与此形成对比的是非预测量化,其不依赖于任何来自前面的帧的信息。预测量化利用当前音频帧与至少一个相邻音频帧之间的相关性以便获得对于当前帧的预测,使得例如仅需对这种预测的偏差进行编码,其也需要专用的码本。 然而,在传输或存储中存在错误的情况下,预测量化可能产生问题。对于预测量化,如果预测所基于的至少一个先前帧错误,则即使在正确接收时,也不能完美地对新的帧进行解码。因此,可以偶尔使用非预测量化,以便防止长时间的错误传播。对于这样的偶发非预测量化——其也被称为“安全网(safety-net)”量化,可使用码本选择器以便在预测和非预测码本之间进行选择。
技术实现思路
在存储或传输存在以及不存在误差的情况下,尽管安全网量化在整体性能方面是对纯预测量化的改进,但是仍然存在由于量化的预测特性导致的重要问题。通常,对于差不多70-80%的帧使用预测。因此在帧擦除(frameerasure)的情况下,常常丢失多至五个帧,因为在行中仍有许多连续的预测帧。 可以相对于预测量化的使用增加非预测量化的使用。例如,这可通过基于计数器的非预测量化的强制选择来实现,这仅允许例如三个连续帧被基于预测进行量化。另一种选择可以是使用较少的预测,例如通过使用预测器矩阵中较小的系数。又一种选择可为是对于量化选择器使用优选增益。也就是说,在预测量化被选择之前,可要求其在量化误差方面比非预测量化好1.3倍,因此减少预测量化的使用。所有这些选择都适合增大在存储或传输误差方面的鲁棒性,但在清洁信道的情况下降低了量化性能。 描述了一种方法,其包括确定音频信号片段的非预测量化导致的误差是否在预定阈值之下。该方法进一步包括,至少在确定音频信号片段的非预测量化导致的误差在预定阈值之下的情况下,提供用非预测量化进行量化的音频信号片段作为已编码音频信号的一部分。该方法进一步包括,否则,提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分。 另外,描述了一种设备,其包括处理部件,该部件被配置为确定音频信号片段的非预测量化导致的误差是否在预定阈值之下。该设备进一步包括处理部件,该部件被配置为至少在确定音频信号片段的非预测量化导致的误差在预定阈值之下的情况下,提供用非预测量化进行量化的音频信号片段作为已编码音频信号的一部分。该设备进一步包括处理部件,该部件被配置为否则提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分。 所描述的设备的处理部件可以为不同的部件或是单个部件。处理部件可进一步在硬件和/或软件中实现。例如,它们可由执行用于实现所需功能的计算机程序代码的处理器来实现。或者,例如它们可由被设计为实现所需功能的硬件电路来实现,例如在芯片组或芯片中实现,如集成电路。所描述的设备例如可以与所包含的处理部件相同,或者,其还可包含另外的部件。 此外,描述了一种电子设备,该设备包括所描述的设备和音频输入部件。这样的电子设备可以是需要对音频数据进行编码的任何设备,例如移动电话、记录设备、个人计算机或膝上型电脑等等。 此外,描述了一种系统,其包括所描述的设备,另外还包括进一步的设备,所述进一步的设备包括处理部件,该部件被配置为对由所描述的设备提供的已编码音频信号进行解码。 最后,提出了一种计算机程序产品,其中,在计算机可读介质中存储程序代码。程序代码在由处理器执行时实现所提出的方法。 计算机程序产品可以是例如单独的存储设备,或要被集成在电子设备中的存储器。 本专利技术被理解为覆盖还独立于计算机程序产品以及计算机可读介质的计算机程序代码。 本专利技术由这样的考虑出发低于特定阈值,已编码音频信号片段中的量化误差可以忽略。因此提出每当被考虑的误差不超过预定阈值时,允许选择非预测量化。在其余时间中,可选择预测量化,或者,可对预测与非预测量化之间的选择评估进一步的准则。 本专利技术因此提供了在信道误差的情况下提高编码性能的可能。在目标平均量化误差增大时,阈值可被设为低到足以使误差难以听见或根本听不见。 在本专利技术一实施例中,预定阈值因此是这样的阈值低于该阈值,误差被认为是听不见的。 例如,可以假设,如果由于量化引起的谱失真低于1db,则失真不能被听见。因此,如果非预测量化产生0.9dB的谱失真,则从人类听觉的观点来看已经足够了,不必用预测量化对特定音频信号片段进行量化以获得例如0.5dB的极低的谱失真。尽管对于个体音频信号片段来说绝对误差较大,但是量化误差在这种情况下不能被听见。如果在此音频信号片段之前存在音频信号分段擦除,则预测量化可能较差地进行,但非预测量化产生的参数可被完美解码。因此,改进仅仅对于具有误差的音频信号片段变得能听见,而对于清洁的信道,不存在能听见的劣化。 由上述可见,可与预定阈值进行比较的合适的误差因此可以和在原始音频信号片段与非预测量化产生的音频信号片段之间的频率范围上的谱失真有关。例如,对于属于音频信号片段的线谱频率(LSF)参数或导抗谱频率(ISF)参数,在该频率范围上的谱失真方面的计算误差也是合适的。 相应的音频信号片段的谱失真SD可用下面的公式表示 其中, 与S(ω)分别为具有和不具有量化的情况下语音帧的频谱。而该频谱失真例如可是线性预测编码(LPC)参数的量化选择和码本的特别精确的测量,可通过使用较为简单的方法来减少确定这种谱失真的计算量。 例如,通过合并原始音频信号片段的相应分量和非预测量化产生的音频信号片段的对应分量之间的加权误差,也可获得所考虑的误差。例如,误差可通过合并加权均方误差来获得,且误差的加权可以是例如心理听觉意义的加权。表述“心理听觉意义加权矢量”意味着,加权矢量着重于与不会被人耳明显辨认的音频信号相比可由人耳辨认的音频信号中的谱分量。加权矢量可用几种方式计算。 这样的心理听觉意义误差例如可以是ISF或LSF矢量值之间的加权均方误差。 通常,可以理解所考虑的误差可基于整个已量化音频信号片段或基于部本文档来自技高网
...

【技术保护点】
一种方法,包括: 确定音频信号片段的非预测量化导致的误差是否在预定阈值之下; 至少在确定所述音频信号片段的所述非预测量化导致的所述误差在预定阈值之下的情况下,提供用所述非预测量化进行量化的音频信号片段作为已编码音频信号的一部分;  否则,提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:A拉莫L拉克索宁A瓦西拉凯
申请(专利权)人:诺基亚公司
类型:发明
国别省市:FI[芬兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1