当前位置: 首页 > 专利查询>微软公司专利>正文

带多级码本和冗余编码的子带话音编解码器制造技术

技术编号:5241890 阅读:166 留言:0更新日期:2012-04-11 18:40
描述了涉及音频信息编码和解码的技术和工具。例如,用于解码当前帧的冗余编码信息包括仅与在前帧一部分相关联的信号历史信息。作为另一个示例,用于解码编码单元的冗余编码信息包括有关一码本级的各参数,该码本级仅当在前编码单元不可用时用于解码该当前编码单元。作为又一个示例,每个编码音频单元包括一字段,该字段用以指示编码单元是否包括表示一段音频信号的主编码信息,以及编码单元是否包括用于解码主编码信息的冗余编码信息。

【技术实现步骤摘要】

描述的工具和技术涉及音频编解码器,尤其涉及子带编码、码本、和/或冗余编 码。
技术介绍
随着数字无线电话网络的出现,经因特网的流媒体音频、以及因特网电话技术、数 字传输和语音传送已经变得很平常了。工程师利用多种技术在保证质量的同时来有效处理 语音。了解这些技术有助于理解音频信息是如何在计算机中被表示和处理的。I.计算机内的咅频信息的表示计算机将音频信息作为一系列表示音频的数字处理。单个数字能够表示一个音频 样本,它是一特定时刻处的幅值。许多因素会影响音频的质量,包括样本深度和采样速率。样本深度(或精确度)显示了用来表示样本的数字的范围。因为能够表示更为细 微的幅度变化,所以通常每个样本的可能值越多则输出质量就会越高。一个8位样本具有 256个可能值,而16位样本则具有65,536个可能值。采样速率(一般被测量作为每秒钟的采样数)也会影响质量。因为能够表示更 高频率的声音,所以采样速率越高,质量就越高。一些常见的采样速率是8,000、11,025、 22,050,32, 000,44, 100,48, 000以及96,000采样/秒(Hz)。表1示出了带有不同质量等 级的多个音频格式,及其相应的原始比特率成本。样本深度采样速率通道模式原始比特率(比特/样本)(样本/秒)(比特/秒)88,000单声道64,000811,025单声道88,2001644,100立体声1,411,200表1 不同质量的音频的比特率如表1所示,高质量音频的成本对应高比特率。高质量音频信息消耗大量的计算 机存储和传输容量。许多计算机和计算机网络缺少用来处理原始数字音频的资源。压缩 (也成为编码或译码)通过将信息转换为较低比特率的形式来降低存储及传输音频信息的成本。压缩可能是无损耗的(其中质量不受损害)或有损耗的(其中质量受到损害,但是 从随后的无损压缩得到的比特率降低更为显著)。解压缩(也成为解码)从压缩形式中提 取原始信息的重构版本。编解码器是一种编码器/解码器系统。II.语咅编码器和解码器音频压缩的一个目标是数字化表示音频信号,从而为给定的比特数量提供最佳的 信号质量。换句话说,这一目标是在给定的质量等级下用最少的比特来表示音频信号。由 编码/传送/解码引起的诸如传输误差的恢复能力以及对整体延迟的限制的其他目标也可 以应用于一些场景。。不同类型的音频信号具有不同的特征。音乐以大范围的频率和振幅为特征,并且 通常包含两个或多个信道。另一方面,语音以小范围的频率和振幅为特征,并且一般在一个 信道内表示。特定的编解码器以及处理技术适用于音乐和普通音频;其他编解码器及其处 理技术则适用于语音。一类常规语音编解码器使用线性预测来实现压缩。该语音编码包含多级。该编码 器找出并量化用于线性预测滤波器的系数,该滤波器用于预测各样本值作为在前样本值的 线性组合。残留信号(被表示为“激励”信号)表示未被滤波器精确预测的那部分原始信 号。在某些级,语音编解码器使用对浊音段(以嗓音的声带振动为特征)、清音段、以及无声 段使用不同的压缩技术,这是因为不同类型的语音具有不同的特征。浊音段通常呈现出高 度重复的发音模式,即使是在残留域中。对于浊音段,该编码器通过将当前残留信号与在前 的残留周期进行比较并根据相对于在前周期的延迟或滞后信息对当前残留信号进行编码 而实现进一步的压缩。该编码器使用专门设计的码本来处理原始信号与经预测的、被编码 表示之间的其他差异。许多语音编解码器通过一些方法在信号中使用暂时冗余度。如上所述,一种常用 的方法是根据相对于在前激励周期延迟或滞后,使用基音(Pitch)参数的长期预测来预测 当前激励信号。使用暂时冗余度能够在质量和比特率方面大幅提高压缩效率,但会把记忆 依赖性引入编解码器,即解码器依靠该信号的一个在前解码部分才能正确解码该信号的另 一部分。许多有效的语音编解码器都具有明显的记忆依赖。尽管上面所描述的语音编解码器对许多应用而言具有良好的整体性能,但是它们 仍然有若干缺陷。更具体地,当语音编解码器被用来与动态网络资源一起使用时就会遇到 若干缺陷。在此场景中,编码的语音可能会由于暂时的带宽不足或其他问题而丢失。A.窄带和宽带编解码器许多标准语音编解码器被设计用于带有8kHz采样速率的窄带信号。虽然8kHz采 样速率在许多情况下是足够的,在其他情况下也可以使用更高的采样速率,诸如用来表示 更高的频率。带有至少16kHz采样速率的语音信号通常被称为宽带语音。虽然这些宽带编解码 器正适于表示高频率语音模式,但是它们通常需要比窄带编解码器更高的比特率。这样高 的的比特率在一些网络类型中或在一些网络条件下是不可行的。 B.动态网络条件中低效的记忆依赖 当编码语音由诸如丢失、延迟、破坏或由其他方面造成在传输中不可用而有所缺 失,则语音编解码器的性能会由于对丢失信息的记忆依赖而受到损害。有关激励信号的信息丢失妨碍了随后依赖于那些丢失信号的重建。如果丢失了在前周期,则滞后信息因为其 指向了解码器不具有的信息而会变得无用。记忆依赖的另一个例子是滤波器系数插值(用 来平滑在各不同合成滤波器之间的转换,尤其是针对浊音信号)。如果丢失了某一帧的滤波 器系数,则用于随后帧的滤波器系数可能具有不正确的值。解码器使用各种技术来隐蔽由于分组丢失和其他信息丢失所导致的差错,但是这 些隐蔽技术很少能够完全隐蔽这些差错。例如,解码器基于被正确解码的信息重复在前的 参数或估计参数。然而,滞后信息可能非常敏感,并且现有技术无法很有效的进行隐蔽。在大部分情况下,解码器最终会从由于丢失信息所导致的差错中恢复。随着分组 的接收和解码,参数被逐渐调整到它们正确的值。但是质量很可能劣化直到解码器能够恢 复正确的内部状态。在许多最为高效的语音编解码器中,回放质量会在一延长时段(例如, 长至一秒)内劣化,引起高度失真并通常将语音描绘地难以理解。恢复时间在发生例如无 声帧的明显变化时更快,因为这为许多参数提供了一自然重置点。一些编解码器比较不容 易出现分组丢失,因为它们移除了帧间依赖。然而,这种编解码器需要明显更高的比特率来 完成与带有帧间依赖的传统CELP编解码器相同的话音质量在此给出了在计算机系统内用于表示语音信号的压缩和解压缩的重要性,因而语 音的压缩和解压引起了对其的研究和标准化的行为就不足为奇了。无论现有技术和工具有 怎样的优点,但它们都不具有这里描述的技术和工具的优点。
技术实现思路
总的说来,详细描述涉及用于音频编解码器的各种技术和工具,尤其涉及有关子 带编码、音频编解码器码本、和/或冗余编码的工具和技术。描述的实施例执行了一个或多 个所描述的技术和工具,包括但不限于以下各项—个方面,音频信号的比特流包括用于当前帧并参考了一段在前帧用以解码当前 帧的主要编码信息,以及用于解码该当前帧的冗余编码信息。该冗余编码信息包括与在前 帧被参考段相关联的信号历史信息。另一方面,音频信号的比特流包括用于当前编码单元并参考了一段在前编码单元 用以解码当前编码单元的主要编码信息,以及用于解码该当前编码单元的冗余编码信息。 该冗余编码信息包括用于仅当在前编码单元不可用时被用来解码当前编码单元的有关一 个或多个额外码本级的一个或多个参数。另一个方面,比特流包括多个编码音频单元本文档来自技高网
...

【技术保护点】
一种方法,包括:在音频处理工具处,处理有关音频信号的比特流,其中所述比特流包括:用于当前编码单元的主编码信息,所述主编码信息参考要被用于解码当前编码单元的一段在前编码单元;以及用于解码所述当前编码单元的冗余编码信息,所述冗余编码信息包括仅在所述在前编码单元不可用的情况下才在解码所述当前编码单元时使用的用于一个或多个额外码本级的一个或多个参数;以及输出结果。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:T王K科什达HA海莉尔X孙WG陈
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1