当前位置: 首页 > 专利查询>诺基亚公司专利>正文

用于进行有效压缩的动态量化器结构制造技术

技术编号:5470642 阅读:148 留言:0更新日期:2012-04-11 18:40
介绍一种提供在运行时间期间可配置的动态量化器结构的方法和系统。量化器配置和数据以二进制格式被存储。该动态量化器数据被表示为比特流,并且该比特流接着被用作语音编码器的初始化(或重新初始化/重新配置)期间的另外的输入。配置报头充分规定针对每个量化参数的动态量化器的结构和配置,并且该动态量化器数据和配置被充分且动态地分配到该语音编码器存储器中。这使得能够容易地重新配置与对于不同情形的各种量化器结构相关联的编码解码器。动态量化器结构的使用继而增强了输入信号的压缩效率。该动态量化器结构也可以被应用于允许有损压缩的其他压缩应用。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术通常涉及数据压缩。更具体地,本专利技术涉及用于使用在 数据压缩应用中的动态且可配置的量化器结构。
技术介绍
本申请要求于2006年11月6日申请的美国临时专利申请号 60/857,013的优先权,其内容在此通过参考被全面合并。本节意在提供在权利要求书中叙述的本专利技术的背景或环境。此 处的描述可以包括可能被追溯的概念,但是这些概念在之前不一定 已经被想到或追溯。因此,除非在此另有明示,否则本节所述对于 本申请的说明书和权利要求书来说不是其现有技术,并且不因包括 在本节中而承认是现有技术。量化(quantization)通常指的是数字信号处理中的处理,其中, 一个连续的数值范围被离散符号或整数值的较小集合相近似。量化 的 一个普通用途是在有损数据压缩中。使用量化的有损压缩系统的 例子是联合图像专家组(JPEG)图像压缩。在JPEG编码期间,表 示图像的数据用离散余弦变换来处理。图像数据被量化并被进行熵 编码。通过使用量化,被变换的图像数据值的精度减少,并且因此 表示该图像所需要的比特数可能减少。例如,能够以可接受的质量 用每像素少于3比特的JPEG来表示图像,其中,在JPEG压缩之前 一般需要每像素24比特来表示一个图像。有损压缩的另 一 个普通的例子是用语音信号的数字传输看出。 传统上,数字传输的语音信号涉及用模数转换器对模拟语音波形进 行抽样、语音压缩(即,编码)、传输、语音解压缩(即,解码)、 数模变换,以及在耳机或扩音器中播放。如JPEG压缩的语音压缩可用来减少用于表示语音信号的比特数。已知为编码解码器的语音压缩系统使用不同算法对原始语音进行编码,同时尝试保持高质量的重建语音。传统上,输入语音信号 或其参数表示被压缩并且使用量化器被量化。量化如上所述指的是这样一种处理,即在特定范围内将诸如包括语音信号的不同语音参 数之类的输入映射到一个公值。换言之,语音编码涉及使用一组参 数来形成语音的替换表示,其中,对对应的(一个或多个)参数矢 量和/或标量值执行量化。不同范围中的输入被映射到不同的公值。 量化分割在表示输入语音信号的实数集合内定义了多个邻接的、不 相重叠的数值范围。使用码本来告诉量化器将哪个公值分配给落入 每个分割范围内的输入,其中,码本的每个公值通常被称为码字。量化器自身可以被认为包括分别用于量化和解量化的编码器和 解码器,其中,编码器接收输入信号并输出其相关联码字的索引。 可以用各种方法来识别将与该输入信号相关联的正确码字。在接收 到一个或多个索引后,解码器就将它们转换成对应的码字,其中, 将码字作为表示原始输入信号的量化值输出。这些语音压缩技术导致降低了用来传输语音信号的带宽数值。 然而,如上所述,量化器及其码本传统上按照它们的结构和大小已 被固定,例如,使用于移动环境中的当前语音编码器使用在建立处 理期间存储在存储器中的固定码本。而且,大多数语音编码器二进制及其量化器被存储在移动设备的ROM存储器中。因此,当前的语音编码器事实上并不灵活,而更新量化器变成了一个困难的任务。
技术实现思路
本专利技术的各个实施方式允许以二进制格式存储量化器配置和数 据,其中,二进制格式的数据继而在语音编码器的初始化(或重新初始化/重新配置)期间被用作另外的输入。二进制数据中包括的配置报头针对每个量化参数充分规定了动态量化器的结构和配置,并且动态量化器数据及各自的配置以动态方式被完全分配到语音编码根据本专利技术的各个实施方式配置的动态量化器结构可以用这样 一种方式变得更加灵活,即动态量化器可以对于不同的类型输入数 据使用不同的处理方法和/或系统。另外,可以根据遇到的语音数据 的类型来使用若干种不同的预测性的和/或无记忆的量化器模式,而 这些不同的预测性的和/或无记忆的量化器模式可以和不同类型的预 测器一起使用。最后,子量化器数据可以是唯一的,或者在不同的 量化器之间被共享,而子量化器自身可以包括具有 一 级或多级的码 本。用本专利技术的各个实施方式,在除了实际的二进制格式的数据之 外,还可以在存储码本数据的应用中将语音编码器的输出质量最大 化,并且量化器的运行时间更新也变得可能。另外,每个参数的量 化器及其各自的子量化器都可以独立更新。可以使用不同的预测性 和/或非预测性模式,并且码本的更新没有被固定到任何建立配置之中。无需对设备的闪速存储器重新编程,就可以启动对于基于ROM 的编码解码器的更新,并且可下载的编码解码器更新也是可能的。 本专利技术的这些及其他优点和特征,连同其操作的组织和方式, 将从结合附图的下列详细说明中变得明显,其中,下述若干附图中 类似的元件具有类似的标记。附图说明图1示出了用于结合本专利技术使用的通用多媒体通信系统;图2是可被用于本专利技术实施中的移动电话的透视图3是图2的移动电话的电话电路的示意表示;图4是根据该本专利技术的一个实施方式的数据结构表示;以及图5说明了根据本专利技术各个实施方式的动态量化器的更新处理。具体实施例方式图1示出了用于与本专利技术一起使用的通用多媒体通信系统。如图1中所示,数据源ioo用模拟的、未压缩数字的或者压缩的数字格式或者这些格式的任何组合来提供源信号。编码器110将源信号 编码成编码々某体比特流。编码器110可以能够对多个媒体类型如语 音、音频和视频进行编码,或者可能需要多个编码器110以对不同 媒体类型的源信号进行编码。编码器110也可以获得合成产生的输入,比如图形和文字,或者它可以能够产生合成媒体的编码比特流。 在下文中,仅考虑对一个媒体类型的一个编码媒体比特流的处理以简化描述。然而应当注意实时广播服务通常包括数个流(通常至 少一个音频、视频和文字字幕流)。也应当注意该系统可以包括 多个编码器,但是在下文中仅考虑一个编码器110以简化描述而不 失一般性将编码媒体比特流传送到储存器120。储存器120可以包括用以 存储编码媒体比特流的任一类型的海量存储器。储存器120中的编 码媒体比特流的格式可以是基本自给比特流格式,或者一个或者多 个编码媒体比特流可以封装到容器文件中。 一 些系统"现场"操作、 即省略储存器并且将编码媒体比特流从编码器110直接地传送到发 送器130。编码媒体比特流然后按照需要传送到也称为服务器的发送 器130 。传送中所使用的格式可以是基本自给(elementary self-contained)比特流4各式、分组流4各式,或者一个或者多个编码々某 体比特流可以封装到容器文件中。编码器110、储存器120和发送器 130可以驻留于同一物理设备中,或者它们可以包含于分开的设备 中。编码器110和发送器130可以用现场实时内容来操作,在该情 况下编码媒体比特流通常未被持久地存储而是被緩存于内容编码器110中和/或发送器130中一段短时间以緩解处理延迟、传送延迟和/ 编码媒体比特速率中的变化。发送器130使用通信协议栈来发送编码媒体比特流。该栈可以 包括但不限于实时传送协议(RTP)、用户数据报协议(UDP)和互 联网协议(IP)。当通信协议栈是面向分组时,发送器130将编码 媒体比特流封装成分组。例如,当使用RTP时,发送器130根据RTP净荷格式将编码媒体比特流封装成RTP分组。通常,各媒体类型具 有专用RTP净荷格式。应当再次注意系统可以包含多个发本文档来自技高网
...

【技术保护点】
一种编码具有多个参数的输入信号的方法,包括: 以二进制格式存储数据,其中,所述数据表示量化器配置报头,而所述二进制格式包括在编码器的初始化期间使用的附加数据; 接收所述输入信号;以及 根据与每个参数相关联的量化器配置报头内 规定的量化器数据量化所述输入信号的每个参数。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:J尼尔米南S伊玛南
申请(专利权)人:诺基亚公司
类型:发明
国别省市:FI[芬兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1