改进的霍夫曼解码方法及装置制造方法及图纸

技术编号:4176051 阅读:242 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种确定两级霍夫曼码书的最优第一级读入比特数x的方法。该方法包括:x)根据给定的权重系数α,计算对应两级霍夫曼码书的综合代价函数cost(x);y)记录当综合代价函数取最小值时的第一级读入比特数x的数值x↓[Min];z)输出x↓[Min]值作为最优第一级读入比特数,并将x↓[Min]值存储在对应于两级霍夫曼码书的编码码流中。其中的综合代价函数为两级霍夫曼码书的第二级最大搜索深度max_depth(x)、码书尺寸值size(x)及线性码书项数size(0)的函数。本发明专利技术还提供了相应的确定两级霍夫曼码书的最优第一级读入比特数x的装置。通过本发明专利技术的方法及装置,可以显著优化霍夫曼解码。

Improved Hoffman decoding method and apparatus

The invention provides a method for determining an optimum first stage read in bit number x of a two stage Hoffman code book. The method includes: x) according to the weight coefficient is given, the calculation of comprehensive cost corresponding to the two level Hoffman code book function cost (x); y) the first read bit recording when the comprehensive cost function takes the minimum value when the number of the value of X X: Min Z; X: Min) output value as the optimal first stage read bit number, and X: Min values are stored in the corresponding to the two level Hoffman codebook encoding stream. The comprehensive cost function which is two level Hoffman code book second maximum search depth max depth (x), code book size value size (x) and linear codebook terms of size (0) function. The invention also provides a device for determining an optimum first reading bit number x of the two stage Hoffman code book. The method and apparatus of the present invention can significantly optimize Hoffman decoding.

【技术实现步骤摘要】

本专利技术涉及改进的霍夫曼解码方法及装置,更具体地,涉及用于DRA音频编解码系统的改进的音频霍夫曼解码方法及装置。
技术介绍
多媒体技术随着人类进入信息时代而得到迅猛发展,随之而来的是海量音、视频信息被广泛使用。例如,在数字电视、IPTV、DVD等多媒体
中,大量的音、视频信息被以传输-播放和/或存储-播放的形式供用户使用。但另一方面,由于这些音、视频信息的数据量很大,因此带来了传输和存储上的不便。为此,在传输和/或存储时需要对原始音、视频进行压缩编码处理,在播放时再通过解码处理恢复原始声音或图像。 为了压缩编码音、视频数据,现有技术中出现了一系列音频压缩算法和视频压缩算法,其中最为常见的音频压缩算法如MPEG系列音频压缩算法(如mp3、MPEG-2AAC、MPEG-4AAC等)。在MPEG系列音频压缩算法中,除了通过时频变换、心理声学模型等本领域常用的手段对原始音频信号进行第一压缩处理以外,还对经过第一压缩处理的信号进行例如霍夫曼熵编码的第二压缩处理,以利用该信号中还存在的统计冗余来进一步压缩数据量。 除MPEG系列算法以外,现有技术中还存在其它利用霍夫曼编码的音频压缩算法,如本文中提到的DRA音频编解码技术,该技术由本专利技术申请人的关联公司广州广晟数码技术有限公司自主研发。如图1A和1B所示,作为中国音频编码电子行业标准的DRA音频编、解码技术近年来已为业内所熟知。有关DRA音频编解码技术更详细的内容可参见信息产业部2007年1月4日发布的、标准序号SJ/T 11368-2006的行业标准,该标准的全部内容在此以引用的方式并入本文。另外,为了叙述方便,下文中将该标准简称为“DRA标准”,并将与DRA标准相应的DRA音频编解码技术简称为“DRA技术”。 尽管霍夫曼编码产生了良好的编码效果,极大提高了编码效率(本文中的术语“编码效率”可定义为原始音频信号数据量和编码音频信号数据量之比),但其也并非没有缺点。例如,当霍夫曼码字较长、码字总数较多时,以传统的单级霍夫曼解码方法对编码音频信号进行逆变换时搜索码书的平均时间长且不同码字解码时间相差大、所需存储量大。具体到DRA霍夫曼解码算法在DRA解码端,霍夫曼解码所占用的时间和内存占据了总解码时间和总内存需求的相当部分。因此,提供快速高效的霍夫曼解码方法就成为优化DRA解码端解码效率的关键。 为了解决上述问题,现有技术中已公开了一些针对音频解码端霍夫曼解码方法的改进技术。 例如,在发表于《电子测量技术》2005年第二期上的、作者为李玥等人的、题目为《音频系统中的霍夫曼解码算法改进》的论文(下称为文件1)中,阐述了一种改进的霍夫曼解码方法,其通过将MPEG-1码书中的码字低位补零,从而生成19位码字升序排列的新码书;以及按19位码字前4位对所有码字进行分组(以该4位的值作为分组序号)的方式加快了霍夫曼解码的速度。但文件1的方法至少具有以下缺陷可能需要对码字补零,增加了存储需求;在文件1所提到的两步式搜索方法中,第一步搜索固定为前4位,不一定是权衡了解码速度和存储需求后的最优选择。 再例如,在发表于《微型机与应用》2005年第二期上的、作者为王昱洁等人的、题目为《一种应用于MPEG-2 AAC的快速Huffman解码算法》的论文(下称为文件2)中,阐述了一种改进的霍夫曼解码方法,其通过下述步骤来优化霍夫曼解码效率将AAC码书中的码字低位补零,从而生成了16位码字升序排列的新码书;以及取原码字时各码长的第一个码字组成定位表;通过定位表提供的基址+偏移量的方式确定原霍夫曼码字序号。但文件2的方法至少具有以下缺陷可能需要对码字补零,增加了存储需求;每次需遍历定位表,以搜索读入的二进制编码在定位表中的对应位置,增加了计算量。 又例如,在2004年12月的《计算机工程》(第30卷)上发表的、作者为薛英智等人的、题目为《AAC解码器的Huffman算法选择和优化》的论文(下称为文件3)中,分别讨论了在ARM平台下,对基于分步查表和二进制树搜索的霍夫曼解码方法的改进。但文件3的方法至少具有以下缺陷对分步查表法的改进不够精细,可能并未达到权衡了码字尺寸和搜索深度之后的最优结果;对二进制树搜索方法的改进是基于ARM系统自身特点的,不具有通用性。 此外,现有技术中并未公开关于针对DRA系统的、快速高效的霍夫曼解码算法的改进方法。
技术实现思路
为了解决上述问题以及其它问题,本专利技术特给出了以下的技术方案。 本专利技术提供了一种确定两级霍夫曼码书的最优第一级读入比特数x的方法。该方法包括x)根据给定的权重系数α,计算对应两级霍夫曼码书的综合代价函数cost(x);y)记录当综合代价函数取最小值时的第一级读入比特数x的数值xMin;z)输出xMin值作为最优第一级读入比特数,并将xMin值存储在对应于两级霍夫曼码书的编码码流中。其中的综合代价函数为两级霍夫曼码书的第二级最大搜索深度max_depth(x)、码书尺寸值size(x)及线性码书项数size(0)的函数。本专利技术还提供了相应的确定两级霍夫曼码书的最优第一级读入比特数x的装置。通过本专利技术的方法及装置,可以显著优化霍夫曼解码。另外,本专利技术还提供了与之相应的霍夫曼解码装置。 基于上述技术方案,本专利技术实现了确定两级霍夫曼码书的最优第一级读入比特数x,并进而实现了针对两级霍夫曼码书的快速高效的音频霍夫曼解码。 附图说明 下文中将参考由附图所图解说明的优选示例性实施例来更详细地解释本专利技术的主旨,在附图中相同的附图标记代表相同或等同的元件。在附图中 图1A和1B是方框图,其分别示出了DRA音频编、解码器; 图2是流程图,其示出了根据本专利技术第一实施例的、改进的霍夫曼解码方法; 图3是方框图,其示出了根据本专利技术第一实施例的、改进的霍夫曼解码装置; 图4是流程图,其示出了根据本专利技术第二实施例的、改进的DRA霍夫曼解码方法; 图5是方框图,其示出了根据本专利技术第二实施例的、改进的DRA霍夫曼解码装置; 图6是流程图,其详细示出了x数值计算步骤对应于步骤3101A的x计算步骤3101’;以及 图7是方框图,其详细示出了x数值计算模块对应于模块4101A的初始比特计算模块4101’。 具体实施例方式 通过借助附图在下文中将描述本专利技术的优选实施例。在以下描述中,将不详细描述已成为现有技术的功能或结构,因为不必要的细节将导致本专利技术的介绍含混不清。 在图1A中示出了典型的DRA音频编码器10,其可通过硬件、软件、和/或韧件来实现。简言之,DRA标准所涉及的技术就是以多个技术模块对源音(例如,输入PCM样本)进行信号处理,以达到“编码缺陷几乎不可闻”地压缩源音的目的。上述多个技术模块包括但不限于暂态分析模块20、多分辨率滤波器组模块22、线性标量量化模块30、量化指数编码模块32、码书选择模块34、人耳听觉模型模块40、全局比特分配模块42及多路复用模块50。按照DRA标准的相关规定,上述技术模块为必选模块,即符合标准的DRA输出码流(即,DRA标准码流)一定是经过上述模块处理后的码流。按照其功能,可将上述模块分为四组,即多分辨率分析组(包含暂态分析模块20、多分辨率滤波器组模块22),量化组(包含线性标量本文档来自技高网
...

【技术保护点】
一种确定两级霍夫曼码书的最优第一级读入比特数x的方法,包括: x)根据给定的权重系数α,计算对应所述两级霍夫曼码书的综合代价函数cost(x); y)记录当所述综合代价函数取最小值时的第一级读入比特数x的数值x↓[Min];   z)输出所述x↓[Min]值作为所述最优第一级读入比特数,并将所述x↓[Min]值存储在对应于所述两级霍夫曼码书的编码码流中, 其中,所述综合代价函数为所述两级霍夫曼码书的第二级最大搜索深度max_depth(x)、码书尺寸值si ze(x)及线性码书项数size(0)的函数。

【技术特征摘要】

【专利技术属性】
技术研发人员:张盈华
申请(专利权)人:数维科技北京有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1