当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于整形小波变换的音频无损压缩编码、解码方法技术

技术编号:4096589 阅读:293 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种音频无损压缩编码、解码方法,属于信源编、解码领域。本方法根据信号前后帧的相关情况自适应对信号进行分帧,分帧后的一帧信号是信号特性相近的信号组合,使得编码器能获得到更好的压缩效率,为后面的整型小波变换和线性预测编码带来好处。对于无损压缩编码来说,应该对于信号可以完全的重构,所以采用整型提升小波变换来保证信号的完全可重构特性。与现有技术相比,本发明专利技术在引入了基于相关的自适应分帧模块和基于整型提升小波的去相关模块后,原始信号中的冗余信息可以被更好的去相关,生成的压缩数据中所含有的冗余信息更少,所以本发明专利技术可以用很小的计算复杂度代价换来了较大的压缩比提高。

【技术实现步骤摘要】

本专利技术属于信源编、解码领域,具体涉及一种音频无损压缩编码、解码方法。
技术介绍
随着数字时代的到来,音频信号的数字化给人们带来诸多方便的同时生成了海量 的音频数据,这给音频信号的存储和传输带来了很大的挑战,成为了阻碍人们获得和使用 多媒体信息的瓶颈问题之一。为了解决这个问题,就必须对音频数据进行压缩,以压缩编码 的方式对数据进行存储和传输。事实证明,对多媒体的数据进行压缩是必要和可行的,因为 声音和图像等多媒体数据信息中有较强的冗余信息,即数据之间有较强的相关性,可通过 去掉冗余信息(即去除数据间的相关性)、保留有用的音频信息来实现压缩。因此,研究和 开发高效的音频编码方法,以压缩的形式存储和传输音频信息是必然的选择。而且随着人 们对音频质量要求的提高,如何在保留全部音频信息的条件下,以尽可能大的压缩比压缩 音频数据,从而给人们提供真正透明的音质,成为当前音频压缩编码所面临的主要课题。早在20世纪70年代,英国、日本等广播部门就开始研究数字音频有损压缩编码, 目前的有损音频压缩编码标准经过四十年的发展,出现了很多优秀的编码标准,其中有代 表性的有MP3、AAC、WMA等,这些编码格式在很多情况下都可以达到较好的主观音质和很高 的压缩比,但是当它们遇到频率动态范围较大的音乐,例如大型交响乐等,这些有损音频编 码后的音质表现就显得差强人意。另外在音频编辑领域中,对有损压缩编码的音频数据做 二次编码(即两种有损编码格式之间的转换)会丢失更多的信息,从而引入更大的失真。为 了解决上述的问题,满足一些对音质要求比较高的需要,就必然要使用无损压缩编码。目前针对音频信号进行无损压缩编码的研究与应用相比较有损压缩编码而言却 并不多见。无损压缩未能得到足够关注的原因是其压缩比很难超过3 1,而有损算法压缩 比能达到12 1甚至更高。但是对有损压缩算法来说,压缩比越高,最终获得的音频质量 越差,一旦确定最低可能的数据率,有损压缩算法是唯一选择。然而,音乐爱好者想从网上 下载高保真立体声音频信号以便获得最佳的音乐效果,因此,网上音乐推广将提供更高压 缩比的音频信号,以便于不同消费者浏览和选择,而酷爱CD级音频质量的音乐爱好者希望 获得原始音频信号的无损压缩拷贝——该备份不因压缩算法的差异而有任何信号损失。除 了可供网上音频信号下载外,无损音频压缩编码还可应用于专业环境下高保真音频数据的 归档、混音、演播室、节目制作等。在这种情况下,无损压缩避免了使用有损压缩编码情况下 因多次编辑而引起的信号损失。从信息论观点来看,音频信号作为一个信源,描述信源的数据是信息量(信息熵) 和信息冗余量之和。几乎所有的无损音频压缩都基于相似的思想,首先从信号中去除冗 余,去除的只是数据中的冗余量,而没有减少信源中的信息量。然后用有效的数据编码方 案进行编码。音频信号中的存在着多种冗余,主要有信号幅度分布的非均勻性,相邻样值之 间的相关性,周期之间的相关性等。所以无损压缩编码算法的主要思想就是如何有效的去 处音频信号中的冗余。目前比较知名的音频无损编码算法的格式有FLAC(Free Lossless3Audio Codec)、WavPack、TAK (Tom ' s Audio Kompre s sor)、APE (Monkey ' s Audio)、 OFR(OptimFROG) > ALAC (Apple Lossless Audio Codec) > WMAL (Windows Media Audio Lossless)、Shorten、LA (LosslessAudio)、TTA (Ture Audio)、LPAC (Lossless Predictive Audio Coder)、RAL (RealAudioLossless)、MPEG-ALS等。这些算法主要利用两种方法来进 行去相关从而进一步进行无损压缩编码一种是基于时域线性预测编码(LPC)的技术,另 一种是基于变换域的技术例如 IntMDCTdnteger Modified Discrete Cosnie Transform, 整数改进型离散余弦变换)。无损压缩的目标是除去数据中的冗余(redundancy),完美重 构原始音频信号。线性预测编码可以进一步减少冗余,对于那些具有平稳特性的信号特别 有效。一般来讲,平稳的声音信号信息冗余较大,而一个不协调(类似噪音)的信号信息冗 余较小。一个特定取样值的大小与其邻近的取样值有关,一般而言,当前取样值与其上一个 取样值较为接近。对低频信号,更是如此。目前对于主流的线性预测编码方法主要思想都是体现在去相关部分,使得交给熵 编码模块的数据更适合利用熵编码的方法压缩,使得熵编码能够对于待编码的数据有更加 出色的压缩性能。线性预测编码器的基本原理是利用声音信号的相关性,用过去的样值 x[n-l],x[n-2]...来预测当前的样值χ [η],利用过去的样值越多则预测精度越高。再把当 前的样值与预测值相减取其差(预测误差)进行编码。由于预测误差的动态范围要远小于 原始信号的动态范围,这时即使仍采用原信号量化时采用的量化级,也可降低码位进行编 码,进而实现比特率压缩。例如幅度起伏平缓的声音,预测误差会在零和很小值之间变化, e[n]的均值将比x[n]小很多,并且预测误差e [η]相邻样值之间基本上是不相关的,有平坦 的频谱。所以,只需较少的数据位就可以表示其实际值。而常用的熵编码为RICE码,其编 解码过程简单,而且编码时不需要知道信号的先验分布,所以在音频无损压缩中应用广泛。 经过RICE编码后,能够获得较大压缩率的数据一般具有以下特点一是幅值较小,因为编 码最后都需要量化的过程,而较小的幅值意味着可以用较少的比特数来表示;二是数据间 相关性小,三是数据分布尽量接近几何分布。使用线性预测编码进行去相关时没有对原始 音频信号的冗余去除干净,即去相关不彻底.。即输入到熵编码模块的预测误差数据还带有 冗余信息,误差信号的相邻样值之间还存在一定的相关性,可以进一步处理。
技术实现思路
本专利技术的目的是提供一种音频无损压缩编码、解码方法,该方法基于相关系数的 分帧策略根据信号前后帧的相关情况自适应对信号进行分帧,使得一帧内的信号具有很强 相关性,分帧后的一帧信号是信号特性相近的信号组合,使得编码器能获得到更好的压缩 效率,为后面的整型小波变换和线性预测编码带来好处。为了使得残差幅值尽可能小,要求 线性预测尽可能准确,而线性预测编码对于相关性强的信号具有很好的预测能力,所以考 虑利用小波变换来对信号进行分带处理,因为窄带内的信号相关性会好于全频带的信号的 相关性,因此信号经过小波变换后更有利于去除样值点的相关性;对于无损压缩编码来说, 应该对于信号可以完全的重构,所以要采用整型提升小波变换来保证信号的完全可重构特 性。我们在引入了基于相关的自适应分帧模块和基于整型提升小波的去相关模块后,原始 信号中的冗余信息可以被更好的去相关,生成的压缩数据中所含有的冗余信息更少,所以 我们可以用很小的计算复杂度代价换来了较大的压缩比提高。本专利技术包括基于相关的自适应分帧技术,基于提升的整型小波变换的去相关技术 以及编、解码中涉及到的其他相关技术本文档来自技高网
...

【技术保护点】
一种基于整形小波变换的音频无损压缩编码方法,其步骤为:1)分帧模块对输入的音频信号进行分帧处理,将分帧信息纳入边信息;2)整型小波变换模块对分帧后的每一帧进行小波变换得到近似信号、细节信号和分级信息,并将分级信息纳入边信息;3)线性预测编码模块对近似信号和细节信号进行线性预测,得到残差信号和LPC参数,并将LPC参数纳入边信息;4)熵编码模块对残差信号进行熵编码得到熵编码流,同时将熵编码的码本信息纳入边信息;5)比特流形成模块将边信息和熵编码流复用形成最终的压缩码流。

【技术特征摘要】
一种基于整形小波变换的音频无损压缩编码方法,其步骤为1)分帧模块对输入的音频信号进行分帧处理,将分帧信息纳入边信息;2)整型小波变换模块对分帧后的每一帧进行小波变换得到近似信号、细节信号和分级信息,并将分级信息纳入边信息;3)线性预测编码模块对近似信号和细节信号进行线性预测,得到残差信号和LPC参数,并将LPC参数纳入边信息;4)熵编码模块对残差信号进行熵编码得到熵编码流,同时将熵编码的码本信息纳入边信息;5)比特流形成模块将边信息和熵编码流复用形成最终的压缩码流。2.如权利要求1所述的方法,其特征在于所述整型小波变换模块为整型提升小波变换 模块。3.如权利要求2所述的方法,其特征在于所述整型提升小波变换模块为四次提升变换 的整型小波变换模块。4.如权利要求1或2所述的方法,其特征在于采用自适应级数选择方法确定所述分级fn息ο5.如权利要求ι所述的方法,其特征在于所述分帧模块根据相邻帧的相关系数,将相 关性大的信号合并到一帧内,进行分帧处理。6.如权利要求5所述的方法,其特征在于所述分帧模块首先以最小...

【专利技术属性】
技术研发人员:吴玺宏曲天书迟惠生高懿何文欣张搏
申请(专利权)人:北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1