数字音频数据的压缩与解压缩的方法技术

技术编号:3421354 阅读:186 留言:0更新日期:2012-04-11 18:40
数字音频数据被分为多个帧,每帧包括希望数量的子带样本,样本数量在“16”与“1024”间的范围内逐渐增大,随后通过心理声学分析和量化压缩各帧,从而以高压缩率和少量音调产生延迟形成压缩数据。通过反量化和子带合成解码压缩数据,从而将压缩数据依次写入存储器(例如FIFO存储器)。根据存储器目前的空余容量适当地启动或停止解码。

【技术实现步骤摘要】

本专利技术涉及对具有少量延迟的数字音频数据进行压缩与解压缩的方法。本专利技术要求日本专利申请No.2005-159484的优先权,此处通过引用该专利申请的内容以结合进来。
技术介绍
众所周知,通过ADPCM(即自适应差分脉冲编码调制)和LPC(即线性预测编码)以及诸如MP3(即MPEG音频层3)的子带编码和MPEG音频AAC(高级音频编码)来实现压缩数字音频数据的方法。线性预测编码以样本为单位对数字音频数据执行压缩,所以它们可以通过解压缩(解码)没有延迟地开始播放(即音调产生处理);因此,与子带编码方法相比较,它们实现了少量的音调产生延迟,但没有实现高压缩率。子带编码方法对以帧(或块)为单位的多个样本执行压缩;因此,与线性预测编码方法相比较,它们实现高压缩率。然而,在完成对头帧中包括的所有样本的解压缩之前,子带编码方法不能开始播放;因此,解压缩时间随着每帧中包括的样本数量的增加而增长,这又增加了音调产生延迟。已授权的日本专利申请文件No.2734323与国际公开No.WO99/29133教导了实现改善音调产生延迟同时确保高压缩性能的数据压缩的方法。
技术实现思路
本专利技术的目标是提供一种对具有少量音调产生延迟的数字音频数据进行压缩与解压缩的方法。在本专利技术的第一方面中,以这样的方式执行数据压缩将一系列样本数据分为n个帧,其中每帧包括的样本数量从第一帧至第k帧逐渐增大,其中1<k<n(其中k与n是整数);然后,将每帧中包括的样本数据分为多个子带信号,随后通过心理声学分析对子带进行量化,从而产生压缩的数据。具体地,数字音频数据被分为多个帧,每帧包括希望数量的子带样本,对于乐曲的起声部分,样本数量在“16”与“1024”的范围内逐渐增大;并且通过心理声学分析和量化压缩每一帧,从而产生具有少量音调产生延迟的压缩数据。在本专利技术的第二方面,使用n个帧执行数据解压缩,每一帧包括对应于压缩数据的多个子带信号,其中每帧内包括的样本数量从第一帧至第k帧逐渐增大,其中1<k<n(其中k与n是整数);然后以帧为单位对压缩数据进行解码,以便再现压缩前的一系列样本数据,并将样本数据依次写入至存储器,在其中根据该存储器的空余容量控制解码。具体地,通过反量化和子带合成以帧为单位解码压缩的数据。解码的数据被依次写入存储器(例如,FIFO存储器),其中根据存储器的当前空余容量适当地启动或停止解码。附图说明下面参考附图通过示例详细地说明本专利技术的这些和其它目标、方面以及实施例,其中图1是表示根据本专利技术优选实施例的数据压缩电路的框图;图2是表示根据本专利技术优选实施例的数据解压缩电路的框图;以及图3是表示图2所示的数据解压缩电路整体操作的流程图。具体实施例方式下面将参考附图,通过示例更加详细地说明本专利技术。图1是表示根据本专利技术优选实施例的数据压缩电路构成的框图。图1的数据压缩电路使用子带编码方法对数字音频数据进行压缩。为了解决利用数字音频数据的乐曲的播放,对于乐曲(参见图1底部所示的条形图)的起声部分(或前部),该数据压缩电路被设计为改变一帧中包括的样本数量。也就是,相比于一帧中包括的样本数量固定为1024的常规子带编码方法,本专利技术的特征在于一帧中包括的样本数量可在16、32、64、128、256…,以及1024中变化,其中以因子“2”增加并最终到达“1024”,“1024”是固定的,因此对于每帧1024个样本执行压缩。下面详细说明图1的数据压缩电路。附图标记1代表用于存储压缩前的数字音频数据(例如,PCM数据),即一系列样本数据的存储器。附图标记2代表以帧为单位从存储器1依次读取包括多个样本的数字音频数据的帧划分模块,样本数量由从控制器3给出的帧大小指定。随后,读取的数字音频数据被传递至子带变换模块4和心理声学分析模块5。首先,从存储器1读取16个样本数据,并随后将它们传递至子带变换模块4和心理声学分析模块5。接着,从存储器1读取32个样本数据,并随后将它们传递至子带变换模块4和心理声学分析模块5。接着,从存储器1读取64个样本数据,并随后将它们传递至子带变换模块4和心理声学分析模块5。接着,从存储器1读取128个样本数据,随后将它们传递至子带变换模块4和心理声学分析模块5。类似地,从存储器1读取256和512个样本数据,并随后传递它们。最后,从存储器1读取1024个样本数据,并随后将它们传递至子带变换模块4和心理声学分析模块5。子带变换模块4将其输入数据分为多个子带信号,对于规定数量的子带,每一子带信号具有相同的子带宽度。当规定数量被设置为16时,将输入数据分为16个子带信号,从而以采样频率的1/16对每一子带信号进行下采样。当规定数量被设置为32时,将输入数据分为32个子带信号,从而以采样频率的1/32对每一子带信号进行下采样。比例因子提取与归一化模块6检测一帧包括的子带样本中具有最大值的样本,其中将该最大值量化以产生比例因子。然后用该比例因子除每一子带信号,并随后将子带信号归一化至规定的±1范围内。心理声学分析模块5利用快速傅立叶变换(FFT)执行关于频谱的计算,并以此为基础对于子带产生遮蔽阈值(或可允许的量化噪声功率)。比特分配模块7基于心理声学分析模块5的输出并在考虑到比特数量的限制之下执行重复循环处理,这在每帧是有用的,并由比特速率确定,从而确定每一子带的量化比特数。比特分配模块7可降低分配至每一帧的比特数,同时确保由压缩的数字音频数据实现的高播放质量,其基本等效于原始播放质量;因此,当压缩的数字音频数据的基本帧大小被设置为大数字时(例如1024个样本),有可能增大压缩比。量化模块8根据量化比特数,对从比例因子提取与归一化模块6输出的子带信号执行量化,其中量化比特数针对每一子带进行设置。比特流形成模块9基于比例因子提取与归一化模块6、比特分配模块7和量化模块8的输出产生每帧的比特流BS。该比特流BS包括音频数据(对应于量化的子带信号)和边数据(包括每一子带的比特分配信息、比例因子以及从控制器3输出的帧大小)。将头部增加至前述数据,以完成比特流BS,随后将其写入至ROM 10。接下来详细说明用于对从ROM 10读取的比特流10执行解压缩的数据解压缩电路。图2是表示数据解压缩电路构成的框图,其中前述比特流BS从ROM 10读取。从ROM 10读取的比特流BS的头部被提供至控制电路14,而比特流10中包括的子带样本与边数据被提供至比特流分析模块12。具体地,比特流分析模块12将从ROM 10读取的比特流BS的量化的子带样本和边数据分离,因此子带样本被提供至反量化电路13,而边数据被提供至控制电路14。反量化电路13对子带样本执行反量化,并且还利用比例因子执行乘法,从而产生子带数据。根据提前预定的规定子带数量,将子带数据全部提供至子带合成电路16。控制电路14控制图2的数据解压缩电路的多个模块,其中当从CPU(即中央处理单元,未示出)接收到指令时,该控制电路产生ROM10的读取地址。此外,它接收从比特流分析模块12输出的边数据,以将比特分配信息和比例因子输出至反量化电路13。进一步地,它基于先进先出(FIFO)存储器17输出的数据ED控制由反量化电路13和子带合成电路16执行的解码。后面将说明解码的细节。子带合成电路16根据规定的子带数量合本文档来自技高网...

【技术保护点】
一种数据压缩方法,包括以下步骤:以这样的方式将一系列样本数据分为n个帧,使得每帧内包括的样本数量从第一帧至第k帧逐渐增大,其中1<k<n,k与n是整数;将每帧内包括的所述样本数据分为多个子带信号;以及通过心理声学分析对子带信号执行量化,从而产生压缩的数据。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:铃木俊彦
申请(专利权)人:雅马哈株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利