处理音频信号的装置和方法制造方法及图纸

技术编号:3044543 阅读:127 留言:0更新日期:2012-04-11 18:40
在本方法的一个实施例中,数字音频数据块被存储在缓冲器中,并且对该数字音频数据块计算一组部分自相关系数值,随后,这些部分自相关系数值被熵编码以供传输。熵编码包括基于数字音频数据块的采样率从多个表中选择一包括偏移值和熵参数的表,基于来自所选表的偏移值计算部分自相关系数残差值,并使用由来自所选表的熵参数定义的熵代码对部分自相关系数残差值进行编码。

【技术实现步骤摘要】
【国外来华专利技术】专利技术背景本专利技术涉及一种处理音频信号的方法,尤其涉及一种编码和解码音频信号的 方法和装置。过去曾经以不同方法实现了音频信号的存储和重放。例如,音乐和语音业已 通过留声技术(例如唱盘播放机)、磁技术(例如卡式磁带)和数字技术(例如光 盘)来记录和保存。随着音频存储技术的发展,需要克服许多难题来优化音频信号 的质量和可存储性。为了音乐信号的存档和宽带传输,无损重建在借助诸如MP3或AAC等在MPEG 标准中定义的感性编码进行的压縮中正成为比高效率更为重要的特征。虽然DVD音频和超级CD音频包括专利无损压缩方案,但是在内容持有者和广 播公司当中需要一种开放式和综合性的压縮方案。响应于这种需要, 一种新的无损 编码方案已经成为MPEG-4音频标准的延伸。无损音频编码法由于原始信号的完美 重建而实现了没有任何质量损失的数字音频数据压縮。
技术实现思路
本专利技术涉及处理音频信号的方法。在该方法的一个实施例中,数字音频数据块被存储在缓冲器中,并且对该数 字音频数据块计算一组部分自相关系数值。然后,这些部分自相关系数值被熵编码 以供传输。熵编码包括基于该数字音频数据块的采样率从多个表中选择包括偏移值 和熵参数的一个表,基于来自所选表的偏移值计算部分自相关系数残差值,并使用 由来自所选表的熵参数定义的熵代码对部分自相关系数残差值进行编码。在一个实施例中,这多个表中的每一个与不同的采样率相关联以便对具有处 于关联范围内的采样率的数字音频数据进行最优压縮。例如,这多个表中的每一个 可与48、 96和192 kHz中的一个的采样率相关联。在一个实施例中,熵代码是Rice代码,而在另一实施例中,熵代码是分块 Gilbert Moore码(BGMC)代码。本专利技术又一实施例包括将表索引信息添加到数字音频数据中。表索引信息标 识所选的表。例如,用于对预测器系数进行熵编码的表索引信息值可以是OO、 01和10中的一个,其中表索引信息值00表示与48 kHz的采样率关联的表,表索引 信息值01表示与96 kHz的采样率关联的表,而表索引信息10表示与192 kHz的 采样率关联的表。又如,不对预测器系数作熵编码的表索引信息值可以是ll。 本专利技术还涉及编码音频信号的方法和装置,并涉及解码音频信号的方法和装置。附图简要说明包括于此以提供对本专利技术的进一步理解、并被结合在本申请中且构成其一部 分的附图示出本专利技术的实施方式,其与说明书一起可用来解释本专利技术的原理。在附图中附图说明图1是根据本专利技术一个实施方式的编码器的示例图。 图2是根据本专利技术一个实施方式的解码器的示例图。图3是根据本专利技术一个实施方式的压縮的M-声道文件的比特流结构的示例图。图4是根据本专利技术一个实施方式的分级块切换方法的概念图的示例图。图5是块切换示例及相应的块切换信息代码的示例图。图6是根据本专利技术实施方式的多个声道的块切换方法的示例图。具体实施方式下面将详细参考本专利技术的优选实施方式,其具体示例图示于附图中。只要有 可能,即在所有附图中使用相同的附图标记表示相同或相似的部件。在对本专利技术进行叙述之前,应当指出的是本专利技术中揭示的大多数术语对应于 本领域内公知的一般术语,但部分术语是由申请人根据需要选择的,并且将在本发 明下文的描述中予以揭示。因此,由申请人定义的术语优选基于它们在本专利技术中的 含义来理解。在无损音频编码方法中,由于编码过程必须是完全可逆而不会有信息损失的, 因此编码器和解码器两者的若干部件必须以确定性的方式来实现。编解码器结构图1是根据本专利技术的编码器1的示例图。分割部件100将输入的音频数据分割成若干帧。在一帧内,每个声道还可进一步被细分成若干个音频釆样块以做进一步处理。缓冲器no存储由分割部件100分割后的块和/或帧采样。系数估算部件120针对每个块估算最优的一组系数值。系数的数目,即预测器的阶数也可以自适应地做出选择。系数估算部件120针对数字音频数据块计算一 组部分自相关系数(parcor)值。部分自相关系数值指示预测器系数的部分自相关 系数表示。量化部件130将该组部分自相关系数值量化。第一熵编码部件140通过从部分自相关系数值减去一个偏移值来计算出部分自相关系数残差值,并使用由熵参数所定义的熵代码对部分自相关系数的残差值进 行编码,其中偏移值和熵参数选自最优表。最优表是基于数字音频数据块的采样率从多个表中选择的。这多个表是分别对多个采样率范围预定义的以实现为了传输而 进行的数字音频数据的最优压縮。系数转换部件150将量化了的部分自相关系数转换成线性预测编码(LPC)系 数。预测器160使用线性预测编码系数从存储在缓冲器110中的之前的原始采样估 算当前预测值。减法器170使用存储在缓冲器110中的数字音频数据的原始值和在 预测器160中估算出的预测值计算数字音频数据块的预测残差。第二熵编码部件180使用不同的熵代码编码预测残差并生成代码索引。所选 代码的索引将作为辅助信息发送。第二熵编码部件180可使用具有不同复杂度的两 种可供选择的编码技术之一对预测残差进行编码。 一种编码技术是公知的 Golomb-Rice编码(在下文中简称为Rice代码)法而另一种是公知的分块 Gilbert-Moore代码(在下文中简称为BGMC)法。Rice代码复杂度低但仍然是高 效率的。BGMC算术编码方案以比Rice代码复杂度稍高为代价提供更好的压縮。最后,多路复用部件190将编码的预测残差、代码索引、编码的部分自相关 系数残差值和其它附加信息进行多路复用形成压缩的比特流。编码器1还提供循环 冗余校验(CRC)校验和,它主要是供解码器验证解码的数据。在编码器方面,CRC 可用来确保压縮的数据是能够进行无损解码的。其它编码选项包括灵活块切换方案、随机存取和联合声道编码。编码器l可 使用这些选项提供若干具有不同复杂度的压縮等级。联合声道编码利用立体声声道 或多声道信号之间的相关性。这可通过在能够比原始信道之一更高效率地编码两个声道之间的差异的片段(segments)中编码这种差异来实现。这些编码选项将在对根据本专利技术的示例性解码器进行说明之后更为详细地予以说明。图2是根据本专利技术的解码器2的示例图。更特别地,图2示出由于不必执行任何适应性调整因而复杂度显著低于编码器的无损音频信号解码器。多路分解部件200接收音频信号并将数字音频数据块的编码的预测残差、代 码索引、编码的部分自相关系数残差值和其它附加信息多路分解。第一熵解码部件 210使用由熵参数定义的熵代码对部分自相关系数残差值进行解码并通过将偏移 值加至解码的部分自相关系数残差值来计算出一组部分自相关系数值;其中的偏移 值和熵参数选自一个表,该表是由解码器基于数字音频数据块的采样率从多个表中 选择的。第二熵解码部件220使用代码系数对经多路分解后的编码的预测残差进行 解码。系数转换部件230将经熵解码的部分自相关系数值转换成LPC系数。预测器 240使用LPC系数估算数字音频数据块的预测残差。加法器250将解码的预测残差 加至估算的预测残差以获得原始的数字音频数据块。组装部件260将解码的块数据 组装成帧数据。因此,解码器2将编码的预测残差和部分自相关系数残差值解码,将部分自 相关系数残差值转换成LPC系数,并应用反向预测滤波器计算无本文档来自技高网...

【技术保护点】
一种处理音频信号的方法,所述方法包括:    将数字音频数据块存储在缓冲器中;    对所述数字音频数据块计算一组部分自相关系数值;以及    对所述部分自相关系数值进行第一次熵编码以供传输,所述第一次熵编码包括:    基于所述数字音频数据块的采样率从多个表中选择一包括偏移值和熵参数的表,    基于来自所选表的偏移值计算部分自相关系数残差值,以及    基于由来自所选表的熵参数定义的熵代码对所述部分自相关系数值进行编码。

【技术特征摘要】
【国外来华专利技术】US 2005-7-11 60/697,551;KR 2005-7-16 PCT/KR2005/001.一种处理音频信号的方法,所述方法包括将数字音频数据块存储在缓冲器中;对所述数字音频数据块计算一组部分自相关系数值;以及对所述部分自相关系数值进行第一次熵编码以供传输,所述第一次熵编码包括基于所述数字音频数据块的采样率从多个表中选择一包括偏移值和熵参数的表,基于来自所选表的偏移值计算部分自相关系数残差值,以及基于由来自所选表的熵参数定义的熵代码对所述部分自相关系数值进行编码。2. 如权利要求l所述的方法,其特征在于,所述计算部分自相关系数残差值 的步骤从所述部分自相关系数值的量化值减去所述偏移值以获得所述部分自相关 系数残差值。3. 如权利要求l所述的方法,其特征在于,还包括 将所述部分自相关系数值转换成线性预测编码(LPC)系数; 基于所述LPC系数预测所述块中的当前数据采样;以及基于所预测出的当前数据采样和所述当前数据采样获取预测残差。4. 如权利要求3所述的方法,其特征在于,还包括 对所述预测残差进行第二次熵编码;以及将经熵编码的所述预测残差与经熵编码的所述部分自相关系数值多路复用。5. 如权利要求l所述的方法,其特征在于,所述多个表中的每个表与不同的 采样率相关联以便对具有处于关联范围内的采样率的数字音频数据进行最优压縮。6. 如权利要求l所述的方法,其特征在于,所述多个表中的每个表与48、 96 和192 kHz中的一个的采样率相关联。7. 如权利要求l所述的方法,其特征在于,所述多个表的总数为三个。8. 如权利要求l所述的方法,其特征在于,所述熵代码是Rice代码。9. 如权利要求l所述的方法,其特征在于,所述熵代码是分块Gilbert Moore 码(BGMC)代码。10. 如权利要求1所述的方法,其特征在于,所述数字音频数据块的采样率是48、 96和192 kHz中的一个。11. 如权利要求l所述的方法,其特征在于,还包括 将表索引信息添加到所述数字音频数据中,所述表索引信息标识所选的表。12. 如权利要求ll所述的方法,其特征在于,用于对预测器系数进行熵编码 的表索引信息值是OO、 01和10中的一个。13. 如权利要求12所述的方法,其特征在于,表索引信息值00表示与48kHz 采样率相关联的表,表索引信息值01表示与96kHz采样率相关联的表,表索引信 息值10表示与192 kHz采样率相关联的表。14. 如权利要求12所述的方法,其特征在于,不对预测器系数作熵编码的表 索引信息值是ll。15. 如权利要求ll所述的方法,其特征在于,所述不对预测器系数作熵编码 的表索引信息值是ll。16. —种处理音频信号的方法,所述方法包括接收包括数字音频数据块的预测残差以及部分自相关系数残差值的音频信 号;以及从所述部分自相关系数残差值重建一组部分自相关系数值,所述重建包括 基于所述数字音频数据块的采样率从多个表中选择一包括偏移值和熵参数的表,使用由来自所选表的熵参数定义的熵代码对所述部分自相关系数残差值 进行第一次熵解码;基于来自所选表的偏移值和经解码的所述部分自相关系数残差值计算一 组部分自相关系数值。17. 如权利要求16所述的方法,其特征在于,所述计算一组部分自相关系数 值的步骤将所述偏移值加至所述部分自相关系数残差值。18. 如权利要求16所述的方法...

【专利技术属性】
技术研发人员:T利伯成
申请(专利权)人:LG电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1