用于对音频信号进行编码和解码的方法技术

技术编号:3044599 阅读:136 留言:0更新日期:2012-04-11 18:40
公开了一种用于编码和解码音频信号的装置及其方法,通过其可在编码音频信号时提供与普通单声道或立体声音频信号的播放器的兼容性,并且通过其可在不存在辅助数据区的情况下存储或发送多声道音频信号的空间信息。本发明专利技术包括提取嵌入在音频信号分量的不可识别的分量中的辅助信息并使用所提取的辅助信息来解码该音频信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及将音频信号编解码的方法。技术背景近来,进行了许多工作以研究和发展用于数字音频信号的各种编码方案和方 法,并且制造了许多与各种编码方案及方法相关联的产品。并且,已经发展了使用多声道音频信号的空间信息将单声道或立体声音频信 号改变成多声道音频信号的编码方案。然而,在将音频信号存储在一些记录介质中的情形中,不存在用于存储空间 信息的辅助数据区。所以,在这种情形中,由于仅单声道或立体声音频信号被存储 和发送,所以仅再现该单声道或立体声音频信号。因此,声音质量较为单调。此外,在单独存储或发送空间信息的情形中,存在与普通单声道或立体声音 频信号的播放器的兼容性问题。
技术实现思路
因此,本专利技术针对用于将音频信号编解码的装置及其方法,其基本避免了由 于相关技术的局限和缺点而引起的一个或多个问题。本专利技术的一个目的在于提供一种用于将音频信号编解码的装置及其方法,籍 此可在编码音频信号时提供与普通单声道或立体声音频信号的播放器的兼容性。本专利技术的另一目的在于提供一种用于将音频信号编解码的装置及其方法,籍 此可在不存在辅助数据区的情况下存储或发送多声道音频信号的空间信息。本专利技术的其它特征和优点将在以下描述中进行阐述,并且部分将因该描述而 显而易见或可通过本专利技术的实践而获得示教。本专利技术的目的和其它优点将通过在书 面描述及其权利要求以及附图中特别指出的结构来实现和获得。为了实现这些和其它优点并根据本专利技术的用途, 一种根据本专利技术的解码音频 信号的方法包括提取通过被散布在音频信号的至少一个声道上而嵌入在该音频信号中的辅助信息的步骤(a),以及使用该辅助信息来解码该音频信号的步骤(b)。为了进一步实现这些和其它优点并根据本专利技术的用途, 一种根据本专利技术的编 码音频信号的方法包括生成解码音频信号所需的辅助信息的步骤(a),以及通过 散布该辅助信息以将其嵌入在具有至少一个声道的音频信号中的步骤(b)。为了进一步实现这些和其它优点并根据本专利技术的用途, 一种根据本专利技术的数据结构包括音频信号以及通过被散布而嵌入在具有至少一个声道的音频信号的不 可识别的分量中的用于解码该音频信号所需的辅助信息。为了进一步实现这些和其它优点并根据本专利技术的用途, 一种根据本专利技术的用 于编码音频信号的装置包括辅助信息生成单元,用于生成解码该音频信号所需的 辅助信息;以及嵌入单元,用于通过散布辅助信息来将其嵌入在具有至少一个声道 的音频信号中。为了进一步实现这些和其它优点并根据本专利技术的用途, 一种根据本专利技术的用于解码音频信号的装置包括嵌入信号解码单元,用于提取通过散布而嵌入在具有 至少一个声道的音频信号中的辅助信息;以及多声道生成单元,用于通过使用该附加信息来解码该音频信号。应该认识到的是,以上综述和以下详述是示例性和解释性的,并旨在提供对 所要求保护的本专利技术的进一步的解释。附图简述被包括以提供对本专利技术的进一步理解以及被包含在本说明书内且构成其一部 分的附图示出了本专利技术的实施例,并与描述一同起解释本专利技术的原理的作用。 在附图中图I是用于解释根据本专利技术的人体识别音频信号的空间信息的方法的示图; 图2是根据本专利技术的空间编码器的框图;图3是根据本专利技术的用于配置图2中所示的空间编码器的嵌入单元的详细框图;图4是根据本专利技术的用于重排空间信息位流的第一方法的示图; 图5是根据本专利技术的用于重排空间信息位流的第二方法的示图; 图6A是根据本专利技术的经整形的空间信息位流的示图; 图6B是图6A中所示的空间信息位流的配置的详细示图; 图7是根据本专利技术的空间解码器的框图;图8是根据本专利技术的包括在空间解码器中的嵌入信号解码器的具体框图; 图9是用于解释根据本专利技术的普通PCM解码器再现音频信号的情形的示图; 图IO是根据本专利技术的用于将空间信息嵌入在下混(downmix)信号中的编码 方法的流程图;附图说明图11是根据本专利技术的用于对嵌入在下混信号中的空间信息解码的方法的流程图;图12是根据本专利技术的嵌入在下混信号中的空间信息位流的帧大小的示图; 图13是根据本专利技术的按固定大小嵌入在下混信号中的空间信息位流的示图; 图14A是解释用于解决按固定大小嵌入的空间信息位流的时间对准问题的第 一方法的示图;'图14B是解释用于解决按固定大小嵌入的空间信息位流的时间对准问题的第 二方法的示图;图15是根据本专利技术的用于将空间信息位流附加到下混信号的方法的示图; 图16是根据本专利技术的用于对按不同大小嵌入在下混信号中的空间信息位流编 码的方法的流程图;图17是根据本专利技术的用于对按固定大小嵌入在下混信号中的空间信息位流编 码的方法的流程图;图18是根据本专利技术的将空间信息位流嵌入到被下混在至少一个声道上的音频 信号中的第一方法的示图;图19是根据本专利技术的将空间信息位流嵌入到被下混在至少一个声道上的音频 信号中的第二方法的示图;图20是根据本专利技术的将空间信息位流嵌入到被下混在至少一个声道上的音频 信号中的第三方法的示图;图21是根据本专利技术的将空间信息位流嵌入到被下混在至少一个声道上的音频 信号中的第四方法的示图;图22是根据本专利技术的将空间信息位流嵌入到被下混在至少一个声道上的音频 信号中的第五方法的示图;图23是根据本专利技术的将空间信息位流嵌入到被下混在至少一个声道上的音频 信号中的第六方法的示图;图24是根据本专利技术的将空间信息位流嵌入到被下混在至少一个声道上的音频 信号中的第七方法的示图;图25是根据本专利技术的用于对要嵌入到被所下混在至少一个声道上的音频信号 中的空间信息位流编码的方法的流程图;以及图26是根据本专利技术的用于对要嵌入到被所下混在至少一个声道上的音频信号 中的空间信息位流解码的方法的流程图;具体实施方式现在将具体参照其示例在附图中示出的本专利技术的优选实施例。首先,本专利技术涉及一种将解码音频信号所需的辅助信息嵌入到该音频信号中的装置及其方法。为了解释方便,该音频信号和辅助信息在以下描述中分别用下混信号和空间信息来表示,它们并不对本专利技术作出任何限制。在这种情形中,该音频信号包括PCM信号。图1是用于解释根据本专利技术的人体识别音频信号的空间信息的方法的示图。 参照图1,基于人体能够3维地识别音频信号这一事实,用于多声道音频信号的编码方案利用该音频信号可通过多个参数设置表示为3维空间信息这一事实。 用于表示多声道音频信号的空间信息的空间参数包括CLD (声道电平差异)、ICC (声道间相干性)、CTD (声道时间差异)等。CLD表示两个声道之间的能量差异,ICC表示两个声道之间的相关性,而CTD表示两个声道之间的时间差异。 参照图1对人体如何空间地识别音频信号以及如何产生空间参数的概念进行解释。一直接声波103从远程声源101到达人体的左耳,而另一直接声波102围绕 头部被衍射以到达该人体的右耳106。这两个声波102和103在到达时间和能级上彼此不同。并且,CTD和CLD参 数通过使用这些差异来生成。如果经反射的声波104和105分别到达两个耳朵,或者如果该声源是散布的, 则彼此之间无相关性的声波将分别到达两个耳朵以生成ICC参数。使用根据上述原理所生成的空间参数,能够将多声道音频信号作为单声道或 立体声信号来发送并将该信号输出为多声道信号。本专利技术提供了一种将空间信息—即空间参数一嵌入在单声道或立体声音本文档来自技高网...

【技术保护点】
一种解码音频信号的方法,包括:    提取嵌入在所述音频信号中的辅助信息,其中所述辅助信息是对应于所述音频信号的至少一个声道来散布的;以及    使用所述辅助信息来解码所述音频信号。

【技术特征摘要】
【国外来华专利技术】US 2005-5-26 60/684,578;US 2006-1-13 60/758,608;US1.一种解码音频信号的方法,包括提取嵌入在所述音频信号中的辅助信息,其中所述辅助信息是对应于所述音频信号的至少一个声道来散布的;以及使用所述辅助信息来解码所述音频信号。2. 如权利要求l所述的方法,其特征在于,所述辅助信息按块单元嵌入在所述音频信号的插入区中。3. 如权利要求2所述的方法,其特征在于,所述插入区中的所述辅助信息是 按样本平面次序或位平面次序来嵌入的。4. 如权利要求3所述的方法,其特征在于,所述插入区中的所述辅助信息是 自MSB (最高有效位)或LSB (最低有效位)起被嵌入的。5. 如权利要求2所述的方法,其特征在于,所述辅助信息是通过交替声道来 嵌入在所述插入区中的。6. 如权利要求l所述的方法,其特征在于,还包括从所述音频信号的一个声 道提取所述辅助信息的同步信息。7. 如权利要求l所述的方法,其特征在于,所述提取辅助信息包括按样本单 元提取所述辅助信息直至所述辅助信息的插入帧末端。8. 如权利要求8所述的方法,其特征在于,所述辅助信息以相同值或具有相 反正负号的值被反复插入到具有至少两个声道的所述音频信号中。9. 如权利要求l所述的方法,其特征在于,所述辅助信息的标头按位平面次 序被嵌入在具有至少一个声道的所述音频信号中,并且其中,除所述标头以外的区 域按样本平面次序被嵌入。10. 如权利要求1所述的方法,其特征在于,还包括从所述辅助信息的标头 提取所述辅助信息的插入位长度。11. 如权利要求1所述的方法,其特征在于,所述音频信号包括多声道信号 的下混音信号。12. 如权利要求1所述的方法,其特征在于,所述辅助信息包括多声道信号 的空间信息。13. —种编码音频信号的方法,包括生成用于解...

【专利技术属性】
技术研发人员:吴贤午郑亮源房熙锡金东秀林宰显
申请(专利权)人:LG电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1