用于编码和解码基于对象的音频信号的方法和装置制造方法及图纸

技术编号:5395066 阅读:126 留言:0更新日期:2012-04-11 18:40
提供了一种音频编码方法和装置以及一种音频解码方法和装置,其中音频信号可以被编码或解码使得对于每一个对象音频信号声像可以被定位于期望的位置。该音频解码方法包括从输入音频信号中提取缩减混音信号和基于对象的边信息;基于输入控制信息生成渲染信息;以及基于该渲染信息和该基于对象的边信息,生成空间信息。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种音频编码方法和装置,以及一种音频解码方法和 装置,其中每一个对象音频信号的声像可被定位于任何希望的位置。
技术介绍
一般来说,在多声道音频编码和解码技术中,多声道信号的多个 声道信号被縮减混音进少数声道信号中,传输关于原始声道信号的边 信息并且恢复具有和原始多声道信号一样多的声道的多声道信号。基于对象的音频编码和解码技术与多声道音频编码和解码技术在 将多个声音源縮减混音进少数声音源信号中,并传输关于原始声音源 的边信息方面是基本上相似的。然而,在基于对象的音频编码和解码 技术中,对象信号,其为声道信号的基本元素(例如乐器的声音或人 的语音),被视为与多声道音频编码和解码技术中的声道信号相同, 并且也可被编/解码。换句话说,在基于对象的音频编码和解码技术中,每个对象信号将被视为编/解码的主体(entities)。在这点上,基于对象的音频编码 和解码技术与多声道音频编码和解码技术是有区别的,该区别在于多 声道音频编/解码是简单的根据声道间信息而被编/解码的,而与要被编 /解码的声道信号中的元素数量无关。
技术实现思路
技术问题本专利技术提供了一种音频编码方法和装置,以及一种音频解码方法 和装置,其中可对音频信号进行编码或解码以使每一个对象音频信号的声像可被定位于任何希望的位置。 技术方案根据本专利技术的一个方面,其提供了一种音频解码方法,包括从 输入音频信号中提取縮减混音信号和基于对象的边信息;基于输入控 制信息生成渲染信息;以及基于该渲染信息和该基于对象的边信息, 生成基于声道的边信息。根据本专利技术的另一个方面,其提供了一种音频解码装置,包括 解复用器,用于从输入音频信号中提取縮减混音信号和基于对象的边 信息;渲染器,用于基于输入控制信息生成渲染信息;以及代码转换器,用于基于该渲染信息和该基于对象的边信息生成基于声道的边信 息。根据本专利技术的另一个方面,其提供了一种计算机可读记录介质, 其上记录了用于执行音频解码方法的计算机程序,该音频解码方法包括从输入音频信号中提取缩减混音信号和基于对象的边信息;基于 输入控制信息生成渲染信息;以及基于该渲染信息和该基于对象的边 信息,生成基于声道的边信息。有益效果提供了一种音频编码方法和装置,以及一种音频解码方法和装置, 其中可对音频信号进行编码或解码以使每一个对象音频信号的声像可 被定位于任何希望的位置。附图说明通过以下的详细描述和附图,本专利技术将变得更加易于理解,附图 只是示例性的,其并不构成对本专利技术的限制,其中图1是典型的基于对象的音频编码/解码系统的方框图; 图2是根据本专利技术第一实施例的音频解码装置的方框图;图3是根据本专利技术第二实施例的音频解码装置的方框图4用于解释幅度差和时间差对于声像定位的影响,其是相互独立的;图5是关于幅度差和时间差之间的对应关系的函数图,其中该幅度差和时间差是将声像定位于预定位置所需要的; 图6表示包括谐波信息的控制数据的格式; 图7是根据本专利技术第三实施例的音频解码装置的方框图; 图8是可被应用于如图7所示的音频解码装置中的艺术縮减混音增益(ADG)模块的方框图9是根据本专利技术第四实施例的音频解码装置的方框图; 图IO是根据本专利技术第五实施例的音频解码装置的方框图11是根据本专利技术第六实施例的音频解码装置的方框图12是根据本专利技术第七实施例的音频解码装置的方框图; 图13是根据本专利技术第八实施例的音频解码装置的方框图; 图14是用于解释由图13所示的音频解码装置使用于帧的三维(3D)信息的应用的框图15是根据本专利技术第九实施例的音频解码装置的方框图; 图16是根据本专利技术第十实施例的音频解码装置的方框图17-19是用于解释根据本专利技术一个实施例的音频解码方法的框图20是根据本专利技术一个实施例的音频编码装置的方框图。实施本专利技术的最佳模式现在将参考附图来详细说明本专利技术,在附图中已表示了本专利技术的 示例性实施例。根据本专利技术的一种音频编码方法和装置以及一种音频解码方法和 装置可被应用于基于对象的音频处理操作,但是本专利技术并不限于此。 换句话说,该音频编码方法和装置以及音频解码方法和装置还可被应 用于基于对象的音频处理操作之外的各种信号处理操作。7图1是典型的基于对象的音频编码/解码系统的方框图。通常来说, 输入给基于对象的音频编码装置的音频信号与多声道信号的声道是不 对应的,这些音频信号是独立的对象信号。在这点上,基于对象的音 频编码装置与多声道音频编码装置是不同的,其区别在于多声道音频 编码装置输入多声道信号的声道信号。举例来说,诸如5.1声道信号的左前声道信号和右前声道信号之 类的声道信号被输入到多声道音频编码装置中,然而诸如人语音或乐 器声音(例如小提琴或钢琴的声音)之类的比声道信号小的主体的对 象音频信号可被输入到基于对象的音频编码装置中。参见图1,该基于对象的音频编码/解码系统包括基于对象的音 频编码装置和基于对象的音频解码装置。基于对象的音频编码装置包括对象编码器100,基于对象的音频解码装置包括对象解码器111和渲 染器113。对象编码器100接收N个对象音频信号,并且生成带有一个或多 个声道的基于对象的縮减混音信号和边信息,上述边信息包括从N个 对象音频信号中提取的多条信息片,例如能量差,相位差和相关性值。 边信息和基于对象的縮减混音信号被合并入一个单一比特流中,并且 该比特流被传输给基于对象的解码装置。边信息可包括指示是否执行基于声道的音频编/解码或基于对象 的音频编/解码的标志,贝ij,可以根据边信息的标志来确定是执行基于 声道的音频编/解码还是执行基于对象的音频编/解码。边信息还可包括 关于对象信号的包络信息、分组信息、静止期信息和延迟信息。边信 息还可包括对象电平差信息、对象间互相关信息、缩减混音增益信息、 縮减混音声道电平差信息和绝对对象能量信息。对象解码器111接收来自基于对象音频编码装置的基于对象的缩 减混音信号和边信息,并且根据基于对象的縮减混音信号和边信息来恢复具有与N个对象音频信号相似属性的对象信号。由对象解码器111生成的对象信号并没有被分配给多声道空间中的任何位置。因此渲染器113将由对象解码器111生成的对象信号的每一个分配给多声道空 间中的预定位置,并且渲染器113确定对象信号的电平,这样可通过 由渲染器113指定的各个相应位置和由渲染器113确定的各个相应电 平来再现对象信号。与由对象解码器111生成的每个对象信号相关的 控制信息可随时间而改变,贝IJ,由对象解码器111生成的对象信号的 电平和空间位置可根据控制信号而改变。图2是根据本专利技术第一实施例的音频解码装置120的方框图。参 见图2,该音频解码装置120包括对象解码器121,渲染器123,和 参数变换器125。该音频解码装置120还包括解复用器(未示出),用 于从输入的比特流中提取缩减混音信号和边信息,并且该解复用器将 应用于根据本专利技术的其它实施例的所有音频解码装置中。对象解码器121根据縮减混音信号和由参数变换器125提供的修 改后的边信息来生成多个对象信号。渲染器123将由对象解码器121 生成的对象信号的每一个分配到多声道空间中的预定位置,并且根据 控制信息来确定由对象解码器121生成的对象信号的电平。参数变换 器125通过组合边信息和控制信息本文档来自技高网...

【技术保护点】
一种音频解码方法,其包括: 从输入音频信号中提取缩减混音信号和基于对象的边信息; 基于输入控制信息生成渲染信息;以及 基于所述渲染信息和所述基于对象的边信息,生成基于声道的边信息。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:房熙锡金东秀李显国林宰显尹圣龙
申请(专利权)人:LG电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1