用于编码和解码基于对象的音频信号的方法和装置制造方法及图纸

技术编号:5404819 阅读:166 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种用于编码和解码基于对象的音频信号的方法和装置。该音频解码方法包括:从音频信号中提取音乐对象基于声道被编码的第一音频信号和第一音频参数,和提取嗓音对象基于对象被编码的第二音频信号和第二音频参数;通过利用第一和第二音频信号中的至少一个来生成第三音频信号,并且通过利用第一和第二音频参数中的至少一个和第三音频信号来生成多声道音频信号。从而,可有效减少编码和解码处理的计算量以及被编码的比特流的大小。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于编码和解码基于对象的音频信号的音频编码 和解码方法及装置,使得音频信号可通过分组得到有效的处理。
技术介绍
一般来说,基于对象的音频编/解码采用一种方法,该方法发送从 每个对象信号中提取出的特定参数之和以及对象信号,从中恢复各个 对象信号,并且混音对象信号以得到期望声道数。贝U,当对象信号的 数量很多时,混音各个对象信号所需的信息量也随着对象信号的数量 而增长。然而,在具有紧密关联的对象信号中,对于每一个对象信号,发 送相似的混音信息及类似信息。从而,如果对象信号被打包到一个组 中,则相同的信息就只被发送一次,于是提高了效率。在一般的编码和解码方法中,通过将多个对象信号打包到一个对 象信号中可以获得相同的效果。然而,如果使用该方法,增加了对象 信号的单位,并且也无法作为打包前的原始对象信号单元来混音对象 信号。
技术实现思路
技术问题从而,本专利技术的一个目的是提供一种用于编码和解码对象信号的 音频编码和解码方法及其装置,其中有关联的对象音频信号被打包进 一个组中,并且可以基于每个组进行处理。6技术方案为了实现目的,根据本专利技术的音频信号解码方法包括从音频信 号中提取音乐对象基于声道被编码的第一音频信号和第一音频参数, 并提取嗓音对象基于对象被编码的第二音频信号和第二音频参数;通 过利用该第一和第二音频信号中的至少一个来生成第三音频信号;和 通过利用该第一和第二音频参数中的至少一个以及该第三音频信号来 生成多声道音频信号。进一步,为了实现上述目的,根据本专利技术的音频解码方法包括步 骤接收縮减混音信号;从该縮减混音信号中提取包含嗓音对象的音 乐对象被编码的第一音频信号,并提取嗓音对象被编码的第二音频信 号;根据该第一和第二音频信号生成仅包括嗓音对象的音频信号、包 括嗓音对象的音频信号和不包括嗓音对象的音频信号中的任何一个。同时,根据本专利技术的音频信号解码装置包括解复用器,用于从 接收到的比特流中提取縮减混音信号和边信息;对象解码器,用于通 过利用从该縮减混音信号中提取的音乐对象基于声道被编码的第一音 频信号和从该縮减混音信号中提取的嗓音对象基于对象被编码的第二 音频信号中的至少一个来生成第三音频信号;和多声道解码器,用于 通过利用从该边信息中所提取出的第一音频参数和第二音频参数中的 至少一个和该第三音频信号来生成多声道音频信号。进一步,根据本专利技术的音频解码装置包括对象解码器,用于根 据从縮减混音信号中提取的音乐对象被编码的第一音频信号和从縮减 混音信号中提取的嗓音对象被编码的第二音频信号,来生成仅包括嗓 音对象的音频信号、包括嗓音对象的音频信号和不包括嗓音对象的音 频信号中的任何一个;和多声道解码器,用于通过利用从该对象解码 器中输出的信号来生成多声道音频信号。进一步,根据本专利技术的音频编码方法包括步骤生成音乐对象基于声道被编码的第一音频信号和相应于该音乐对象的第一音频参数; 生成嗓音对象基于对象被编码的第二音频信号和相应于该嗓音对象的 第二音频参数;和生成包括该第一和第二音频信号以及该第一和第二 音频参数的比特流。根据本专利技术,其提供了一种音频编码装置包括多声道编码器, 用于生成音乐对象基于声道被编码的第一音频信号和关于该音乐对象 的基于声道的第一音频参数;对象编码器,用于生成嗓音对象基于对象被编码的第二音频信号和关于该嗓音对象的基于对象的第二音频参 数;和复用器,用于生成包括该第一和第二音频信号以及该第一和第 二音频参数的比特流。为实现上述方面,本专利技术提供一种计算机可读记录介质,其中记 录有用于执行上述方法的程序。有益效果根据本专利技术,有关联的对象音频信号可按组被处理,同时最大可 能地利用了基于对象的音频信号的编码和解码的优点。从而,提高了 编码和解码处理中的计算量,被编码的比特流的大小等方面的效率。 进一步,通过将对象信号打包到一个音乐对象、嗓音对象中,本专利技术 可被有效应用到卡拉OK系统等。附图说明图1是根据本专利技术第一实施例的音频编码和解码装置的方框图2是根据本专利技术第二实施例的音频编码和解码装置的方框图3是表示声音源、组和对象信号之间的关系的示意图4是根据本专利技术第三实施例的音频编码和解码装置的方框图5和图6是表示主对象和背景对象的示意图7和图8是表示在编码装置中生成的比特流的结构示意图9是根据本专利技术第四实施例的音频编码和解码装置的方框图;图IO是表示使用多个主对象的例子的示意图11是根据本专利技术第五实施例的音频编码和解码装置的方框图; 图12是根据本专利技术第六实施例的音频编码和解码装置的方框图; 图13是根据本专利技术第七实施例的音频编码和解码装置的方框图; 图14是根据本专利技术第八实施例的音频编码和解码装置的方框图; 图15是根据本专利技术第九实施例的音频编码和解码装置的方框图; 图16是表示逐步编码嗓音对象的例子的示意图。实施本专利技术的最佳模式现在将参照附图来详细描述本专利技术。图1是根据本专利技术第一实施例的音频编码和解码装置的方框图。 根据本实施例的音频解码和编码装置根据分组的概念来解码并编码相 应于基于对象的音频信号的对象信号。换句话说,通过将有关联的一 个或多个对象信号打包到一个相同的组中,基于每个组来执行编码和 解码。参见图1,其表示包括对象编码器111的音频编码装置110,及包 括对象解码器121和混音器/渲染器123的音频解码装置120。虽然未 在图中示出,编码装置110可包括复用器等,用于生成縮减混音信号 和边信息所组成的比特流,并且解码装置120可包括解复用器等,用 于从接收到的比特流中提取縮减混音信号和边信息。稍后将描述根据 其它实施例的具有该结构的编码和解码装置。编码装置IIO接收N个对象信号和有关联的对象信号的基于每个 组的的组信息,该组信息包括有关位置信息、大小信息、时间标志信 息等。编码装置110编码在其中有关联的对象信号被分组在一起的信 号,并且生成具有一个或多个声道的基于对象的縮减混音信号和包括 从每个对象信号提取出的信息的边信息等。在解码装置120中,对象解码器121根据缩减混音信号和边信息 来生成基于分组被编码的信号,并且混音器/渲染器123根据控制信息 将从对象解码器121中输出的信号以特定电平放置于多声道空间中的 特定位置。也就是说,解码装置120生成多声道信号,而不会对以分 组为基础编码的信号重新以对象为基础进行解包。根据这种结构,通过分组和编码具有时间上的相同的位置改变、 大小改变、延迟改变等的对象,可减少需要被传输的信息量。进一步, 如果对象信号被分组,可传输关于一个组的共用边信息,所以可以容 易地控制属于相同组的多个对象信号。图2是根据本专利技术第二实施例的音频编码和解码装置的方框图。 根据该实施例的音频信号解码装置140与第一实施例不同,其区别在 于音频信号解码装置140进一步包括对象提取器143。换句话说,编码装置130、对象解码器141、和混音器/渲染器145 具有与第一实施例相同的功能和结构。然而,因为解码装置140进一 步包括对象提取器143,当必须解包对象单元时,相应对象信号所属的 一个组可以对象为单位被解包。在这种情况下,不会以对象为单位被 解包,而只对不可能以组为单位进行混音的组提取对象信号。图3是表示声音源、组和对象信号之间的关系的示意图。如本文档来自技高网...

【技术保护点】
一种音频解码方法,其包括, 从音频信号中提取音乐对象基于声道被编码的第一音频信号和第一音频参数,并提取嗓音对象基于对象被编码的第二音频信号和第二音频参数; 通过利用所述第一和第二音频信号中的至少一个来生成第三音频信号;和  通过利用所述第一和第二音频参数中的至少一个以及所述第三音频信号来生成多声道音频信号。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:尹圣龙房熙锡李显国金东秀林宰显
申请(专利权)人:LG电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1