声场的经分解表示中的误差的补偿制造技术

技术编号:12739845 阅读:48 留言:0更新日期:2016-01-21 01:22
大体来说,本发明专利技术描述用于补偿声场的经分解表示中的误差的技术。根据所述技术,一种包括一或多个处理器的装置可经配置以量化表示声场的一或多个分量的一或多个第一向量,且补偿归因于所述一或多个第一向量的所述量化而在也表示所述声场的相同一或多个分量的一或多个第二向量中引入的误差。

【技术实现步骤摘要】
【国外来华专利技术】声场的经分解表示中的误差的补偿本申请案主张以下美国临时申请案的权益:2013年5月29日申请的第61/828,445号美国临时申请案、2013年5月31日申请的第61/829,791号美国临时申请案、2013年11月1日申请的第61/899,034号美国临时申请案、2013年11月1日申请的第61/899,041号美国临时申请案、2013年5月30日申请的第61/829,182号美国临时申请案、2013年5月30日申请的第61/829,174号美国临时申请案、2013年5月30日申请的第61/829,155号美国临时申请案、2014年1月30日申请的第61/933,706号美国临时申请案、2013年5月31日申请的第61/829,846号美国临时申请案、2013年10月3日申请的第61/886,605号美国临时申请案、2013年10月3日申请的第61/886,617号美国临时申请案、2014年1月8日申请的第61/925,158号美国临时申请案、2014年1月30日申请的第61/933,721号美国临时申请案、2014年1月8日申请的第61/925,074号美国临时申请案、2014年1月8日申请的第61/925,112号美国临时申请案、2014年1月8日申请的第61/925,126号美国临时申请案、2014年5月27日申请的第62/003,515号美国临时申请案,以及2013年5月29日申请的第61/828,615号美国临时申请案,以上美国临时申请案中的每一者的全部内容以引用的方式并入本文中。
本专利技术涉及音频数据,并且更具体来说涉及音频数据的压缩。
技术介绍
高阶立体混响(HOA)信号(常由多个球谐系数(SHC)或其它阶层式元素表示)是声场的三维表示。此HOA或SHC表示可以独立于用以重放从此SHC信号再现的多通道音频信号的局部扬声器几何布置的方式来表示此声场。此SHC信号还可促进向后兼容性,因为可将此SHC信号再现为众所周知的且被广泛采用的多通道格式(例如,5.1音频通道格式或7.1音频通道格式)。SHC表示因此可实现对声场的更好表示,其也适应向后兼容性。
技术实现思路
一般来说,描述了用于较高阶立体混响音频数据的压缩及解压缩的技术。在一个方面中,一种方法包括获得描述声场的相异分量的一或多个第一向量及描述所述声场的背景分量的一或多个第二向量,所述一或多个第一向量及所述一或多个第二向量两者是至少通过相对于多个球谐系数执行变换而产生。在另一方面中,一种装置包括一或多个处理器,所述一或多个处理器经配置以确定描述声场的相异分量的一或多个第一向量及描述所述声场的背景分量的一或多个第二向量,所述一或多个第一向量及所述一或多个第二向量两者是至少通过相对于多个球谐系数执行变换而产生。在另一方面中,一种装置包括:用于获得描述声场的相异分量的一或多个第一向量及描述所述声场的背景分量的一或多个第二向量的装置,所述一或多个第一向量及所述一或多个第二向量都是至少通过相对于多个球谐系数执行变换而产生;及用于存储所述一或多个第一向量的装置。在另一方面中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使一或多个处理器获得描述声场的相异分量的一或多个第一向量及描述所述声场的背景分量的一或多个第二向量,所述一或多个第一向量及所述一或多个第二向量两者是至少通过相对于多个球谐系数执行变换而产生。在另一方面中,一种方法包括:基于表示声场的球谐系数的经压缩版本是否是从合成音频对象产生的指示而选择多个解压缩方案中的一者;及使用所述多个解压缩方案中的选定者解压缩所述球谐系数的经压缩版本。在另一方面中,一种装置包括一或多个处理器,所述一或多个处理器经配置以基于表示声场的球谐系数的经压缩版本是否是从合成音频对象产生的指示而选择多个解压缩方案中的一者,及使用所述多个解压缩方案中的选定者解压缩所述球谐系数的经压缩版本。在另一方面中,一种装置包括:用于基于表示声场的球谐系数的经压缩版本是否是从合成音频对象产生的指示而选择多个解压缩方案中的一者的装置;及用于使用所述多个解压缩方案中的选定者解压缩所述球谐系数的经压缩版本的装置。在另一方面中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使集成解码装置的一或多个处理器基于表示声场的球谐系数的经压缩版本是否是从合成音频对象产生的指示而选择多个解压缩方案中的一者,且使用所述多个解压缩方案中的选定者解压缩所述球谐系数的经压缩版本。在另一方面中,一种方法包括获得表示声场的球谐系数是否是从合成音频对象产生的指示。在另一方面中,一种装置包括经配置以获得表示声场的球谐系数是否是从合成音频对象产生的指示的一或多个处理器。在另一方面中,一种装置包括:用于存储表示声场的球谐系数的装置;及用于获得所述球谐系数是否是从合成音频对象产生的指示的装置。在另一方面中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使一或多个处理器获得表示声场的球谐系数是否是从合成音频对象产生的指示。在另一方面中,一种方法包括:量化表示声场的一或多个分量的一或多个第一向量;及补偿归因于所述一或多个第一向量的量化而在也表示所述声场的相同一或多个分量的一或多个第二向量中引入的误差。在另一方面中,一种装置包括一或多个处理器,所述一或多个处理器经配置以量化表示声场的一或多个分量的一或多个第一向量,且补偿归因于所述一或多个第一向量的量化而在也表示所述声场的相同一或多个分量的一或多个第二向量中引入的误差。在另一方面中,一种装置包括:用于量化表示声场的一或多个分量的一或多个第一向量的装置;及用于补偿归因于所述一或多个第一向量的量化而在也表示所述声场的相同一或多个分量的一或多个第二向量中引入的误差的装置。在另一方面中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使一或多个处理器量化表示声场的一或多个分量的一或多个第一向量,且补偿归因于所述一或多个第一向量的量化而在也表示所述声场的相同一或多个分量的一或多个第二向量中引入的误差。在另一方面中,一种方法包括基于目标位速率相对于多个球谐系数或其分解执行阶数缩减以产生经缩减球谐系数或其经缩减分解,其中所述多个球谐系数表示声场。在另一方面中,一种装置包括一或多个处理器,所述一或多个处理器经配置以基于目标位速率相对于多个球谐系数或其分解执行阶数缩减以产生经缩减球谐系数或其经缩减分解,其中所述多个球谐系数表示声场。在另一方面中,一种装置包括:用于存储多个球谐系数或其分解的装置;及用于基于目标位速率相对于所述多个球谐系数或其分解执行阶数缩减以产生经缩减球谐系数或其经缩减分解的装置,其中所述多个球谐系数表示声场。在另一方面中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令在执行时致使一或多个处理器基于目标位速率相对于多个球谐系数或其分解执行阶数缩减以产生经缩减球谐系数或其经缩减分解,其中所述多个球谐系数表示声场。在另一方面中,一种方法包括获得表示声场的相异分量的向量的系数的第一非零集合,所述向量已从描述声场的多个球谐系数分解。在另一方面中,一种装置包括一或多个处理器,所述一或多个处理器经配置以获得表示声场的相异分量的向量的系本文档来自技高网
...

【技术保护点】
一种方法,其包括:量化表示声场的一或多个分量的一或多个第一向量;以及补偿归因于所述一或多个第一向量的所述量化而在也表示所述声场的所述相同的一或多个分量的一或多个第二向量中引入的误差。

【技术特征摘要】
【国外来华专利技术】2013.05.29 US 61/828,445;2013.05.29 US 61/828,615;1.一种用于处理音频数据的方法,其包括:量化表示声场的一或多个分量的一或多个第一向量,其中所述第一向量从表示所述声场的且在球谐域中界定的多个球谐系数线性分解;以及补偿归因于所述一或多个第一向量的所述量化而在也表示所述声场的所述相同的一或多个分量的一或多个第二向量中引入的误差。2.根据权利要求1所述的方法,其中量化所述一或多个第一向量包括量化来自至少部分通过相对于描述所述声场的所述多个球谐系数执行线性分解而产生的V矩阵的转置的一或多个向量。3.根据权利要求1所述的方法,其进一步包括相对于表示所述声场的所述多个球谐系数执行线性分解以产生表示所述多个球谐系数的左奇异向量的U矩阵、表示所述多个球谐系数的奇异值的S矩阵,和表示所述多个球谐系数的右奇异向量的V矩阵,其中量化所述一或多个第一向量包括量化来自所述V矩阵的转置的一或多个向量。4.根据权利要求1所述的方法,其进一步包括相对于表示所述声场的所述多个球谐系数执行线性分解以产生表示所述多个球谐系数的左奇异向量的U矩阵、表示所述多个球谐系数的奇异值的S矩阵,和表示所述多个球谐系数的右奇异向量的V矩阵,其中量化所述一或多个第一向量包括量化来自所述V矩阵的转置的一或多个向量,且其中补偿所述误差包括在通过将所述U矩阵的一或多个U向量乘以所述S矩阵的一或多个S向量而计算出的一或多个U*S向量中补偿归因于所述量化而引入的所述误差。5.根据权利要求1所述的方法,其进一步包括:相对于表示所述声场的所述多个球谐系数执行线性分解以产生表示所述多个球谐系数的左奇异向量的U矩阵、表示所述多个球谐系数的奇异值的S矩阵,和表示所述多个球谐系数的右奇异向量的V矩阵;确定所述U矩阵的一或多个UDIST向量,其每一者对应于所述声场的相异分量;确定所述S矩阵的一或多个SDIST向量,其每一者对应于所述声场的所述相同的相异分量;以及确定所述V矩阵的转置的一或多个VTDIST向量,其每一者对应于所述声场的所述相同的相异分量,其中量化所述一或多个第一向量包括量化所述一或多个VTDIST向量以产生一或多个VTQ_DIST向量,且其中补偿所述误差包括在通过将所述U矩阵的所述一或多个UDIST向量乘以所述S矩阵的一或多个SDIST向量而计算出的一或多个UDIST*SDIST向量中补偿归因于所述量化而引入的所述误差以便产生一或多个经误差补偿的UDIST*SDIST向量。6.根据权利要求5所述的方法,其中补偿所述误差包括:基于所述一或多个UDIST向量、所述一或多个SDIST向量和所述一或多个VTDIST向量确定相异球谐系数;以及相对于所述VTQ_DIST向量执行伪逆以将所述相异球谐系数除以所述一或多个VTQ_DIST向量,且借此产生至少部分补偿经由所述VTDIST向量的所述量化而引入的所述误差的经误差补偿的一或多个UC_DIST*SC_DIST向量。7.根据权利要求1所述的方法,其进一步包括:相对于表示所述声场的所述多个球谐系数执行线性分解以产生表示所述多个球谐系数的左奇异向量的U矩阵、表示所述多个球谐系数的奇异值的S矩阵,和表示所述多个球谐系数的右奇异向量的V矩阵;确定描述所述声场的一或多个背景分量的所述U矩阵的一或多个UBG向量和描述所述声场的一或多个相异分量的所述U矩阵的一或多个UDIST向量;确定描述所述声场的所述一或多个背景分量的所述S矩阵的一或多个SBG向量和描述所述声场的所述一或多个相异分量的所述S矩阵的一或多个SDIST向量;以及确定所述V矩阵的转置的一或多个VTDIST向量和一或多个VTBG向量,其中所述VTDIST向量描述所述声场的所述一或多个相异分量,且所述VTBG描述所述声场的所述一或多个背景分量,其中量化所述一或多个第一向量包括量化所述一或多个VTDIST向量以产生一或多个VTQ_DIST向量,且其中补偿所述误差包括在通过将所述一或多个UBG向量乘以所述一或多个SBG向量且随后乘以所述一或多个VTBG向量而形成的背景球谐系数中补偿归因于所述量化而引入的所述误差以便产生经误差补偿的背景球谐系数。8.根据权利要求7所述的方法,其中补偿所述误差包括:基于所述VTDIST向量和通过将所述UDIST向量乘以所述SDIST向量而形成的一或多个UDIST*SDIST向量确定所述误差;以及将所述所确定的误差相加到所述背景球谐系数以产生所述经误差补偿的背景球谐系数。9.根据权利要求1所述的方法,其中补偿所述误差包括补偿归因于所述一或多个第一向量的所述量化而在也表示所述声场的所述相同的一或多个分量的一或多个第二向量中引入的所述误差以产生一或多个经误差补偿的第二向量,且其中所述方法进一步包括产生位流以包含所述一或多个经误差补偿的第二向量和所述经量化的一或多个第一向量。10.根据权利要求1所述的方法,其中补偿所述误差包括补偿归因于所述一或多个第一向量的所述量化而在也表示所述声场的所述相同的一或多个分量的一或多个第二向量中引入的所述误差以产生一或多个经误差补偿的第二向量,且其中所述方法进一步包括:对所述一或多个经误差补偿的第二向量进行音频编码;以及产生位流以包含所述经音频编码的一或多个经误差补偿的第二向量和所述经量化的一或多个第一向量。11.一种用于处理音频数据的装置,其包括:一或多个处理器,其经配置以量化表示声场的一或多个分量的一或多个第一向量,其中所述第一向量从表示所述声场的且在球谐域中界定的多个球谐系数线性分解,且补偿归因于所述一或多个第一向量的所述量化而在也表示所述声场的所述相同的一或多个分量的一或多个第二向量中引入的误差。12.根据权利要求...

【专利技术属性】
技术研发人员:D·森N·G·彼得斯
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1