指示用于译码向量的帧参数可重用性制造技术

技术编号:13632627 阅读:28 留言:0更新日期:2016-09-02 14:35
一般来说,本发明专利技术描述指示用于解码向量的帧参数可重用性的技术。包括处理器及存储器的装置可执行所述技术。所述处理器可经配置以获得包括表示球谐域中的正交空间轴线的向量的位流。所述位流可进一步包括关于是否重用来自前一帧的指示在压缩所述向量时使用的信息的至少一语法元素的指示符。所述存储器可经配置以存储所述位流。

【技术实现步骤摘要】
【国外来华专利技术】本申请案主张以下各美国临时申请案的权利:2014年1月30日申请的标题为“声场的经分解表示的压缩(COMPRESSION OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD)”的第61/933,706号美国临时申请案;2014年1月30日申请的标题为“声场的经分解表示的压缩(COMPRESSION OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD)”的第61/933,714号美国临时申请案;2014年1月30日申请的标题为“指示用于解码空间向量的帧参数可重用性(INDICATING FRAME PARAMETER REUSABILITY FOR DECODING SPATIAL VECTORS)”的第61/933,731号美国临时申请案;2014年3月7日申请的标题为“用于球谐系数的立即播出帧(IMMEDIATE PLAY-OUT FRAME FOR SPHERICAL HARMONIC COEFFICIENTS)”的第61/949,591号美国临时申请案;2014年3月7日申请的标题为“声场的经分解表示的淡入/淡出(FADE-IN/FADE-OUT OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD)”的第61/949,583号美国临时申请案;2014年5月16日申请的标题为“译码经分解高阶立体混响(HOA)音频信号的V-向量(CODING V-VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS(HOA)AUDIO SIGNAL)”的第61/994,794号美国临时申请案;2014年5月28日申请的标题为“指示用于解码空间向量的帧参数可重用性(INDICATING FRAME PARAMETER REUSABILITY FOR DECODING SPATIAL VECTORS)”的第62/004,147号美国临时申请案;2014年5月28日申请的标题为“用于球谐系数的立即播出帧及声场的经分解表示的淡入/淡出(IMMEDIATE PLAY-OUT FRAME FOR SPHERICAL HARMONIC COEFFICIENTS AND FADE-IN/FADE-OUT OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD)”的第62/004,067号美国临时申请案;2014年5月28日申请的标题为“译码经分解高阶立体混响(HOA)音频信号的V-向量(CODING V-VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS(HOA)AUDIO SIGNAL)”的第62/004,128号美国临时申请案;2014年7月1日申请的标题为“译码经分解高阶立体混响(HOA)音频信号的V-向量(CODING V-VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS(HOA)AUDIO SIGNAL)”的第62/019,663号美国临时申请案;2014年7月22日申请的标题为“译码经分解高阶立体混响(HOA)音频信号的V-向量(CODING V-VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS(HOA)AUDIO SIGNAL)”的第62/027,702号美国临时申请案;2014年7月23日申请的标题为“译码经分解高阶立体混响(HOA)音频信号的V-向量(CODING V-VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS(HOA)AUDIO SIGNAL)”的第62/028,282号美国临时申请案;2014年7月25日申请的标题为“用于球谐系数的立即播出帧及声场的经分解表示的淡入/淡出(IMMEDIATE PLAY-OUT FRAME FOR SPHERICAL HARMONIC COEFFICIENTS AND FADE-IN/FADE-OUT OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD)”的第62/029,173号美国临时申请案;2014年8月1日申请的标题为“译码经分解高阶立体混响(HOA)音频信号的V-向量(CODING V-VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS(HOA)AUDIO SIGNAL)”的第62/032,440号美国临时申请案;2014年9月26日申请的标题为“高阶立体混响(HOA)音频信号的切换式V-向量量化(SWITCHED V-VECTOR QUANTIZATION OF A HIGHER ORDER AMBISONICS(HOA)AUDIO SIGNAL)”的第62/056,248号美国临时申请案;及2014年9月26日申请的标题为“经分解高阶立体混响(HOA)音频信号的预测性向量量化(PREDICTIVE VECTOR QUANTIZATION OF A DECOMPOSED HIGHER ORDER AMBISONICS(HOA)AUDIO SIGNAL)”的第62/056,286号美国临时申请案;及2015年1月12日申请的标题为“环境高阶立体混响系数的转变(TRANSITIONING OF AMBIENT HIGHER-ORDER AMBISONIC COEFFICIENTS)”的第62/102,243号美国临时申请案,前述所列各美国临时申请案中的每一者以引用的方式并入本文中,如同在其相应全文中所阐述般。
本专利技术涉及音频数据,且更具体来说,涉及高阶立体混响音频数据的译码。
技术介绍
高阶立体混响(HOA)信号(常由多个球谐系数(SHC)或其它阶层元素表示)是声场的三维表示。HOA或SHC表示可按独立于用以重放从SHC信号呈现的多信道音频信号的局部扬声器几何布置的方式来表示声场。SHC信号还可促进向后兼容性,因为可将SHC信号呈现为众所周知的且被广泛采用的多信道格式(例如,5.1音频信道格式或7.1音频信道格式)。SHC表示因此可实现对声场的更好表示,其也适应向后兼容性。
技术实现思路
一般来说,描述译码高阶立体混响音频数据的技术。高阶立体混响音频数据可包括对应于具有大于一的阶数的球谐基函数的至少一球谐系数。在一方面,一种有效率的位使用方法包括获得包括表示球谐域中的正交空间轴线的向量的位流。所述位流进一步包括关于是否重用来自前一帧的指示在压缩所述向量时使用的信息的至少一语法元素的指示符。在另一方面,一种经配置以执行有效率的位使用的装置包括一或多个处理器,所述一或多个处理器经配置以获得包括表示球谐域中的正交空间轴线的向量的位流。所述位流进一步包括关于是否重用来自前一帧的指示在压缩所述向量时使用的信息的至少一语法元素的指示符。所述装置也包括经配置以存储所述位流的存储器。在另一方面,一种经配置以执行有效率的位使用的装置包括用于获得包括表示球谐域中的本文档来自技高网
...

【技术保护点】
一种有效率的位使用方法,所述方法包括:获得包括表示球谐域中的正交空间轴线的向量的位流,其中所述位流进一步包括关于是否重用来自前一帧的指示在压缩所述向量时使用的信息的至少一语法元素的指示符。

【技术特征摘要】
【国外来华专利技术】2014.01.30 US 61/933,706;2014.01.30 US 61/933,714;1.一种有效率的位使用方法,所述方法包括:获得包括表示球谐域中的正交空间轴线的向量的位流,其中所述位流进一步包括关于是否重用来自前一帧的指示在压缩所述向量时使用的信息的至少一语法元素的指示符。2.根据权利要求1所述的方法,其中所述指示符包括指示在压缩所述向量时使用的量化模式的语法元素的一或多个位。3.根据权利要求2所述的方法,其中当经设定为零值时,所述语法元素的所述一或多个位指示重用来自所述前一帧的所述至少一语法元素。4.根据权利要求2所述的方法,其中所述量化模式包括向量量化模式。5.根据权利要求2所述的方法,其中所述量化模式包括无霍夫曼译码的纯量量化模式。6.根据权利要求2所述的方法,其中所述量化模式包括具有霍夫曼译码的纯量量化模式。7.根据权利要求2所述的方法,其中所述语法元素的部分包含所述语法元素的最高有效位及所述语法元素的次高有效位。8.根据权利要求1所述的方法,其中来自所述前一帧的所述语法元素包括指示在压缩所述向量时使用的预测模式的语法元素。9.根据权利要求1所述的方法,其中来自所述前一帧的所述语法元素包括指示在压缩所述向量时使用的霍夫曼表的语法元素。10.根据权利要求1所述的方法,其中来自所述前一帧的所述语法元素包括指示类别识别符的语法元素,所述类别识别符识别所述向量所对应的压缩类别。11.根据权利要求1所述的方法,其中来自所述前一帧的所述语法元素包括指示所述向量的元素为正值还是负值的语法元素。12.根据权利要求1所述的方法,其中来自所述前一帧的所述语法元素包括指示在压缩所述向量时使用的码向量的数目的语法元素。13.根据权利要求1所述的方法,其中来自所述前一帧的所述语法元素包括来自所述前一帧的指示在压缩所述向量时使用的向量量化码簿的语法元素。14.根据权利要求1所述的方法,其中所述向量的所述经压缩版本在所述位流中是至少部分地使用霍夫曼码表示,所述霍夫曼码用以表示所述向量的元素的残余值。15.根据权利要求1所述的方法,其进一步包括:分解高阶立体混响音频数据以获得所述向量;及在所述位流中指定所述向量以获得所述位流。16.根据权利要求1所述的方法,其进一步包括:从所述位流获得对应于所述向量的音频对象;及组合所述音频对象与所述向量以重建构高阶立体混响音频数据。17.根据权利要求1所述的方法,其中所述向量的所述压缩包含所述向量的量化。18.一种经配置以执行有效率的位使用的装置,所述装置包括:一或多个处理器,其经配置以获得包括表示球谐域中的正交空间轴线的向量的位流,其中所述位流进一步包括关于是否重用来自前一帧的指示在压缩所述向量时使用的信息的至少一语法元素的指示符;及存储器,其经配置以存储所述位流。19.根据权利要求18所述的装置,其中所述指示符包括指示在压缩所述向量时使用的量化模式的语法元素的一或多个位。20.根据权利要求19所述的装置,其中当经设定为零值时,所述语法元素的所述一或多个位指示重用来自所述前一帧的所述至少一语法元素。21.根据权利要求19所述的装置,其中所述量化模式包括向量量化模式。22.根据权利要求19所述的装置,其中所述量化模式包括无霍夫曼译码的纯量量化模式。23.根据权利要求19所述的装置,其中所述量化模式包括具有霍夫曼译码的纯量量化模式。24.根据权利要求19所述的装置,其中所述语法元素的部分包含所述语法元素的最高有效位及所述语法元素的次高有效位。25.根据权利要求18所述的装置,其中来自所述前一帧的所述语法元素包括指示在压缩所述向量时使用的预测模式的语法元素。26.根据权利要求18所述的装置,其中来自所述前一帧的所述语法元素包括指示在压缩所述向量时使用的霍夫曼表的语法元素。27.根据权利要求18所述的装置,其中来自所述前一帧的所述语法元素包括指示类别识别符的...

【专利技术属性】
技术研发人员:N·G·彼得斯D·森
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1