【技术实现步骤摘要】
【国外来华专利技术】用于音频数据的压缩的方法、装置及计算机可读存储媒体本申请案主张以下美国临时申请案的权益:2013年5月29日申请的第61/828,445号美国临时申请案、2013年5月31日申请的第61/829,791号美国临时申请案、2013年11月1日申请的第61/899,034号美国临时申请案、2013年11月1日申请的第61/899,041号美国临时申请案、2013年5月30日申请的第61/829,182号美国临时申请案、2013年5月30日申请的第61/829,174号美国临时申请案、2013年5月30日申请的第61/829,155号美国临时申请案、2014年1月30日申请的第61/933,706号美国临时申请案、2013年5月31日申请的第61/829,846号美国临时申请案、2013年10月3日申请的第61/886,605号美国临时申请案、2013年10月3日申请的第61/886,617号美国临时申请案、2014年1月8日申请的第61/925,158号美国临时申请案、2014年1月30日申请的第61/933,721号美国临时申请案、2014年1月8日申请的第61/925,074号美国临时申请案、2014年1月8日申请的第61/925,112号美国临时申请案、2014年1月8日申请的第61/925,126号美国临时申请案、2014年5月27日申请的第62/003,515号美国临时申请案,以及2013年5月29日申请的第61/828,615号美国临时申请案,以上美国临时申请案中的每一者的全部内容以引用的方式并入本文中。
本专利技术涉及音频数据,并且更具体来说 ...
【技术保护点】
一种方法,其包括:确定待在压缩声场的空间分量时使用的量化步长,所述空间分量是通过相对于多个球谐系数执行基于向量的合成而产生。
【技术特征摘要】
【国外来华专利技术】2013.05.29 US 61/828,615;2013.05.29 US 61/828,445;1.一种用于音频数据的压缩的方法,其包括:通过装置获得描述球谐域中的声场的多个球谐系数;通过所述装置相对于所述多个球谐系数执行线性分解以产生所述声场的空间分量和所述声场的主要声信号,所述空间分量在所述球谐域中定义且表示所述主要声信号的形状、宽度和方向;通过所述装置确定用于表示所述空间分量的位数目的估计值;以及通过所述装置基于所述估计值与目标位速率之间的差确定将在压缩所述空间分量时使用的量化步长;通过所述装置基于所确定的量化步长来压缩所述空间分量以获得所述空间分量的经压缩版本;通过所述装置压缩所述主要声信号以获得所述主要声信号的经压缩版本;通过所述装置产生位流以包括所述空间分量的经压缩版本和所述主要声信号的经压缩版本。2.根据权利要求1所述的方法,其中确定所述量化步长包括:确定所述估计值与所述目标位速率之间的所述差;以及通过将所述差相加到所述目标位速率而确定所述量化步长。3.根据权利要求1所述的方法,其中确定所述位数目的所述估计值包括计算在给定对应于所述目标位速率的码簿的情况下将针对所述空间分量产生的所述位数目的所述估计值。4.根据权利要求1所述的方法,其中确定所述位数目的所述估计值包括计算在给定压缩所述空间分量时使用的译码模式的情况下将针对所述空间分量产生的所述位数目的所述估计值。5.根据权利要求1所述的方法,其中确定所述位数目的所述估计值包括:计算在给定压缩所述空间分量时将使用的第一译码模式的情况下将针对所述空间分量产生的所述位数目的第一估计值;计算在给定压缩所述空间分量时将使用的第二译码模式的情况下将针对所述空间分量产生的所述位数目的第二估计值;选择所述第一估计值和所述第二估计值中的具有最少位数目的一者以用作所述位数目的所确定的估计值。6.根据权利要求1所述的方法,其中确定所述位数目的所述估计值包括:识别识别所述空间分量所对应的类别的类别识别符;识别在压缩对应于所述类别的所述空间分量时将产生的所述空间分量的残余值的位长度;以及通过至少部分地将用于表示所述类别识别符的位数目相加到所述残余值的所述位长度而确定所述位数目的所述估计值。7.根据权利要求1所述的方法,其进一步包括选择多个码簿中的将在压缩所述空间分量时使用的一者。8.根据权利要求7所述的方法,其中确定所述估计值包括使用所述多个码簿中的每一者确定用于表示所述空间分量的所述位数目的相应估计值;以及选择所述多个码簿中的一者包括选择所述多个码簿中的产生具有最少位数目的所确定的估计值的所述一者。9.根据权利要求7所述的方法,其中确定所述估计值包括使用所述多个码簿中的一或多者确定用于表示所述空间分量的位数目的所述估计值,所述多个码簿中的所述一或多者是基于所述空间分量的待压缩的元素相对于所述空间分量的其它元素的阶数而选择。10.根据权利要求7所述的方法,其中确定所述估计值包括使用所述多个码簿中的经设计以在所述空间分量并非从后续空间分量预测时将使用的一者来确定用于表示所述空间分量的位数目的估计值。11.根据权利要求7所述的方法,其中确定所述估计值包括使用所述多个码簿中的经设计以在所述空间分量是从后续空间分量预测时将使用的一者来确定用于表示所述空间分量的位数目的所述估计值。12.根据权利要求7所述的方法,其中确定所述估计值包括使用所述多个码簿中的经设计以在所述空间分量表示所述声场中的合成音频对象时将使用的一者来确定用于表示所述空间分量的位数目的所述估计值。13.根据权利要求7所述的方法,其中确定所述估计值包括使用所述多个码簿中的经设计以在所述空间分量表示所述声场中的经记录音频对象时使用的一者来确定用于表示所述空间分量的位数目的所述估计值。14.根据权利要求1所述的方法,进一步包括通过一或多个麦克风来捕获表示所述多个球谐系数的音频信号。15.一种用于音频数据的压缩的装置,其包括:一或多个处理器,其经配置以:获得描述球谐域中的声场的多个球谐系数;相对于所述多个球谐系数执行线性分解以产生所述声场的空间分量和所述声场的主要声信号,所述空间分量在所述球谐域中定义且表示所述主要声信号的形状、宽度和方向;确定用于表示所述空间分量的位数目的估计值;基于所述估计值与目标位速率之间的差确定将在压缩所述空间分量时使用的量化步长;基于所确定的量化步长来压缩所述空间分量以获得所述空间分量的经压缩版本;压缩所述主要声信号以获得...
【专利技术属性】
技术研发人员:迪潘让·森,刘尚忆,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。