用于高阶立体环绕声的音频数据的分层中间压缩制造技术

技术编号：22889648 阅读：37 留言：0更新日期：2019-12-21 09:25

一般来说，描述用于执行高阶立体环绕声HOA的音频数据的分层中间压缩的技术。包括存储器及处理器的装置可经配置以执行所述技术。所述存储器可存储所述HOA音频数据的HOA系数。所述处理器可将所述HOA系数分解成主要声音分量及对应空间分量。所述空间分量可表示所述主要声音分量的方向、形状及宽度，且定义于球谐域中。所述处理器可在符合中间压缩格式的位流中指定所述HOA系数的表示环境分量的子集。所述处理器还可在所述位流中且无关于对用以在所述位流中指定所述空间分量的环境声道的最小数目及元素的数目的确定指定所述空间分量的所有元素。

Layered intermediate compression of audio data for high-order surround sound

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于高阶立体环绕声的音频数据的分层中间压缩本申请案要求2017年5月18日提交的标题为“用于高阶立体环绕声的音频数据的分层中间压缩(LAYEREDINTERMEDIATECOMPRESSIONFORHIGHERORDERAMBISONICAUDIODATA)”的美国临时申请案第62/508,097号的权益，所述申请案的全部内容以全文引用的方式并入本文中。
本公开涉及音频数据，且更特定地说，涉及音频数据的压缩。
技术介绍
高阶立体环绕声(HOA)信号(常由多个球谐系数(SHC)或其它阶层元素表示)为音场的三维(3D)表示。HOA或SHC表示可以独立于用以播放从此SHC信号显现的多声道音频信号的局部扬声器几何布置的方式来表示此音场。SHC信号还可促进回溯相容性，这是因为可将SHC信号显现为熟知且被高度采用的多声道格式(例如，5.1音频声道格式或7.1音频声道格式)。SHC表示因此可实现对音场的更好表示，其还适应回溯相容性。
技术实现思路
大体而言，描述用于高阶立体环绕声的音频数据的夹层压缩的技术。高阶立体环绕声的音频数据可包括对应于具有高于一的阶数的球谐基底函数的至少一个球谐系数，且在一些实例中，包括对应于具有高于一的阶数的多个球谐基底函数的多个球谐系数。在一个实例中，一种经配置以压缩表示音场的高阶立体环绕声的音频数据的装置包括：存储器，其经配置以存储高阶立体环绕声的音频数据的高阶立体环绕声系数；及一或多个处理器，其经配置以：将高阶立体环绕声系数分解成主要声音分量及对应空间分量，所述对...

【技术保护点】
1.一种经配置以压缩表示音场的高阶立体环绕声的音频数据的装置，所述装置包括：/n存储器，其经配置以存储所述高阶立体环绕声的音频数据的高阶立体环绕声系数；及/n一或多个处理器，其经配置以执行以下操作：/n将所述高阶立体环绕声系数分解成主要声音分量及对应空间分量，所述对应空间分量表示所述主要声音分量的方向、形状及宽度，且定义于球谐域中；/n在符合中间压缩格式的位流中指定所述高阶立体环绕声系数的表示所述音场的环境分量的子集；及/n在所述位流中且无关于对用以在所述位流中指定所述空间分量的环境声道的最小数目及元素的数目的确定指定所述空间分量的所有元素。/n

【技术特征摘要】
【国外来华专利技术】20170518 US 62/508,097;20171106 US 15/804,7181.一种经配置以压缩表示音场的高阶立体环绕声的音频数据的装置，所述装置包括：
存储器，其经配置以存储所述高阶立体环绕声的音频数据的高阶立体环绕声系数；及
一或多个处理器，其经配置以执行以下操作：
将所述高阶立体环绕声系数分解成主要声音分量及对应空间分量，所述对应空间分量表示所述主要声音分量的方向、形状及宽度，且定义于球谐域中；
在符合中间压缩格式的位流中指定所述高阶立体环绕声系数的表示所述音场的环境分量的子集；及
在所述位流中且无关于对用以在所述位流中指定所述空间分量的环境声道的最小数目及元素的数目的确定指定所述空间分量的所有元素。

2.根据权利要求1所述的装置，其中所述一或多个处理器经配置以在所述位流中指定所述高阶立体环绕声系数的与具有从零到二的阶数的球基底函数相关联的所述子集。

3.根据权利要求1所述的装置，
其中所述主要声音分量包括第一主要声音分量，
其中所述空间分量包括第一空间分量，
其中所述一或多个处理器经配置以：
将所述高阶立体环绕声系数分解成包含所述第一主要声音分量的多个主要声音分量及包含所述第一空间分量的对应多个空间分量，
在所述位流中指定所述多个空间分量中的四者中的每一者的所有元素，所述多个空间分量中的所述四者包含所述第一空间分量；且
在所述位流中指定所述多个主要声音分量中对应于所述多个空间分量中的所述四者的四者。

4.根据权利要求3所述的装置，其中所述一或多个处理器经配置以：
在所述位流的单侧信息声道中指定所述多个空间分量中的所述四者中的每一者的所有元素；
在所述位流的分离前景声道中指定所述多个主要声音分量中的所述四者中的每一者；且
在所述位流的分离环境声道中指定所述高阶立体环绕声系数的所述子集中的每一者。

5.根据权利要求1所述的装置，其中所述一或多个处理器进一步经配置以在所述位流中且在不对所述高阶立体环绕声系数的所述子集应用解相关的情况下指定所述高阶立体环绕声系数的所述子集。

6.根据权利要求1所述的装置，其中所述中间压缩格式包括夹层压缩格式。

7.根据权利要求1所述的装置，其中所述中间压缩格式包括用于广播网络的音频数据的通信的夹层压缩格式。

8.根据权利要求1所述的装置，
其中所述装置包括经配置以检索空间音频数据的麦克风阵列，且
其中所述一或多个处理器进一步经配置以将所述空间音频数据转换成所述高阶立体环绕声的音频数据。

9.根据权利要求1所述的装置，其中所述一或多个处理器经配置以：
接收所述高阶立体环绕声的音频数据；及
将所述位流输出到发射编码器，所述发射编码器经配置以基于目标位率转码所述位流。

10.根据权利要求1所述的装置，其进一步包括麦克风，所述麦克风经配置以检索表示所述高阶立体环绕声的音频数据的空间音频数据且将所述空间音频数据转换成所述高阶立体环绕声的音频数据。

11.根据权利要求1所述的装置，其中所述装置包括机器人装置。

12.根据权利要求1所述的装置，其中所述装置包括飞行装置。

13.一种压缩表示音场的高阶立体环绕声的音频数据的方法，所述方法包括：
将表示音场的高阶立体环绕声系数分解成主要声音分量及对应空间分量，所述对应空间分量表示所述主要声音分量的方向、形状及宽度，且定义于球谐域中；
在符合中间压缩格式的位流中指定所述高阶立体环绕声系数的表示所述音场的环境分量的子集；及
在所述位流中且无关于对用以在所述位流中指定所述空间分量的环境声道的最小数目及元素的数目的确定指定所述空间分量的所有元素。

14.根据权利要求13所述的方法，其中指定所述高阶立体环绕声系数的所述子集包括在所述位流中指定所述高阶立体环绕声系数的与具...

【专利技术属性】
技术研发人员：金墨永，N·G·彼得斯，D·森，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人