一种抗高频空间混叠的3D音频系统及实现方法技术方案

技术编号：24254538 阅读：212 留言：0更新日期：2020-05-23 01:14

本发明专利技术公开了一种抗高频空间混叠的3D音频系统及实现方法。本方法为：1)对于给定的球麦克风阵列，对球面声压进行采样，并对采样的球面声压进行离散球傅里叶变换；其中离散球傅里叶变换的展开阶数不大于截断阶数N；2)根据步骤1)离散球傅里叶变换的展开系数与球面声压展开的真实系数之间的关系得到空间混叠矩阵E；3)通过公式min(||s||

A 3D audio system against high frequency spatial aliasing and its implementation

全部详细技术资料下载

【技术实现步骤摘要】
一种抗高频空间混叠的3D音频系统及实现方法
本专利技术属于3D音频
，具体涉及一种抗高频空间混叠的3D音频系统及实现方法。
技术介绍
3D音频技术主要指在音频回放时为使听者获得相应的空间听感而采用的相关技术。现在普遍采用的立体声或环绕声系统所重建的声像仅具备水平方向上的自由度，无法让声像脱离扬声器所在的平面，还未达到2D规格，与3D空间音频定义相差甚远。由于3D音频技术发展与3D视频技术发展的不对等，导致目前无论是在影院还是在家庭，主流的3D多媒体系统都是采用“3D视频+立体声/环绕声”方案，这种实施方案存在视觉感受和听觉感受不一致的缺陷，导致沉浸感和真实感不足，难以达到身临其境的效果。随着人们对声音真实感和沉浸感要求的不断提高以及虚拟现实相关技术的兴起，3D音频回放逐渐得到了重视。在3D音频回放中，最直接的手段是利用头相关传递函数(HeadRelatedTransferFunction,HRTF)模拟人对于空间中任一方位声源的感知，然而这种方法仅能实现特定方向的音频回放，并且存在前后混淆、头中效应等副作用。其他可行的主流方法有矢量幅度平移(VectorBasedAmplitudePanning,VBAP)，波场合成(WaveFieldSynthsis,WFS)以及Ambisonics，并且基于Ambisonics的3D音频系统以其独特的优势更具发展前景。首先，它具有录制方便的特点，可以做到录制端和重放端各自独立，在录制时不需要考虑重放时扬声器的布局；其次，它还可向下兼容目前现有的立体声，5.1...

【技术保护点】
1.一种抗高频空间混叠的3D音频系统实现方法，其步骤包括：/n1)对于给定的球麦克风阵列，对球面声压进行采样，并对采样的球面声压进行离散球傅里叶变换；其中离散球傅里叶变换的展开阶数不大于截断阶数N；/n2)根据步骤1)离散球傅里叶变换的展开系数

【技术特征摘要】
1.一种抗高频空间混叠的3D音频系统实现方法，其步骤包括：
1)对于给定的球麦克风阵列，对球面声压进行采样，并对采样的球面声压进行离散球傅里叶变换；其中离散球傅里叶变换的展开阶数不大于截断阶数N；
2)根据步骤1)离散球傅里叶变换的展开系数与球面声压展开的真实系数pnm之间的关系得到空间混叠矩阵E；
3)通过公式min(||s||1)、求解得到信号s；其中，YN是N阶的球傅立叶变换矩阵，B’N为根据球麦克风阵列的信号进行HOA编码得到的N阶HOA信号，ε是一设定值；
4)根据步骤3)得到的信号s，通过公式将s编码到高阶N，获得高阶的HOA信号BN；
5)将步骤4)得到的HOA信号乘以球傅立叶变换的逆矩阵，进行重建声场，得到3D音频。

2.如权利要求1所述的方法，其特征在于，球麦克风阵列采集的信号频率f满足其中，c是声速，r为球麦克风阵列的半径。

3.如权利要求1或2所述的方法，其特征在于，截断阶数N<(M+1)2，M是球麦克风阵列中球面麦克风的个数。

4.如权利要求1所述的方法，其特征在于，空间混叠矩阵E为的矩阵；其中的元素为球面声压的球傅立叶展开阶数,Q是球面麦克风的数量。

【专利技术属性】
技术研发人员：曲天书，吴玺宏，林晶，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人