当前位置: 首页 > 专利查询>法国电信局专利>正文

处理音频数据的方法和实行这个方法的声音获取设备技术

技术编号:3040955 阅读:187 留言:0更新日期:2012-04-11 18:40
一种处理声音数据的方法,其特征在于:其中:    a)对表示至少一个声音的信号进行编码,该至少一个声音在三维空间中传播并产生于离参考点(O)第一距离(ρ)的声源,以便获得对应于所述参考点(O)的原点的、在球谐函数的基中被表达的分量(B↓[mn]↑[o])所作出的该声音的表示;以及,    b)近场效应的补偿通过过滤而被应用于所述分量(B↓[mn]↑[o]),该过滤取决于第二距离(R),对于重放设备所执行的该声音的重放,该第二距离(R)实质上定义了在重放点(HP↓[j])与听知觉点(P)之间的距离。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频数据的处理。关于三维空间中的声波的传播并且涉及特定的专门声音模拟和/或重放的技术执行被应用于声学和音质现象的模拟的各种音频信号处理方法。这类处理方法规定声场的空间编码、其在扩音器集上或在立体声头戴式耳机的受话器上的传输和空间化再现。在这些空间化声音技术之中,可区别互补的、但通常都在同一个系统内加以执行的两种处理类别。一方面,第一种处理类别涉及用于合成室内效应或(更一般地说)周围效应的各种方法。从一个或多个声源(被发射的信号、位置、方位、方向性或类似物)的说明中,并且根据室内效应模型(涉及室内几何学、要不就是所需的听觉),可以计算并描述一套基本声学现象(直射波、反射波或绕射波)、要不就是宏观声学现象(反响与扩散场),从而可以在三维空间中传达位于选择的听知觉点处的收听者的那个层面的空间效应。然后,可以计算通常与这些反射(“二次”声源,通过被接收的主波的再发射而活动,具有空间位置属性)相关联并且/或者与迟反响(对于扩散场的相互无关的信号)相关联的信号集。另一方面,第二种方法类别涉及声源的位置或方向再现。这些方法被应用于通过以上所述的第一种类别的方法(涉及主声源和二次声源)来加以确定的信号,作为与它们关联的该空间说明(该声源的位置)的函数。特别是,通过根据该第二种类别的这类方法,可以获得将要在扩音器或受话器上被散布的信号,以便最终给收听者留下位于该收听者周围的预定的各自位置处的声源的听觉印象。由于收听者对于这些声源的位置的认识的三维空间中的分布,根据该第二种类别的这些方法被授予“三维声像的创建者”的称号。根据该第二种类别的方法通常包括这些基本声学事件的空间编码的第一个步骤,它会产生三维空间中的该声场的表示。在第二个步骤中,这个表示被传送或被存储,供随后使用。在解码的第三个步骤中,在重放设备的扩音器或受话器上传递这些解码信号。本专利技术被包含在上述第二种类别内。它尤其涉及声源的该空间编码和这些声源的该三维声音表示的规范。在一个或多个三维阵列的话筒执行声音捕捉的期间,它同样也应用于“虚拟”声源的编码(在那里模拟声源的应用程序,例如,游戏、空间化会议或类似物),如同应用于自然声场的“声学”编码。在声音空间化的这各种想得到的技术之中,该“立体混响声”途径是较佳的。立体混响声编码(将进一步加以详细地描述)存在于在球谐函数的基中(在尤其涉及仰角和方位角的球坐标中,从而体现了这个或这些声音的方向的特征)表示关于一个或多个声波的信号。关于在近场中被发射的这些波,表示这些信号并且在球谐函数的这个基数中被加以表达的这些分量也取决于发射这个场的该声源与对应于该球谐函数基的该原点的点之间的距离。更具体地说,对于该距离的这个依靠性被表达为该声音频率的函数,这一点将会进一步看到。这个立体混响声途径尤其在虚拟声源的模拟方面提供了大量可能的函数性,并且,按一般的方式显示出以下各个优点-它按合理的方式传达该声学现象的真实性,并给予逼真、动听和陶醉的空间听觉再现;-该声学现象的表示是可升级的它提供可以适合各种情况的空间分辨率。明确地说,在这些编码信号的传输和/或该重放设备的限制期间,这个表示可以被传送并被用作吞吐量约束的函数;-该立体混响声表示是灵活的,并且,可以模拟该声场的旋转,要不然,在重放时,可以使这些立体混响声信号的解码适应不同的几何图形的任何重放设备。在该已知的立体混响声途径中,这些虚拟声源的编码本质上是有方向的。这些编码函数相当于是计算取决于该声波的入射角的增益,该入射角由这些球谐函数来表达,这些球谐函数取决于球面坐标中的该仰角和该方位角。特别是,在解码时,假设在重放时,远远地移走这些扩音器。这会导致这些重建波前的形状的畸变(或扭曲)。明确地说,如上文中所指出的,对于近场,该球谐函数基中的该声音信号的这些分量实际上也取决于该声源与该声音频率的距离。更精确地说,可以以多项式的形式在数学上表达这些分量,该多项式的变量与上述距离成反比,与该声音频率成反比。这样,从其理论表达式的意义上说,这些立体混响声分量在低频中发散,并且,特别是,当该声音频率减小到零时,当它们表示位于有限长的距离处的声源所发射的近场声音时,这些立体混响声分量趋向于无穷大。在立体混响声表示的领域中,这个数学现象(已关于阶1)被称作“低音提升”,特别是通过-M.A.GERZON,《听觉定位的一般元理论》,第92个AES条约的预印本3306,1992年,第52页。对于涉及高幂的多项式的高球面谐波阶而言,这个现象变得特别紧要。以下文档SONTACCHI和HLDRICH,《使用距离编码的、关于3D声场的进一步调查》(关于数字音频效应(DAFX-01)的成本G-6会议的会议录,Limerick,爱尔兰,2001年12月6-8日),揭示了用于考虑立体混响声表示的近表示内的这些波前的扭曲的技术,该技术的原理在于-将(高阶的)立体混响声编码应用于WFS类型(代表“波场合成”)的、产生于(被模拟的)虚拟声音捕捉的那些信号;-根据区域边界上的其值而在区域上重建该声场,因此基于该HUYGENS-FRESNEL原理。但是,虽然由于“它使用到高阶的立体混响声表示”的事实而允诺,但这个文档中所呈现的该技术提出一定数量的问题-所有这些表面的计算(使“应用该HUYGENS-FRESNEL原理”成为可能)所要求的这些计算机资源、以及所要求的这些计算时间过多;-由于这些话筒之间的该距离,会出现被称作“空间混叠”的处理人工制品,除非选择被紧密隔开的虚拟话筒格栅,从而使该处理更加麻烦;-若存在真实声源,那么,一当获取,这项技术就难以调换到将要被布置在阵列中的传感器的真实情况;-关于重放,该三维声音表示被含蓄地约束于该重放设备的固定半径,因为这里必须在与那个最初的话筒阵列相同尺度的扩音器阵列上执行该立体混响声解码,这个文档没有提议使该编码或该解码适应其他尺寸的重放设备的方法。首先,这个文档呈现传感器的水平阵列,从而假设正被讨论的该声学现象在这里只在水平方向上传播,从而排除任何其他的传播方向,并因此不表示普通声场的物理真实性。更一般的情况是,通过当前技术,无法令人满意地处理任何类型的声源(尤其是近场源),而是可以处理被远远地移走的声源(平面波),这对应于众多应用中的限制性和人工情况。本专利技术的目的是提供一种方法,用于通过编码、传输和重放来处理任何类型的声场,尤其是该近场中的声源的该效应。本专利技术的另一个目的是提供一种允许虚拟声源的编码的方法——不仅以方向方式,而且以距离方式;并且,定义能适应任何重放设备的解码。本专利技术的另一个目的是在话筒的三维阵列的帮助下,尤其为自然声场的声音捕捉来提供一种鲁棒性方法,用于处理任何声音频率(包括低频)的声音。为此目的,本专利技术提议一种处理声音数据的方法,其中a)表现出在三维空间中传播并且产生于离参考点有第一距离的声源的至少一个声音的信号被进行编码,以便获得对应于所述参考点的原点的、在球谐函数的基中被加以表达的分量所作出的该声音的表示;以及,b)通过取决于第二距离的过滤,近场效应的补偿被应用于所述分量,该第二距离实质上为重放设备所执行的该声音的重放来定义重放点与听知觉点之间的距离。在第一个实施例中,所述声源正被远远移离该参考点,-为球谐函数的所述基中的该声本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种处理声音数据的方法,其特征在于其中a)对表示至少一个声音的信号进行编码,该至少一个声音在三维空间中传播并产生于离参考点(O)第一距离(ρ)的声源,以便获得对应于所述参考点(O)的原点的、在球谐函数的基中被表达的分量(Bmnσ)所作出的该声音的表示;以及,b)近场效应的补偿通过过滤而被应用于所述分量(Bmnσ),该过滤取决于第二距离(R),对于重放设备所执行的该声音的重放,该第二距离(R)实质上定义了在重放点(HPj)与听知觉点(P)之间的距离。2.如权利要求1中所述的方法,其特征在于其中,所述声源远离该参考点(O),-对于球谐函数的所述基中的该声音的表示来获得连续阶m的分量;以及,-应用滤波器(1/Fm),它的每个系数被应用于阶m的分量,这些系数以幂m的多项式的倒数的形式来加以分析上的表达,其变量与该声音频率成反比,与所述第二距离(R)成反比,以便补偿该重放设备的那个层面处的近场效应。3.如权利要求1中所述的方法,其特征在于其中,所述声源是设想在所述第一距离(ρ)处的虚拟声源,-对于球谐函数的所述基中的该声音的表示来获得连续阶m的分量;以及,-应用全局滤波器(Hm),它的每个系数被应用于阶m的分量,这些系数以分数的形式来以解析方式表达,其中-该分子是幂m的多项式,其变量与该声音频率成反比,与所述第一距离(ρ)成反比,以便模拟该虚拟声源的近场效应,以及,-该分母是幂m的多项式,其变量与该声音频率成反比,与所述第二距离(R)成反比,以便补偿这些低声音频率中的该虚拟声源的该近场的该效应。4.如前述权利要求之一中所述的方法,其特征在于其中,用表示所述第二距离(R/c)的参数,将在步骤a)和b)中被编码和过滤的该数据传送到该重放设备。5.如权利要求1-3之一中所述的方法,其特征在于其中,该重放设备包括用于读取存储介质的装置,用表示所述第二距离(R/c)的参数,将在步骤a)和b)中被编码和过滤的该数据存储在意在由该重放设备来读取的存储介质上。6.如权利要求4和5之一中所述的方法,其特征在于其中,在包括被布置成离所述听知觉点(P)有第三距离(R2)的多个扩音器的重放设备执行声音重放之前,其系数取决于所述第二距离(R1)和第三距离(R2)的适应滤波器(Hm(R1/c,R2/c))被应用于该被编码和过滤的数据。7.如权利要求6中所述的方法,其特征在于其中,所述自适应滤波器(Hm(R1/c,R2/c))的这些系数以分数的形式来以解析方式表达,每个系数被应用于阶m的分量,其中-该分子是幂m的多项式,其变量与该声音频率成反比,与所述第二距离(R)成反比;以及,-该分母是幂m的多项式,其变量与该声音频率成反比,与所述第三距离(R2)成反比。8.如权利要求2、3和7之一中所述的方法,其特征在于其中,关于步骤b)的实施,提供-关于偶数阶m的这些分量,是采取二阶单元级联的形式的音频数字滤波器;以及,-关于奇数阶m的这些分量,是采取二阶单元和一阶的附加单元的级联形式的音频数字滤波器。9.如权利要求8中所述的方法,其特征在于其中,从幂m的所述多项式的这些根的各个数字值,来定义对于阶m的分量的、音频数字滤波器的这些系数。10.如权利要求2、3、7、8和9之一中所述的方法,其特征在于其中,所述多项式是贝塞耳多项式。11.如权利要求1、2和4-10之一中所述的方法,其特征在于其中,提供话筒,该话筒包括实质上被排列在球体表面上的声换能器阵列,该球体的中心实质上对应于所述参考点(O),以便获得表示在该三维空间中传播的至少一个声音的所述信号。12.如权利要求11中所述的方法,其特征在于其中,在步骤b)中应用全局滤波器,以便一方面补偿作为所述第二距离(R)的函数的近场效应,...

【专利技术属性】
技术研发人员:J·丹尼尔
申请(专利权)人:法国电信局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1