用于生成声场描述的装置、方法或计算机程序制造方法及图纸

技术编号:27038149 阅读:47 留言:0更新日期:2021-01-12 11:21
一种用于生成具有声场分量的表示的声场描述的装置,包括:方向确定器(102),用于针对多个麦克风信号的多个时间‑频率瓦片中的每个时间‑频率瓦片确定一个或多个声音方向;空间基函数评估器(103),用于针对多个时间‑频率瓦片中的每个时间‑频率瓦片使用一个或多个声音方向评估一个或多个空间基函数;以及声场分量计算器(201),用于针对多个时间‑频率瓦片中的每个时间‑频率瓦片计算与使用一个或多个声音方向评估的一个或多个空间基函数和用于对应时间‑频率瓦片的参考信号对应的一个或多个声场分量,参考信号是从多个麦克风信号中的一个或多个麦克风信号中得出的。

【技术实现步骤摘要】
用于生成声场描述的装置、方法或计算机程序本申请是申请人为弗朗霍夫应用科学研究促进协会、申请日为2017年3月10日、申请号为201780011824.0、专利技术名称为“用于生成声场描述的装置、方法或计算机程序”的分案申请。
本专利技术涉及用于生成声场描述的装置、方法或计算机程序,并且还涉及使用声音方向信息在时间-频率域中对(高阶)高保真度立体声响复制信号(Ambisonicssignal)的合成。
技术介绍
本专利技术属于空间声音记录和再现领域。空间声音记录旨在利用多个麦克风来捕获声场,使得在再现侧,听众感知到声音图像就像其在记录位置处一样。用于空间声音记录的标准方法通常使用间隔开的全向麦克风(例如,在AB立体声中)或一致的定向麦克风(例如,在强度立体声中)。所记录的信号可以从标准立体声扬声器设置中再现,以实现立体声图像。对于环绕声再现,例如,使用5.1扬声器设置,可以使用类似的记录技术,例如,指向扬声器位置的五个心形麦克风[ArrayDesign]。最近,已经出现了3D声音再现系统,例如7.1+4扬声器设置,其中使用4个高度扬声器来再现提升的声音。用于这种扬声器设置的信号可以例如用非常明确间隔开的3D麦克风设置[MicSetup3D]来记录。所有这些记录技术的共同之处在于它们是为特定的扬声器设置而设计的,这限制了实际的应用性,例如,当所记录的声音应当在不同的扬声器配置上再现时。当不直接记录用于特定扬声器设置的信号,而是记录中间格式的信号、然后可以在再现侧从中生成任意扬声器设置的信号时,实现更大的灵活性。这种在实践中已得到很好建立的中间格式由(高阶)高保真度立体声响复制[Ambisonics]来表示。从高保真度立体声响复制信号中,可以生成包括双耳信号的每种期望扬声器设置的信号,以用于耳机再现。这需要应用于高保真度立体声响复制信号的特定渲染器,诸如经典高保真度立体声响复制渲染器[Ambisonics]、定向音频编码(DirAC)[DirAC]或HARPEX[HARPEX]。高保真度立体声响复制信号表示多声道信号,其中每个声道(称为高保真度立体声响复制分量)等同于所谓的空间基函数的系数。利用这些空间基函数的加权和(其中权重对应于系数),可以在记录位置中重新创建原始声场[FourierAcoust]。因此,空间基函数系数(即,高保真度立体声响复制分量)表示记录位置中的声场的紧凑描述。存在不同类型的空间基函数,例如球面谐波(SH)[FourierAcoust]或柱面谐波(CH)[FourierAcoust]。当描述2D空间中的声场(例如用于2D声音再现)时可以使用CH,而SH可以用于描述2D和3D空间中的声场(例如用于2D和3D声音再现)。对于不同的阶数l存在空间基函数,并且在3D空间基函数(诸如SH)的情况下存在状态(mode)m。在后一种情况下,对于每个阶数l,存在m=2l+1个状态,其中m和l是在l≥0并且-l≤m≤l范围内的整数。图1a中示出了空间基函数的对应示例,其示出了针对不同阶数l和状态m的球面谐波函数。要注意的是,阶数l有时被称为级,状态m也可以被称为度。如从图1a中可以看出的,零阶(第零级)l=0的球面谐波表示记录位置中的全向声压,而第一阶(第一级)l=1的球面谐波表示沿着笛卡尔坐标系的三个维度的偶极子分量。这意味着,特定阶数(级)的空间基函数描述阶数l的麦克风的方向性。换句话说,空间基函数的系数与阶数(级)l和状态m的麦克风的信号对应。要注意的是,不同阶数和状态的空间基函数是相互正交的。这意味着例如在纯漫射声场中,所有空间基函数的系数是互不相关的。如上面所解释的,高保真度立体声响复制信号的每个高保真度立体声响复制分量与特定级(和状态)的空间基函数系数对应。例如,如果使用SH作为空间基函数上至级l=1描述声场,那么高保真度立体声响复制信号将包括四个高保真度立体声响复制分量(因为具有用于阶数l=0的一个状态加上用于阶数l=1的三个状态)。最大阶数l=1的高保真度立体声响复制信号在下文中被称为一阶高保真度立体声响复制(FOA),而最大阶数l>1的高保真度立体声响复制信号被称为高阶高保真度立体声响复制(HOA)。当使用更高阶数l来描述声场时,空间分辨率变得更高,即,可以以更高的准确度描述或重新创建声场。因此,可以以较少的阶数来描述声场,从而导致较低的准确度(但是较少的数据),或者可以使用较高的阶数,从而导致较高的准确度(以及更多的数据)。对于不同的空间基函数,存在不同但紧密相关的数学定义。例如,可以计算复数值球面谐波以及实数值球面谐波。而且,可以用不同的归一化项(诸如SN3D、N3D或N2D归一化)来计算球面谐波。不同的定义可以在例如[Ambix]中找到。稍后将结合本专利技术的描述和实施例示出一些特定的示例。可以从多个麦克风的记录确定期望的高保真度立体声响复制信号。获得高保真度立体声响复制信号的直接方式是从麦克风信号直接计算高保真度立体声响复制分量(空间基函数系数)。这种方法需要测量非常明确的位置处的声压,例如在圆上或球体的表面上。之后,可以通过对测得的声压进行积分来计算空间基函数系数,如例如在[FourierAcoust,第218页]中所描述的。这种直接方法需要特定的麦克风设置,例如全向麦克风的圆形阵列或球形阵列。商用麦克风设置的两个典型示例是SoundFieldST350麦克风或[EigenMike]。不幸的是,对特定麦克风几何形状的要求强烈地限制了实际应用性,例如当麦克风需要被集成到小型设备中时或者在麦克风阵列需要与摄像机组合时。而且,利用这种直接方法确定较高阶的空间系数需要相对大量的麦克风以确保对噪声具有足够的健壮性。因此,获得高保真度立体声响复制信号的直接方法常常非常昂贵。
技术实现思路
本专利技术的目标是提供用于生成具有声场分量的表示的声场描述的改进概念。该目标通过如权利要求1所述的装置、如权利要求23所述的方法或者如权利要求24所述的计算机程序来实现。本专利技术涉及用于生成具有声场分量的表示的声场描述的装置或方法或计算机程序。在方向确定器中,针对多个麦克风信号的多个时间-频率瓦片中的每个时间-频率瓦片确定一个或多个声音方向。空间基函数评估器针对多个时间-频率瓦片中的每个时间-频率瓦片使用一个或多个声音方向评估一个或多个空间基函数。此外,声场分量计算器针对多个时间-频率瓦片中的每个时间-频率瓦片计算与使用一个或多个声音方向评估的一个或多个空间基函数对应的一个或多个声场分量,并且使用用于对应的时间频率瓦片的参考信号,其中参考信号是从多个麦克风信号中的一个或多个麦克风信号得出的。本专利技术基于这样的发现:可以从由时间-频率瓦片组成的时间-频率表示内的多个麦克风信号以高效的方式得出描述任意复杂声场的声场描述。这些时间-频率瓦片一方面指多个麦克风信号,另一方面用于确定声音方向。因此,声音方向确定使用时间-频率表示的时间-频率瓦片在谱域内发生。然后,后续处理的主要部分优选地在相同的时间-频率表示内执行。为此,针对每个时间-频率瓦片使用确定的一个或多个声音方向执行空间基函数的评估本文档来自技高网
...

【技术保护点】
1.一种用于生成具有一个或多个声场分量的表示的声场描述的装置,包括:/n方向确定器(102),用于针对多个声音信号的多个时间-频率瓦片中的每个时间-频率瓦片确定一个或多个声音方向;/n其中所述装置被配置为取决于所述一个或多个声音方向为每个时间-频率瓦片计算一个或多个响应函数,/n其中所述装置被配置为针对每个时间-频率瓦片从所述多个声音信号获得一个或多个参考声音信号或者一个或多个直接声音信号和一个或多个漫射声音信号,以及/n声场分量计算器(201),用于针对所述多个时间-频率瓦片中的每个时间-频率瓦片利用所述一个或多个响应函数评估所述一个或多个参考声音信号或者所述一个或多个直接声音信号和所述一个或多个漫射声音信号,以获得所述一个或多个声场分量或者以获得一个或多个直接声场分量和一个或多个漫射声场分量。/n

【技术特征摘要】
20160315 EP 16160504.31.一种用于生成具有一个或多个声场分量的表示的声场描述的装置,包括:
方向确定器(102),用于针对多个声音信号的多个时间-频率瓦片中的每个时间-频率瓦片确定一个或多个声音方向;
其中所述装置被配置为取决于所述一个或多个声音方向为每个时间-频率瓦片计算一个或多个响应函数,
其中所述装置被配置为针对每个时间-频率瓦片从所述多个声音信号获得一个或多个参考声音信号或者一个或多个直接声音信号和一个或多个漫射声音信号,以及
声场分量计算器(201),用于针对所述多个时间-频率瓦片中的每个时间-频率瓦片利用所述一个或多个响应函数评估所述一个或多个参考声音信号或者所述一个或多个直接声音信号和所述一个或多个漫射声音信号,以获得所述一个或多个声场分量或者以获得一个或多个直接声场分量和一个或多个漫射声场分量。


2.如权利要求1所述的装置,还包括空间基函数评估器(103),用于针对所述多个时间-频率瓦片中的每个时间-频率瓦片使用所述一个或多个声音方向评估一个或多个空间基函数,以获得所述一个或多个响应函数。


3.如权利要求1或2所述的装置,其中声场分量计算器(201)被配置用于计算期望阶数或状态的多个声场分量,以及其中所述声场分量计算器(201)被配置为求和对应声场分量,以获得期望阶数或状态的最终声场分量。


4.如权利要求1所述的装置,其中所述声场计算器被配置为解相关不同阶数或状态的所述一个或多个漫射声场分量。


5.如权利要求1或4所述的装置,其中所述声场分量计算器(201)被配置为针对特定的阶数或状态,将所述一个或多个直接声场分量的直接声场分量和所述一个或多个漫射声场分量的漫射声场分量求和,以获得特定的阶数或状态的最终声场分量。


6.如前述权利要求中任一项所述的装置,还包括时间-频率转换器(101),用于将多个时域声音信号中的每个转换成具有所述多个时间-频率瓦片的时间-频率表示。


7.如前述权利要求中任一项所述的装置,还包括频率-时间转换器(20),用于将所述一个或多个声场分量或者所述一个或多个直接声场分量和所述一个或多个漫射声场分量的组合转换成声场分量的时域表示。


8.如权利要求7所述的装置,
其中所述频率-时间转换器(20)被配置为处理所述一个或多个直接声场分量以获得多个时域直接声场分量,其中所述频率-时间转换器(20)被配置为处理所述漫射声场分量以获得多个时域漫射声场分量,并且其中组合器(401)被配置为在时域中执行所述时域直接声场分量和所述时域漫射声场分量的组合;或者
其中组合器(401)被配置为在频域中将用于时间-频率瓦片的所述一个或多个直接声场分量与用于对应时间-频率瓦片的所述一个或多个漫射声场分量组合,并且其中所述频率-时间转换器(20)被配置为处理所述组合器(401)的结果以获得时域中的声场分量。


9.如前述权利要求中任一项所述的装置,还包括:
参考信号计算器(104),用于使用所述一个或多个声音方向、使用基于所述一个或多个声音方向从所述多个声音信号中选择的特定声音信号、或者使用应用于所述多个声音信号的两个或更多个声音信号的多声道滤波器,从所述多个声音信号中计算参考所述一个或多个声音信号,其中所述多声道滤波器取决于所述一个或多个声音方向和从中获得所述多个声音信号的麦克风的各个位置。


10.如权利要求2所述的装置,
其中所述空间基函数评估器(103)被配置为:
对于空间基函数使用参数化表示,其中所述参数化表示的参数是声音方向;以及
将与所述声音方向对应的参数插入到所述参数化表示中以获得用于每个空间基函数的评估结果;
或者
其中所述空间基函数评估器(103)被配置为对于每个空间基函数使用查找表,以空间基函数标识和声音方向作为输入并且以评估结果作为输出,并且其中所述空间基函数评估器(103)被配置为对于由所述方向确定器(102)确定的所述一个或多个声音方向确定查找表输入的对应声音方向或者被配置为计算在与由所述方向确定器(102)确定的所述一个或多个声音方向相邻的两个查找表输入之间的加权平均值或未加权平均值;
或者
其中所述空间基函数评估器(103)被配置为:
对于空间基函数使用参数化表示,其中所述参数化表示的参数是声音方向,在二维情况下声音方向是一维的,诸如方位角,或者在三维情况下声音方向是二维的,诸如方位角和仰角;以及
将与所述声音方向对应的参数插入到所述参数化表示中以获得用于每个空间基函数的评估结果。


11.如权利要求2所述的装置,还包括:
直接或漫射声音确定器(105),用于确定所述多个麦克风信号的直接部分或漫射部分,作为参考信号,
其中所述声场分量计算器(201)被配置为仅在计算一个或多个直接声场分量时使用直接部分。


12.如权利要求11所述的装置,还包括:
平均响应基函数确定器(106),用于确定平均空间基函数响应,所述确定器包括计算处理或查找表访问处理;以及
漫射分量计算器(301),用于使用仅漫射部分作为参考信号连同所述平均空间基函数响应一起计算一个或多个漫射声场分量。


13.如权利要求12所述的装置,还包括:
组合器(109,401),用于组合直接声场分量;和
漫射声场分量,以获得声场分量。


14.如权利要求12至13中任一项所述的装置,
其中所述漫射分量计算器(301)被配置为计算上至预定的第一数量或阶数的漫射声音分量,
其中所述声场分量计算器(201)被配置为计算上至预定的第二数量或阶数的直接声场分量,
其中所述预定的第二数量或阶数大于所述预定的第一数量或阶数,以及
其中所述预定的第一数量或阶数为1或大于1。


15.如权利要求12至14中任一项所述的装置,
其中直接或漫射声音确定器(105)包括用于在频域表示或时...

【专利技术属性】
技术研发人员:伊曼纽尔·哈毕兹奥利弗·蒂尔加特法比安·库切亚历山大·尼德莱特纳阿凡哈桑·卡恩德克·马内
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1