【技术实现步骤摘要】
【国外来华专利技术】使用多点声场描述生成经增强的声场描述或经修改的声场描述的概念本专利技术涉及音频处理,并且特别是,涉及关于诸如麦克风或虚拟麦克风位置的参考位置限定的声场的音频处理。高保真度立体声响复制(Ambisonics)信号包括声场的截断球谐波分解。高保真度立体声响复制有不同的风格。存在“传统的”高保真度立体声响复制[31],其现在被称为“一阶高保真度立体声响复制(FOA、First-OrderAmbisonics)”并且包括四个信号(即,一个全向信号和多达三个8字形定向信号)。最近的高保真度立体声响复制变体被称为“更高阶的高保真度立体声响复制(HOA、Higher-OrderAmbisonics)”,并且以携带更多信号为代价而提供经增强的空间分辨率和更大的聆听者最佳位置区域。通常,完全定义的N阶HOA表示由(N+1)2个信号组成。与高保真度立体声响复制理念相关,已经设想到定向音频编码(DirAC、DirectionalAudioCoding)表示,以以更紧凑的参数样式表示FOA或HOA声音场景。更具体地,空间声音场景由一个(或多个)发送的音频声道 ...
【技术保护点】
1.一种用于生成经增强的声场描述的装置,包括:/n声场生成器,用于生成至少一个声场描述,所述至少一个声场描述指示关于至少一个参考位置的声场;以及/n元数据生成器,用于生成与所述声场的空间信息相关的元数据;/n其中,所述至少一个声场描述和所述元数据构成所述经增强的声场描述。/n
【技术特征摘要】
【国外来华专利技术】20170714 EP 17181488.21.一种用于生成经增强的声场描述的装置,包括:
声场生成器,用于生成至少一个声场描述,所述至少一个声场描述指示关于至少一个参考位置的声场;以及
元数据生成器,用于生成与所述声场的空间信息相关的元数据;
其中,所述至少一个声场描述和所述元数据构成所述经增强的声场描述。
2.如权利要求1所述的装置,
其中所述声场生成器被配置为生成关于参考位置的第一声场描述以及关于另一参考位置的第二声场描述,所述另一参考位置与所述参考位置不同;以及
其中所述元数据生成器被配置为各个确定所述参考位置和所述另一参考位置,或者确定所述参考位置与所述另一参考位置之间的距离或所述参考位置与所述另一参考位置之间的位置向量作为所述元数据。
3.如权利要求2所述的装置,
其中所述第一声场描述是第一高保真度立体声响复制描述,以及其中所述第二声场描述是第二高保真度立体声响复制描述,或者其中所述第一声场描述和所述第二声场描述是高保真度立体声响复制描述或定向音频编码描述中的一个。
4.如前述权利要求中一项所述的装置,
其中所述第一几何描述是关于从预定原点指向所述第一声场描述的参考位置的第一向量的信息;以及
其中所述第二几何描述是关于从所述预定原点指向第二声场描述的另一参考位置的第二向量的信息。
5.如权利要求1至4中一项所述的装置,
其中所述第一几何描述是关于从预定原点指向第一声场描述的参考位置的第一向量和从所述预定原点指向第二声场描述的另一参考位置的第二向量中的一个的信息,以及关于所述参考位置和所述另一参考位置之间的向量的信息。
6.如权利要求1至5中一项所述的装置,
其中所述参考位置和所述另一参考位置中的一个是预定原点,并且其中所述元数据包括关于所述预定原点与所述参考位置和所述另一参考位置中的另外一个之间的向量的信息。
7.如权利要求1至6中一项所述的装置,
其中所述声场生成器被配置为,使用真实麦克风设备或使用虚拟麦克风技术通过声音合成,生成所述第一声场描述或所述第二声场描述。
8.一种用于从声场描述和与声场描述的空间信息相关的元数据生成经修改的声场描述的装置,包括:
声场计算器,用于使用所述空间信息、所述声场描述以及指示参考位置到不同参考位置的平移的平移信息,计算经修改的声场。
9.如权利要求8所述的装置,
其中所述声场计算器被配置为,使用基于信号的平移方法,计算所述经修改的声场描述。
10.如权利要求8或9所述的装置,
其中所述声场计算器被配置为:
接收与第一参考位置相关的第一声场描述以及接收与不同于所述参考位置的另一参考位置相关的第二声场描述;
对所述第一声场描述执行源分离以获得一个或多个提取对象的第一群组以及对所述第二声场描述执行源分离以获得一个或多个提取对象的第二群组;
计算提取对象的到达方向DOA数据;
匹配所述第一声场描述的提取对象的所述第一群组和所述第二声场描述的提取对象的所述第二群组;
估计一个或多个匹配对象的位置;以及
基于匹配对象的估计位置和所述不同参考位置,修改一个或多个匹配对象。
11.如权利要求10所述的装置,其中所述声场计算器被配置为:
计算所述匹配对象的到达方向数据;以及
针对所述不同参考位置,使用所计算的到达方向数据,确定每个匹配对象的声场描述数据。
12.如权利要求9至11中一项所述的装置,
其中所述声场计算器被配置为,使用针对非匹配对象获得的到达方向数据,计算一个或多个非匹配对象的声场数据。
13.如权利要求9至12中一项所述的装置,
其中所述声场计算器被配置为,通过组合所述一个或多个匹配对象和所述一个或多个非匹配对象的所述声场描述数据,计算所述经修改的声场描述。
14.如权利要求8所述的装置,其中所述声场计算器被配置为执行基于参数的平移方法。
15.如权利要求8或14所述的装置,
其中所述声场计算器被配置为:
假设声场模型;
估计假设声场的信号分量和/或参数;
依据所述平移信息或依据所述不同参考位置,修改所述信号分量和/或所述参数;以及
使用经修改的信号分量和/或经修改的参数,生成所述经修改的声场描述。
16.如权利要求15所述的装置,
其中所述声场计算器被配置为,使用所述声场至一个或多个直达声音分量和一个或多个扩散声音分量的分解或通过使用所述声场至一个或多个直达/主要声音分量和残余声音分量的分解,估计所述信号分量和/或所述参数,其中所述残余声音分量能够是单声道信号或多声道信号。
17.如权利要求8至16中一项所述的装置,
其中所述声场计算器被配置为应用所述经修改的声场描述的旋转。
18.如权利要求8至12中一项所述的装置,
其中所述经修改的声场描述是高保真度立体声响复制声场描述。
19.如权利要求8至18中一项所述的装置,
其中所述声场计算器(420)被配置为:
接收第一声场描述和第二声场描述作为所述声场描述;
对所述第一声场描述和所述第二声场描述执行源分离,以提取所述第一声场描述和所述第二声场描述的源以及所提取的源的到达方向DoA数据;
针对每个所提取的源,使用所述DoA数据和所述平移信息,计算关于所述不同位置的经修改的DoA数据;以及
处理所提取的源和所述经修改的DoA数据,以获得所述经修改的声场描述。
20.如权利要求8至19中一项所述的装置,
其中所述声场计算器(420)被配置为对每个声场描述各个执行源分离并为每个声场描述提取环境/扩散/残留信号。
21.如权利要求8至20中一项所述的装置,还包括:
平移界面(410),用于提供所述平移信息或旋转信息,所述旋转信息指示针对所述经修改的声场的预期聆听者的旋转;
元数据提供器(402,400),用于将所述元数据提供给所述声场计算器(420);
声场提供器(404,400),用于将所述声场描述提供给所述声场计算器(420);以及
输出界面(421),用于输出包括所述经修改的声场描述和经修改的元数据的所述经修改的声场,所述经修改的元数据是使用所述平移信息从所述元数据得出的;或者用于输出多个扬声器声道,每个扬声器声道与预定义扬声器位置相关;或者用于输出所述经修改的声场的双耳表示。
22.如权利要求8至21中一项所述的装置,
其中所述声场描述包括多个声场分量,所述多个声场分量包括全向分量和至少一个定向分量;
其中所述声场计算器包括:
声场分析器(422),用于分析所述声场分量,以针对不同频率区间得出到达方向信息;
平移变换器(423),用于使用方向信息和元数据,计算每个频率区间的经修改的到达方向信息,所述元数据包括将距离信息与由频率区间表示的源相关联的深度图;以及
距离补偿器,用于使用距离补偿信息计算所述经修改的声场,所述距离补偿信息取决于所述源的所述深度图提供的距离以及与频率区间相关联的新距离,所述新距离与所述经修改的到达方向信息相关。
23.如权利要求8至22中一项所述的装置,其中所述声场计算器(420)被配置为,针对一个或多个源,
计算(1104)从所述参考位置指向通过所述声场的分析(1102)所获得的声源(510)的第一向量;
使用所述第一向量和所述平移信息计算(1106)从所述不同参考位置(500)指向所述声源(510)的第二向量,所述平移信息限定从所述参考位置(522)到所述不同参考位置(500)的平移向量;以及
使用所述不同参考位置(500)、所述声源(510)的位置以及所述第二向量,或者使用从所述不同参考位置(500)到所述声源(510)的位置的距离以及所述第二向量,计算(1106)距离修改值。
24.如权利要求8至23中一项所述的装置,
其中通过将到达方向单位向量乘以所述元数据中包括的距离而计算第一向量;或者
其中通过从所述第一向量中减去所述平移向量而计算第二向量;或者
其中通过将所述第二向量除以所述第一向量的范数而计算所述距离修改值。
25.如权利要求8至24中一项所述的装置,
其中所述声场计算器(420)被配置为除了所述平移信息之外还接收旋转信息;以及
其中所述声场计算器(420)被配置为使用所述旋转信息执行旋转变换(424)以旋转声场的到达方向数据,其中所述到达方向数据是从通过所述声场描述的声场分析所获得的到达方向数据并使用所述平移信息得出的。
26.如权利要求8至25中一项所述的装置,其中所述声场计算器(420)被配置为:
通过声场分析,从所述声场描述和源的方向确定(1200,1240)源;
针对源,使用所述元数据确定(1220)所述源距所述参考位置的距离...
【专利技术属性】
技术研发人员:于尔根·赫勒,伊曼纽尔·哈毕兹,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。