System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 从包括至少一个声道的信号产生声场描述的装置、方法制造方法及图纸_技高网

从包括至少一个声道的信号产生声场描述的装置、方法制造方法及图纸

技术编号:41186654 阅读:2 留言:0更新日期:2024-05-07 22:18
一种用于从包括一个或多个声道的输入信号产生声场描述的装置,包括用于从输入信号获取扩散性数据的输入信号分析器;声音分量发生器,用于从输入信号产生第一组声场分量的一个或多个声场分量,对于每一个声场分量,所述第一组声场分量具有直达分量和扩散分量,并且用于从所述输入信号产生第二组声场分量,所述第二组声场分量仅具有直达分量,其中所述声音分量发生器被配置成当产生所述第一组声场分量时执行能量补偿,所述能量补偿取决于所述扩散性数据、以及所述第一组声场分量中的扩散分量的数量和所述第二组声场分量的声场分量的最大阶中的至少一个。

【技术实现步骤摘要】

本专利技术涉及音频编码,并且特别涉及使用一个或多个声音分量生成器从输入信号产生声场描述。


技术介绍

1、方向性音频编码(directional audio coding,dirac)技术(参考文献[1])是一种分析和再现空间声音的有效方法。dirac使用基于到达方向(direction of arrival,doa)和针对每频带测量的扩散性的声场的知觉激励表示。它是基于这样的假设,即在一个时刻和在一个关键频带,听觉系统的空间分辨率受限于对用于方向的一个提示和用于耳间连贯性的另一提示进行解码。然后,空间声音通过交叉衰减的两个流在频域中呈现,这两个流是非方向扩散流和方向非扩散流。

2、dirac最初用于录制b格式声音,但是也可以延伸用于匹配特定扬声器设置(例如5.1(参考文献[2]))或者任何麦克风阵列的配置(参考文献[5])的麦克风信号。在最新的案例中,通过录制中间格式的信号而不是录制用于特定扬声器设置的信号可以实现更多的灵活性。

3、已在实际中良好建立的这种中间格式是通过(高阶)球形环绕声(参考文献[3])来呈现的。可以从球形环绕声信号产生每一个期望的扬声器设置的信号,包括用于耳机再现的双耳信号。这要求使用线性球形环绕声渲染器(参考文献[3])或者参数渲染器(例如方向性音频编码(dirac)),将特定的渲染器(renderer)应用于球形环绕声信号。

4、球形环绕声信号可以呈现为多声道信号,其中每一个声道(称为球形环绕声分量)等效于所谓的空间基函数的系数。以这些空间基函数的加权和(利用对应于这些系数的权值),可以重建在录制位置中的原始声场(参考文献[3])。因此,空间基函数系数(即,球形环绕声分量)表示录制位置中的声场的紧凑描述。存在有不同类型的空间基函数,例如球形谐波(spherical harmonics,sh)(参考文献[3])或者圆柱谐波(cylindrical harmonics,ch)(参考文献[3])。当描述在2d空间中的声场时(例如,用于2d声音再现),可以使用ch,而sh可以用来描述在2d与3d空间中的声场(例如,用于2d与3d声音再现)。

5、例如,从特定方向到达的音频信号f(t)产生空间音频信号该空间音频信号可以通过扩展球形谐波直到截断阶h,以球形环绕声格式呈现:

6、

7、其中是阶l和模m的球形谐波,并且φlm(t)是扩展系数。通过增加截断阶h,该扩展产生更精确的空间表示。在图1a中,针对阶n和模m示出具有球形环绕声声道编号(ambisonics channel numbering,acn)索引的直到阶h=4的球形谐波。

8、dirac已经扩展用于从第一阶球形环绕声信号(first order ambisonicssignal)(foa,称为b格式)或者从不同的麦克风阵列递送更高阶的球形环绕声信号(参考文献[5])。这份文件着重于一种更有效率的方法,用于从dirac参数和参考信号来合成高阶球形环绕声信号。在这份文件中,该参考信号,也称为降混(down-mix)信号,被视为更高阶的球形环绕声信号的子集或者该球形环绕声分量的子集的线性组合。

9、而且,本专利技术还考虑了其中将dirac用于以音频场景的参数形式的传输的情形。在这样的情形中,降混信号通过传统的音频核心编码器来编码,而dirac参数以压缩方式作为侧信息来传送。本方法的优点是考虑了在音频编码期间发生的量化误差。

10、以下,呈现了基于dirac的空间音频编码系统的概述,该空间音频编码系统设计用于沉浸式语音和音频服务(immersive voice and audio services,ivas)。这表示不同上下文中的一个,诸如dirac空间音频编码器的系统概述。这种系统的目的是能够处理表示音频场景的不同空间音频格式,并且以低比特率对其进行编码,以及在传送后尽可能忠实地再现原始音频场景。

11、该系统可以接受音频场景的不同表示作为输入。该输入音频场景可以通过旨在在不同扬声器位置处再现的多声道信号、听觉对象和描述对象随时间变化的位置的元数据、或者表示收听者或者参考位置的声场的第一阶或者更高阶的球形环绕声格式来捕获。

12、优选地,该系统基于3gpp增强语音服务(enhanced voice services,evs),因为该解决方案预计以低等待时间运行以启用移动网络上的对话服务。

13、如图1b所示,该编码器(ivas编码器)能够支持分别或者同时呈现给该系统的不同音频格式。音频信号可以本质上是声学的,可以通过麦克风拾取的信号,也可以本质上是电性的,其应该被传送到该扬声器。所支持的音频格式可以是多声道信号、第一阶和更高阶的球形环绕声分量以及音频对象。也可以通过组合不同的输入格式来描述复杂音频场景。所有的音频格式传送到dirac分析,该分析提取完整音频场景的参数表示。以参数的每个时间频率单位来测量到达方向和扩散性。在dirac分析之后是空间元数据编码器,其对元数据编码器进行量化和编码,以获得低比特率参数表示。

14、与参数一起,对从不同来源或者音频输入信号导出的降混信号进行编码,用于通过传统的音频核心编码器进行传送。在这种情形中,采用一种基于evs的音频编码器,用于对降混信号进行编码。该降混信号包括不同的声道,称为传输声道:该降混信号可以例如是组成b格式信号的四个系数信号、取决于目标比特率的立体声对或者单声道降混。经编码的空间参数和经编码的音频位流在通过该通信声道传送之前被多路复用。

15、在图1b中示出支持不同音频格式的基于dirac的空间音频编码的编码器侧。声学/电性输入1000输入到编码器接口1010,其中所述编码器接口具有图示为1013的特定功能,该特定功能用于第一阶球形环绕声(first order ambisonics,foa)或者高阶球形环绕声(high order ambisonics,hoa)。此外,该编码器接口具有用于多声道(multichannel,mc)数据的功能,例如立体声数据、5.1数据或者具有两个或者五个以上声道的数据。此外,该编码器接口1010具有用于对象编码的功能,例如,如图示为1011的空间音频对象编码(spatial audio object coding,saoc)。该ivas编码器包括具有dirac分析框1021和降混(downmix,dmx)框1022。通过ivas核心编码器1040,诸如aac或者evs编码器,对由降混框1022输出的信号进行编码,并且使用一dirac元数据编码器1030,对由dirac分析框1021产生的元数据进行编码。

16、在图2中所示的编码器中,通过核心解码器对传输声道进行解码,同时该dirac元数据在与经解码的传输声道一起传递到dirac合成之前被解码。在此阶段,可以考虑不同的选择。可以要求直接在任何扬声器或者耳机配置上播放音频场景,这在传统的dirac系统(图2中的mc)中通常是可行的。

17、解码器也可以如各个对象在编码器侧所呈现本文档来自技高网...

【技术保护点】

1.一种用于从包括一个或多个声道的输入信号产生声场描述的装置,所述装置包括:

2.根据权利要求1所述的装置,其中所述声音分量生成器(650)包括中阶分量生成器(820),所述中阶分量生成器(820)包括:

3.根据权利要求1所述的装置,

4.根据权利要求1所述的装置,其中所述声音分量生成器(650)包括用于生成所述第二组声场分量中的声场分量的高阶分量生成器(830),所述第二组声场分量的声场分量的阶高于用于生成所述第一组声场分量的声场分量的截断阶。

5.根据权利要求1所述的装置,

6.根据权利要求5所述的装置,其中所述补偿增益计算器(910)被配置为如以下等式所表示地计算增益因子

7.根据权利要求5所述的装置,其中所述增益计算器(910)被配置为

8.根据权利要求6所述的装置,其中所述增益计算器(920)被配置为额外地使用用于从所述输入信号导出的全向分量的第一能量或振幅相关测量、以及使用用于从所述输入信号导出的方向分量的第二能量或振幅相关测量、以及从所述输入信号获得的扩散性数据和方向数据,来计算所述补偿增益。

9.根据权利要求6所述的装置,其中所述补偿增益计算器(910,920)被配置为:

10.根据权利要求5所述的装置,其中所述补偿增益计算器(910,920,930,940)被配置为使用具有固定最大阈值或固定最小阈值的限制、或者使用用于将低或高增益因子向中等增益因子压缩的压缩函数来执行增益因子操纵(940),以获得所述补偿增益。

11.根据权利要求5所述的装置,其中所述能量补偿器(910,920,930,940)包括补偿增益施加器(900),用于将所述补偿增益施加到所述第一组声场分量中的至少一个声场分量。

12.根据权利要求1所述的装置,其中所述输入信号分析器(600)被配置成从与所述输入信号相关联的元数据中提取所述扩散性数据,或者通过对具有两个或多个声道或分量的输入信号的信号分析(610,620)从所述输入信号中提取所述扩散性数据,或者其中所述输入信号仅包括直到输入阶的一个或两个声场分量,其中所述声音分量生成器(650)包括声场分量组合器(430),用于组合所述第一组声场分量的声场分量与所述第二组声场分量的声场分量,以获得直到高于所述输入阶的输出阶的声场描述,或者

13.根据权利要求1所述的装置,其中所述第一组声场分量和所述第二组声场分量彼此正交,或者其中所述声场分量是正交基函数的系数、空间基函数的系数、球形或圆形谐波系数以及球形环绕声系数中的至少一个。

14.一种用于从包括一个或多个声道的输入信号产生声场描述的方法,包括:

15.一种计算机程序,用于当在计算机或者处理器上运行时执行根据权利要求14所述的方法。

...

【技术特征摘要】

1.一种用于从包括一个或多个声道的输入信号产生声场描述的装置,所述装置包括:

2.根据权利要求1所述的装置,其中所述声音分量生成器(650)包括中阶分量生成器(820),所述中阶分量生成器(820)包括:

3.根据权利要求1所述的装置,

4.根据权利要求1所述的装置,其中所述声音分量生成器(650)包括用于生成所述第二组声场分量中的声场分量的高阶分量生成器(830),所述第二组声场分量的声场分量的阶高于用于生成所述第一组声场分量的声场分量的截断阶。

5.根据权利要求1所述的装置,

6.根据权利要求5所述的装置,其中所述补偿增益计算器(910)被配置为如以下等式所表示地计算增益因子

7.根据权利要求5所述的装置,其中所述增益计算器(910)被配置为

8.根据权利要求6所述的装置,其中所述增益计算器(920)被配置为额外地使用用于从所述输入信号导出的全向分量的第一能量或振幅相关测量、以及使用用于从所述输入信号导出的方向分量的第二能量或振幅相关测量、以及从所述输入信号获得的扩散性数据和方向数据,来计算所述补偿增益。

9.根据权利要求6所述的装置,其中所述补偿增益计算器(910,920)被配置为:

10.根据权利要求5所述的装置,其中所述补偿增益计算器(910,920,930,940)被配置为使...

【专利技术属性】
技术研发人员:纪尧姆·福克斯奥利弗·蒂尔加特斯里坎特·科塞斯特凡·朵拉马尔库斯·穆特鲁斯法比安·库奇亚历山德拉·博塞翁安德里亚·艾森瑟斯特凡·拜耳
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1