【技术实现步骤摘要】
【国外来华专利技术】基于自适应函数的一致声学场景再现的系统、装置和方法
本专利技术涉及音频信号处理,具体地,涉及用于基于所通知的空间滤波的一致声学场景再现的系统、装置和方法。
技术介绍
在空间声音再现中,利用多个麦克风捕获记录位置(近端侧)处的声音,然后使用多个扬声器或耳机在再现侧(远端侧)再现。在许多应用中,期望再现所记录的声音,使得在远端侧重建的空间图像与在近端侧的原始空间图像一致。这意味着例如声源的声音从源存在于原始记录场景中的方向再现。备选地,当例如视频对所记录的音频进行补充时,期望再现声音,使得重建的声学图像与视频图像一致。这意味着例如声源的声音从源在视频中可见的方向再现。另外,视频相机可以配备有视觉缩放功能,或者在远端侧的用户可以对视频应用数字缩放,从而改变视觉图像。在这种情况下,再现的空间声音的声学图像将相应地改变。在许多情况下,远端侧确定应与再现声音一致的空间图像在远端侧或在回放期间(例如当涉及视频图像时)被确定。因此,在近端侧的空间声音必须被记录、处理和传输,使得在远端侧,我们仍然可以控制重建的声学图像。在许多现代应用中需要再现与期望的空间图像一致的所记录的声学场景的可能性。例如,诸如数字相机或移动电话之类的现代消费者设备通常配备有视频相机和多个麦克风。这使得视频能够与空间声音(例如立体声)一起被记录。当与视频一起再现记录的音频时,期望视觉和声学图像是一致的。当用户用相机放大时,期望在声学上重新创建视觉缩放效果,使得在观看视频时视觉和声学图像是对齐的。例如,当用户放大人物时,随着人物看起来更靠近相机,该人物的声音的混响应越来越小。此外,人的语音应当从与人在视 ...
【技术保护点】
一种用于生成一个或更多个音频输出信号的系统,包括:分解模块(101);信号处理器(105);以及输出接口(106),其中分解模块(101)被配置为接收两个或更多个音频输入信号,其中分解模块(101)被配置为生成包括两个或更多个音频输入信号的直达信号分量在内的直达分量信号,并且其中分解模块(101)被配置为生成包括所述两个或更多个音频输入信号的扩散信号分量在内的扩散分量信号,其中信号处理器(105)被配置为接收直达分量信号、扩散分量信号和方向信息,所述方向信息取决于所述两个或更多个音频输入信号的直达信号分量的到达方向,其中信号处理器(105)被配置为根据扩散分量信号生成一个或更多个经处理的扩散信号,其中,对于所述一个或更多个音频输出信号的每个音频输出信号,信号处理器(105)被配置为根据到达方向确定直达增益,并且信号处理器(105)被配置为将所述直达增益应用于所述直达分量信号以获得经处理的直达信号,并且信号处理器(105)被配置为将所述经处理的直达信号与所述一个或更多个经处理的扩散信号中的一个进行组合以生成所述音频输出信号,以及其中输出接口(106)被配置为输出所述一个或更多个音频输出信 ...
【技术特征摘要】
【国外来华专利技术】2014.05.05 EP 14167053.9;2014.09.05 EP 14183854.01.一种用于生成一个或更多个音频输出信号的系统,包括:分解模块(101);信号处理器(105);以及输出接口(106),其中分解模块(101)被配置为接收两个或更多个音频输入信号,其中分解模块(101)被配置为生成包括两个或更多个音频输入信号的直达信号分量在内的直达分量信号,并且其中分解模块(101)被配置为生成包括所述两个或更多个音频输入信号的扩散信号分量在内的扩散分量信号,其中信号处理器(105)被配置为接收直达分量信号、扩散分量信号和方向信息,所述方向信息取决于所述两个或更多个音频输入信号的直达信号分量的到达方向,其中信号处理器(105)被配置为根据扩散分量信号生成一个或更多个经处理的扩散信号,其中,对于所述一个或更多个音频输出信号的每个音频输出信号,信号处理器(105)被配置为根据到达方向确定直达增益,并且信号处理器(105)被配置为将所述直达增益应用于所述直达分量信号以获得经处理的直达信号,并且信号处理器(105)被配置为将所述经处理的直达信号与所述一个或更多个经处理的扩散信号中的一个进行组合以生成所述音频输出信号,以及其中输出接口(106)被配置为输出所述一个或更多个音频输出信号,其中信号处理器(105)包括用于计算一个或更多个增益函数的增益函数计算模块(104),其中所述一个或更多个增益函数中的每个增益函数包括多个增益函数自变量值,其中增益函数返回值被分配给每个所述增益函数自变量值,其中,当所述增益函数接收到所述增益函数自变量值中的一个值时,所述增益函数被配置为返回分配给所述增益函数自变量值中的所述一个值的增益函数返回值,以及其中,信号处理器(105)还包括信号修改器(103),用于根据到达方向从所述一个或更多个增益函数的增益函数的增益函数自变量值中选择取决于方向的自变量值,以用于从所述增益函数获得分配给所述取决于方向的自变量值的增益函数返回值,并且用于根据从所述增益函数获得的所述增益函数返回值来确定所述一个或更多个音频输出信号中的至少一个信号的增益值。2.根据权利要求1所述的系统,其中所述增益函数计算模块(104)被配置为:为所述一个或更多个增益函数的每个增益函数生成查找表,其中所述查找表包括多个条目,所述查找表中的每个条目包括增益函数自变量值之一和被分配给所述增益函数自变量值的增益函数返回值,其中增益函数计算模块(104)被配置为将每个增益函数的查找表存储在持久性或非持久性存储器中,以及其中信号修改器(103)被配置为通过从被存储在存储器中的所述一个或更多个查找表之一读出所述增益函数返回值,来获得被分配给所述取决于方向的自变量值的增益函数返回值。3.根据权利要求1或2所述的系统,其中信号处理器(105)被配置为确定两个或更多个音频输出信号,其中增益函数计算模块(104)被配置为计算两个或更多个增益函数,其中,对于所述两个或更多个音频输出信号中的每个音频输出信号,增益函数计算模块(104)被配置为计算分配给所述音频输出信号的平移增益函数作为所述两个或更多个增益函数之一,其中信号修改器(103)被配置为取决于所述平移增益函数来生成所述音频输出信号。4.根据权利要求3所述的系统,其中所述两个或更多个音频输出信号中的每一个的平移增益函数具有作为所述平移增益函数的增益函数自变量值之一的一个或更多个全局最大值,其中对于所述平移增益函数的一个或更多个全局最大值中的每一个,不存在使得所述平移增益函数返回比所述全局最大值使所述平移增益函数返回的增益函数返回值更大的增益函数返回值的其他增益函数自变量值,以及其中对于所述两个或更多个音频输出信号中的第一音频输出信号和第二音频输出信号的每对,第一音频输出信号的平移增益函数的一个或更多个全局最大值中的至少一个不同于第二音频输出信号的平移增益函数的一个或更多个全局最大值中的任一个。5.根据权利要求3或4所述的系统,其中,对于所述两个或更多个音频输出信号中的每个音频输出信号,增益函数计算模块(104)被配置为计算分配给所述音频输出信号的窗增益函数作为所述两个或更多个增益函数之一,其中信号修改器(103)被配置为根据所述窗增益函数生成所述音频输出信号,以及其中如果所述窗增益函数的自变量值大于下窗阈值并且小于上窗阈值,则窗增益函数被配置为返回比在窗函数自变量值小于下阈值或大于上阈值的情况下由所述窗增益函数返回的任何增益函数返回值大的增益函数返回值。6.根据权利要求5所述的系统,其中所述两个或更多个音频输出信号中的每一个的窗增益函数具有作为所述窗增益函数的增益函数自变量值之一的一个或更多个全局最大值,其中对于所述窗增益函数的一个或更多个全局最大值中的每一个,不存在使得所述窗增益函数返回比所述全局最大值使所述窗增益函数返回的增益函数返回值更大的增益函数返回值的其他增益函数自变量值,以及其中对于所述两个或更多个音频输出信号中的第一音频输出信号和第二音频输出信号的每对,第一音频输出信号的窗增益函数的一个或更多个全局最大值中的至少一个等于第二音频输出信号的窗增益函数的一个或更多个全局最大值中的一个。7.根据权利要求5或6所述的系统,其中增益函数计算模块(104)被配置为进一步接收指示观看方向相对于到达方向的角位移的取向信息,以及其中,增益函数计算模块(104)被配置为根据取向信息生成每个音频输出信号的平移增益函数。8.根据权利要求7所述的系统,其中增益函数计算模块(104)被配置为根据取向信息生成每个音频输出信号的窗增益函数。9.根据权利要求5至8之一所述的系统,其中增益函数计算模块(104)被配置为进一步接收缩放信息,其中所述缩放信息指示相机的打开角度,以及其中,增益函数计算模块(104)被配置为根据缩放信息生成每个音频输出...
【专利技术属性】
技术研发人员:伊曼纽尔·哈比兹,奥利弗·迪尔加特,科纳德·科瓦奇克,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:德国,DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。