当前位置: 首页 > 专利查询>索尼公司专利>正文

信号处理设备、信号处理方法和程序技术

技术编号:3973633 阅读:146 留言:0更新日期:2012-04-11 18:40
公开了信号处理设备、信号处理方法和程序。所述信号处理设备包括:源分离模块,用于通过将独立分量分析ICA应用于基于来自多个声音源的混合信号而产生的观测信号,产生与各声音源对应的相应分离信号,由此执行所述混合信号的分离处理,所述观测信号由源分离麦克风取得;以及信号投射返回模块,用于接收投射返回目标麦克风的观测信号和所述源分离模块所产生的分离信号,并且用于产生投射返回信号作为与各声音源对应的相应分离信号,所述投射返回信号由投射返回目标麦克风取得。所述信号投射返回模块通过接收与源分离麦克风不同的投射返回目标麦克风的观测信号来产生所述投射返回信号。

【技术实现步骤摘要】

本专利技术涉及信号处理设备、信号处理方法和程序。更具体地,本专利技术涉及如下这 样的信号处理设备、信号处理方法和程序其用于通过ICA(独立分量分析)对于每个(声 音)源分离多个声音的混合信号,并用于通过使用分离信号(即,分离结果)来执行任意位 置处的声音信号的分析(如,安装在相应任意位置的每一麦克风所要采集的声音信号的分 析(即,对于各个麦克风的投射返回(proj ection-back)))。
技术介绍
存在ICA(独立分量分析)作为用于分离包括在多个声音的混合信号中的单独源 信号的技术。ICA是一种多变量分析,并且它是基于信号的统计特性来分离多维信号的方 法。对于 ICA 本身的详细内容,例如,参见〃 NYUMONDOKURITSU SEIBUN BUNSEKI (Introdu ction-Independent ComponentAnalysis)" (Noboru Murata, Tokyo Denki University Press)0本专利技术涉及如下这样的技术其用于通过ICA(独立分量分析)对于每一(声音) 源分离多个声音的混合信号,并用于通过使用分离信号(即,分离结果)执行例如对于安装 在各个任意位置的各个麦克风的投射返回。例如,这种技术可以实现如下处理。(1)基于定向麦克风采集的声音来执行ICA,并且将作为分离所采集的声音的结 果而获得的分离信号投射返回全向麦克风。(2)基于安排为适配于源分离的麦克风采集的声音来执行ICA,并且将作为分 离所采集的声音的结果而获得的分离信号投射返回安排为适配于D0A(Direction of Arrival,到达方向)估计或源位置估计的麦克风。将参照图1描述对于声音信号的ICA,特别地,时频域中的ICA。假设这样的情形如图1所示,对于产生不同的声音来说,数量为N的声音源是有 效的,而数量为n的麦克风用于观测这些声音。直到从声音源产生的声音(声音信号)到 达麦克风为止存在时间延迟和反射。从而,可以将由麦克风j观测到的信号(观测信号) 表示为通过对于所有声音源将源信号与传输函数的卷积进行相加的如下公式。在下 文中,将这样的混合称为“卷积混合”。此外,可以由如下的单个公式表示所有麦克风的观测信号。在以上公式中,x(t)和s(t)分别是具有元素xk(t)和sk(t)的列矢量,并且A是 具有元素&10_(1)的(nXN)矩阵。注意,在下面的描述中假设n = N。众所周知,可以将时域中的卷积混合表示为时频域中的瞬时混合。时频域中的ICA 利用了这种特性。关于时频域ICA 本身,参见“19. 2. 4. Fourier Transform Method in' DetailedExplanation independent Component Analysis“‘、日本待审专禾1J串i青公 开 No. 2006-238409、“ APPARATUS AND METHOD FOR SEPARATING AUDI0SIGNALS"等。主要关于与本专利技术实施例有关的要点进行下面的描述。通过将公式两侧经历短时傅立叶变换,获得如下的公式。 及 在以上公式中, 是频率窗口(frequency bin)的索引(《 = 1到M,M是频率窗口的总数),以.t是帧的索引(t = 1到T,T是帧的总数)。如果假设《固定,则可以将公式看作表示瞬时混合(即,没有时间延迟 的混合)。为了分离观测信号,因此,准备用于计算分离信号(S卩,分离结果)的公式 ,并且确定分离矩阵1( )以便分离结果Y( ,t)的各个分量彼此最独立。根据现有技术的时频域ICA已经伴随有称为“置换问题”的问题,即在各窗口 之间将哪个分量分离到哪个声道并不一致的问题。然而,通过日本待审专利申请公开 No. 2006-238409, " APPARATUS AND METHOD FORSEPARATING AUDIO SIGNALS"(其为与本 申请相同的专利技术人所进行的专利申请)中公开的方法,已经基本上解决了置换问题。由于 现有技术的方法也用在本专利技术实施例中,因此下面将简要地描述在日本待审专利申请公开 No. 2006-238409中公开的用于解决置换问题的方法。在日本待审专利申请公开No. 2006-238409中,为了获得分离矩阵W( ),反复地 执行下列公式到的计算,直到分离矩阵W( )收敛(或预定次数)为止 .= P(Yk(t)) :Yk(t)的概率密度函数( . 在下文中,将这些重复的执行称为“获知(learning)”。注意,对所有频率窗口执 行下列公式到的计算,并且对累积的观测信号的所有帧执行公式的计 算。在公式中,t表示帧号,<>t表示各帧在某一区域内的平均。附于Y( ,t)的右 上角的H表示厄密转置(Hermitian transpose)。厄密转置意味着这样的处理进行矢量 或矩阵的转置并将元素转换为共轭复数。分离信号Y(t) (S卩,分离结果)由公式表示,其以包括分离结果的所有声道 和所有频率窗口的元素的矢量的形式表示。此外,cpcoCYCt))是公式表示的矢量。该矢量的每一个元素q^YCt))称作分数函数,其为Yk(t)的多维(多变量)概率密度函数(PDF)的对数差分(公式)。例如,公式所表示的函数可以用作多维PDF。在此情况下,分数函数(pM(Y(t))可以用公式表示。在公式中,||Yk(t) ||2表示矢量Yk(t)的L-2范数(norm)(即,所有元素的平方和的平方根)。将Yk(t)的L_m范数(即,L-2的 一般化表示)定义为公式。此外,公式和中的、是用于调整Yk( ,t) 的尺度(scale)的项(term),并且将合适的正常数(如,sqrt (M)(频率窗口的数量的平方 根))分配给、。进一步,公式中的n称为获知速率或获知系数,并且其为较小的正 值(如,约为1)。在分离矩阵W( )逐渐变化时,获知速率用以反映基于公式计算出 的 AW(co)。尽管公式表示一个频率窗口的分离(见图2A),但是可以由一个公式表示所 有频率窗口的分离(见图2B)。为此,使用所有频率窗口的分离结果Y(t)(由公式表示)、公式所表 示的观测信号X(t)以及所有频率窗口的分离矩阵W(由公式表示)。因此,通过使 用这些矢量和矩阵,可以由公式表示分离。在本专利技术实施例的说明中,适当时选择性地使用公式和。图2A和图2B中的&到A到Yn所指示的表示称为谱图,在每一个谱图中,在 频率窗口的方向上和帧的方向上排列短时傅立叶变换(STFT)的结果。垂直方向指示频率 窗口,而水平方向指示帧。在公式和中,将较低的频率放在较高侧。相反,在 谱图中,将较低的频率放在较低侧。时频域ICA进一步具有称为“尺度问题”的这一问题。即,由于分离结果的尺度(幅 度)在各个频率窗口中彼此不同,因此当转换到波形时各频率之间的平衡与信源信号的不 同,除非适当地调整尺度差异。已经提出了 “投射返回麦克风”(下面所述)以解决“尺度” 的问题。将ICA的分离结果投射返回麦克风意味着通过分析由均设置在某一位置处的麦 克风所采集的声音信号,从采集到的声音信号中确定可归于各个信源信号的相应分量。当 仅一个声音源有效时本文档来自技高网...

【技术保护点】
一种信号处理设备,包括:源分离模块,用于通过将独立分量分析ICA应用于基于来自多个声音源的混合信号而产生的观测信号,产生与各声音源对应的相应分离信号,由此执行所述混合信号的分离处理,所述观测信号由用于源分离的麦克风取得;以及信号投射返回模块,用于接收投射返回目标麦克风的观测信号和所述源分离模块所产生的分离信号,并且用于产生投射返回信号作为与各声音源对应的相应分离信号,所述投射返回信号由投射返回目标麦克风取得,其中,所述信号投射返回模块通过接收与源分离麦克风不同的投射返回目标麦克风的观测信号来产生所述投射返回信号。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:广江厚夫
申请(专利权)人:索尼公司
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1