信号处理装置、信号处理方法以及程序制造方法及图纸

技术编号:3909305 阅读:130 留言:0更新日期:2012-04-11 18:40
一种信号处理装置、信号处理方法以及程序,该装置包括:学习处理单元,其通过学习处理来求解用于分离混合了来自多个声源的输出的混合信号的分离矩阵,所述学习处理将ICA(独立分量分析)应用于包括混合信号的观测信号;分离处理单元,其将分离矩阵应用于观测信号以分离混合信号并且生成与声源中的每一个相对应的分离信号;以及声源方向估计单元,其计算所生成的分离信号中的每一个的声源方向。声源方向估计单元在时-频域中计算在对应时间分段中的观测信号与分离信号之间的互协方差矩阵,计算互协方差矩阵的元素之间的相位差,并且通过应用计算出的相位差来计算与分离信号中的每一个相对应的声源方向。

【技术实现步骤摘要】

本专利技术涉及一种信号处理装置、信号处理方法以及程序。更具体地J兌,本专利技术涉及通过4吏用独立分量分析(Independent Component Analysis,ICA)来分离混合了多个信号的信号并进一步估计声源方向的信 号处理装置、信号处理方法和程序。
技术介绍
本专利技术涉及一种用于估计声源方向(从麦克风观看的声音到达的方向; 也称作到达方向(DOA))的技术。具体地说,本专利技术涉及一种用于通过 使用独立分量分析(ICA)来实时估计声源方向的技术。由于本专利技术涉及声源方向估计和ICA,因此两者将作为相关技术按以 下顺序被描述。然后,描述与将声源方向估计结合到实时ICA相关联的 问题。以下将以A和B的顺序给出描述。A. 相关技术的描述B. 相关技术的问题 首先,下面将给出Al至A4的描述作为相关技术。Al.使用麦克风之间的相位差的声源方向估计A2.关于ICA的描述A3.使用ICA的声源方向估计A4.关于ICA的实时实现成比 例的量。在图1中,在与连接两个麦克风的直线(麦克风对的方向)正交的方 向被^t为0的情况下定义角度9。然而,当使用由麦克风对的方向和声波传播方向所形成的角度[e'时,可以将两个麦克风到声源的距离之差表示为。令在麦克风1和麦克风2处的观测信号分别是A(t)和x2(t),并且从声 源11到麦克风1和2的路径差是来表示得到 的关系表达式。"…、 c Jt:样本索引 d:麦克风间距 C:声速 F:采样频率在上述等式中,t表示离散时间,并且指示样本索引.由于在麦克风 2处的观测信号x"t)在相位上比x"t)滞后与到声源的多出距离相对应的量,忽略衰减,X2(t)可以表示为等式1.11。因此,如果可以基于在各个麦克风处的观测信号来检测相位滞后,则 可以根据上述等式来计算确定声源方向的角度向。下面,将给出对通过将 观测信号变换到时-频域来计算声源方向的方法的描述。令X,(叫t)和X2(叫t)分别表示将随后描述的短时傅立叶变换(STFT ) 应用于多个观测信号A和x2的结果,其中, 和t分别表示频率窗口 (frequencybin)索引和帧索引。经历变换之前的观测信号[x" xj称作时 域信号,而经历短时傅立叶变换之后的信号[X" X2称作时-频域(或STFT 域)信号.由于时域中的相位滞后与时-频域中的复数倍数相对应,所以时域中 的关系表达式[1.1可以表示为以下等式[1.2。=exp -气,,^ F ……V M -1C ,t:帧索引 co:频率窗口索引 M:频率窗口的总数 j:虚数单位为了提取包含指示声源方向的角度e的项,可以执行表示为等式[1.3的运算<angle-angle(Z加)^^))= "^i^^F ……在上述等式中,angle()表示用于求解复数在-7t至+7t范围内的辐角的函 数,带上划线的X2表示X2的复共轭。最后,可以根据以下等式估计 声源方向,asinf (M — 0C angle(^f)Z2(w,……[1.4〗^ 3T(tO _ 1)0 F 、 在该等式中,asin表示sin的反函数.此外,hat(e(幼))表示在频率窗口 中的角度e是根据观测值估计的值。应该注意,此处所使用的hat表示符号(八)。虽然上述等式[1.41针对给定的具体 (频率窗口索引)和t(帧索引), 但通过针对多个cd和t来计算声源方向然后取均值,可以获得稳定的她。 此外,还可以准备n (n>2)个麦克风,并针对n (n+l) /2对麦克风中的 每对来计算声源方向。8以下等式[L5至1.7是用于其中使用多个麦克风和多个帧的情况的等式,丑,[X( 也1 r'■ ■ 其元素是在各个麦克风处的观测信号的矢量被定义为等式[1.5,并且 该矢量的均值由等式[1.6来定义。应该注意,该等式中的Et[I表示基于给 定分段中的帧的均值,并且由等式[1.71来定义。在等式[1.4中,通过4吏用 等式1.61中的Et[Xj(叫t)I和Et[Xm(0),t)1,而不是使用X"(o,t)和X2(叫t),求 解出从第i麦克风和第m麦克风的一对麦克风计算出的与第t0至第tl帧 相对应的源方向的均值.由于这种使用相位差的声源估计方法涉及比使用稍后描述的ICA的 方案的情况更少的处理代价,因此可以实时(具有小于一桢的延迟)并且 在高频(逐帧)的情况下计算声源方向。另一方面,在其中多个声源同时播放的环境中,不可能求解声源方向。 此外,即使当存在单个声源时,在存在大的及^射和混响的环境中,方向的 准确度也降低'所示。下文中,将这些混合称作"巻积混合"。所有麦克风的观测信号可以由如以下等式[2.2中的单个等式来表示。x(f)-A叫sW十…+ A"s("I;) ,.…. 其中<formula>formula see original document page 10</formula>此处,x(t)和s(t)分别是将Xk(t)和Sk(t)作为元素的列矢量。A"是将a[1ki 作为元素的nxN矩阵。在下面的描述中,個J殳n-N。时域中的巻积混合a示为时-频域中的瞬时混合是公知常识。采用 这种特性的分析是在时-频域中的ICA。关于时-频域ICA本身,应该参照例如日本未审查的专利申请^Hf No.2005- 49153 "Explanation of Independent Component Analysis"的"19.2. 4 Fourier Transform Methods"以及日本未审查的专利申请公开No.2006- 238409 "AUDIO SIGNAL SEPARATING APPARATUS/NOISE REMOVAL APPARATUS AND METHOD"。下面,将主要描述与本专利技术有关的特征。在上述等式2.2的两侧应用短时傅立叶变换得到以下等式3.1.<formula>formula see original document page 11</formula><formula>formula see original document page 11</formula>.在等式[3.11中,Q)是频率窗口索引,t是帧索引。如果固定(D,则可以将该等式看作瞬时混合(没有时间滞后的混合)。因此,为了分离观测信号,准备用于计算分离结果[Y的等式[3.5,然后确 定分离矩阵W((D),使得分离结果的各个分量Y(叫t)是最大程度独立的。在根据相关技术的时-频域ICA的情况下,出现所谓的置换 (permutation)问题,其中,"哪个分量分离到哪个通道"对于每个频率 窗口是不同的。通过在日本未审查的专利申请4^开No. 2006-238409 "AUDIO SIGNAL SEPARATING APPARATUS/NOISE REMOVAL APPARATUS AND METHOD"中公开的配置几乎完全解决了该置换问 题,No. 2006-238409是由与本申请相同的专利技术人在先提交的专利申请。由 于在本专利技术实施例中也采用了这种方法,所以将给出在日本未审查的专利 申请公开No. 2006-238409中公开的用于解决置换问题本文档来自技高网...

【技术保护点】
一种信号处理装置,包括: 学习处理单元,其通过学习处理来求解用于分离混合了来自多个声源的输出的混合信号的分离矩阵,所述学习处理将独立分量分析(ICA)应用于包括所述混合信号的观测信号; 分离处理单元,其将所述分离矩阵应用于所述观 测信号以分离所述混合信号并且生成与所述声源中的每一个相对应的分离信号;以及 声源方向估计单元,其计算在所述分离处理单元中生成的分离信号中的每一个的声源方向, 其中,所述声源方向估计单元在时-频域中计算在对应时间分段中的所述观测信 号与分离信号之间的互协方差矩阵,计算所述互协方差矩阵的元素之间的相位差,并且通过应用计算出的相位差来计算与所述分离信号中的每一个相对应的声源方向。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:广江厚夫
申请(专利权)人:索尼株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利