【技术实现步骤摘要】
一种低时延音频信号超定盲源分离方法及分离装置
[0001]本专利技术属于频域盲源分离(Blind source separation,BSS)和音频信号处理技术领 域,具体地说,涉及一种低时延音频信号超定盲源分离方法及分离装置。
技术介绍
[0002]在多个说话人同时讲话的场景中,人可以把注意力集中在某一个感兴趣的说话 人声音上而自动忽略其他说话人的声音,这就是著名的“鸡尾酒会”问题。该问题最 早是英国的认知学家Cherry教授在上世纪50年代提出的。但是,该问题长期以来悬 而未解。盲源分离就是为解决该问题而发展起来的一个全新的领域。音频信号的盲源 分离有着广泛的应用前景,包括人机语音交互、自动会议日志和音乐分离等。
[0003]近二十年来,频域盲源分离技术作为一类代表性的音频分离解决方案获得快速 发展,代表性的算法包括独立分量分析(independent component analysis,IVA)、独立 向量分析(independent vector analysis,IVA)、独立低秩矩阵分析(independent low
‑
rankmatrix analysis,ILRMA)等。这些算法实质上利用了信号的高阶统计量信息。为了取 得较好的分离性能,需要累积足够多的数据来实现准确的高阶统计量估计。在离线的 实现中,可以利用已经采集的一整段较长的数据实现所需统计量的估计,因而这些算 法取得了较好的性能。很多实际应用系统需要在线实现盲源分离算法,并且要求系统 输入和输出之间的时延尽可能的
【技术保护点】
【技术特征摘要】
1.一种低时延音频信号超定盲源分离方法,该方法包括:麦克风阵列中的每个麦克风阵元拾取目标环境中的N个待分离声源的声信号,并将其转换成对应的数字信号,再对其进行短时傅里叶变换,得到对应的时频域观测信号;对得到的时频域观测信号执行反复迭代和更新,直至达到收敛,获得每个待分离声源的方差和解混合向量;利用得到的解混合向量,构建解混合矩阵;对解混合矩阵求逆得到混合矩阵的估计;针对每一个待分离声源,基于混合矩阵,构建一个多通道维纳滤波器并执行滤波,得到时频域待分离信号;再进行短时傅里叶逆变换,得到待分离信号时域波形。2.根据权利要求1所述的低时延音频信号超定盲源分离方法,其特征在于,该方法具体包括:步骤1)麦克风阵列中的第m个麦克风阵元拾取目标环境中的第n个待分离声源的声信号s
n
(t),并将其转换成对应的数字信号,记为第m个麦克风信号x
m
(t),并对其进行短时傅里叶变换得到对应的时频域观测信号X
m
(ω,k),其中,1≤n≤N;t为离散时间;1≤m≤M;M为麦克风阵列中的麦克风阵元总数,k是帧标识,ω是频率;步骤2)利用得到的时频域观测信号X
m
(ω,k),进行不断迭代更新,直至达到收敛,估计第n个待分离声源的方差λ
n
(ω,k
‑
l)和解混合向量w
n,l
(ω),利用得到的解混合向量w
n,l
(ω),构建解混合矩阵;并更新解混合矩阵W(ω),其中,1≤n≤N;0≤l≤L
n
;L
n
表示第n个待分离声源待估计的反射声数目,N表示待估计声源数目;步骤3)对所述解混合矩阵W(ω)求逆,得到混合矩阵H(ω);步骤4)针对第n个待分离声源,基于混合矩阵H(ω),构建第n个待分离声源的多通道维纳滤波器Ω
n
(ω,k),并执行滤波,得到第n个待分离声源的时频域信号步骤5)对第n个待分离声源的时频域信号执行短时傅里叶逆变换,得到对应的时域波形并将其作为真实的待分离声源的声信号,完成低时延音频信号超定盲源分离。3.根据权利要求2所述的低时延音频信号超定盲源分离方法,其特征在于,所述麦克风阵列包括M个麦克风阵元,麦克风阵元的数量M大于待分离声源的声信号的总数,记为M>N。4.根据权利要求2所述的低时延音频信号超定盲源分离方法,其特征在于,所有待估计的反射声数目之和等于麦克风阵元的总数目,记为5.根据权利要求2所述的低时延音频信号超定盲源分离方法,其特征在于,所述步骤2)具体包括:步骤201)利用得到的时频域观测信号X
m
(ω,k),更新第n个待分离声源的第k
‑
l帧的方差λ
n
(ω,k
‑
l):其中,F为短时傅里叶变换的窗长;x(ω,k)=[X1(ω,k),
…
,X
M
(ω,k)]
T
;步骤202)利用λ
n
(ω,k
‑
l),更新第n个待分离声源在最近L
n
帧的加权协方差矩阵V
n,l
(ω,k):
其中,α是接近1的平滑因子;V
n,l
(ω,k
‑
1)为第(k
‑
1)帧的加权协方差矩阵;H为共轭转置;步骤203)利用V
n,l
(ω,k),更新第n个待分离声源对应的L
n
个解混合向量w
n,l
(ω):上式约定L0=0,列向量的第(L0+
…
+L
n
‑1)+l个元素为1且其他剩余元素都是0,W(ω)=[w
1,0
(ω),
…
,w
1,L
‑1(ω),
…
,w
N,0
(ω),
…
,w
N,L
‑1(ω)]
H
是解混合矩阵;步骤204)对上述更新的第n个待分离声源对应的L
n
...
【专利技术属性】
技术研发人员:王泰辉,
申请(专利权)人:中国科学院声学研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。