一种低时延音频信号超定盲源分离方法及分离装置制造方法及图纸

技术编号：34436196 阅读：21 留言：0更新日期：2022-08-06 16:19

本发明专利技术属于频域盲源分离和音频信号处理技术领域，具体地说，涉及一种低时延音频信号超定盲源分离方法，该方法包括：麦克风阵列中的每个麦克风阵元拾取目标环境中的N个待分离声源的声信号，并将其转换成对应的数字信号，再对其进行短时傅里叶变换，得到对应的时频域观测信号；对得到的时频域观测信号执行反复迭代和更新，直至达到收敛，获得每个待分离声源的方差和解混合向量；利用得到的解混合向量，构建解混合矩阵；对解混合矩阵求逆得到混合矩阵的估计；针对每一个待分离声源，基于混合矩阵，构建一个多通道维纳滤波器并执行滤波，得到时频域待分离信号；再进行短时傅里叶逆变换，得到待分离信号时域波形。得到待分离信号时域波形。得到待分离信号时域波形。

全部详细技术资料下载

【技术实现步骤摘要】
一种低时延音频信号超定盲源分离方法及分离装置

[0001]本专利技术属于频域盲源分离(Blind source separation,BSS)和音频信号处理技术领域，具体地说，涉及一种低时延音频信号超定盲源分离方法及分离装置。

技术介绍

[0002]在多个说话人同时讲话的场景中，人可以把注意力集中在某一个感兴趣的说话人声音上而自动忽略其他说话人的声音，这就是著名的“鸡尾酒会”问题。该问题最早是英国的认知学家Cherry教授在上世纪50年代提出的。但是，该问题长期以来悬而未解。盲源分离就是为解决该问题而发展起来的一个全新的领域。音频信号的盲源分离有着广泛的应用前景，包括人机语音交互、自动会议日志和音乐分离等。
[0003]近二十年来，频域盲源分离技术作为一类代表性的音频分离解决方案获得快速发展，代表性的算法包括独立分量分析(independent component analysis,IVA)、独立向量分析(independent vector analysis,IVA)、独立低秩矩阵分析(independent low
‑
rankmatrix analysis,ILRMA)等。这些算法实质上利用了信号的高阶统计量信息。为了取得较好的分离性能，需要累积足够多的数据来实现准确的高阶统计量估计。在离线的实现中，可以利用已经采集的一整段较长的数据实现所需统计量的估计，因而这些算法取得了较好的性能。很多实际应用系统需要在线实现盲源分离算法，并且要求系统输入和输出之间的时延尽可能的

【技术保护点】

【技术特征摘要】
1.一种低时延音频信号超定盲源分离方法，该方法包括：麦克风阵列中的每个麦克风阵元拾取目标环境中的N个待分离声源的声信号，并将其转换成对应的数字信号，再对其进行短时傅里叶变换，得到对应的时频域观测信号；对得到的时频域观测信号执行反复迭代和更新，直至达到收敛，获得每个待分离声源的方差和解混合向量；利用得到的解混合向量，构建解混合矩阵；对解混合矩阵求逆得到混合矩阵的估计；针对每一个待分离声源，基于混合矩阵，构建一个多通道维纳滤波器并执行滤波，得到时频域待分离信号；再进行短时傅里叶逆变换，得到待分离信号时域波形。2.根据权利要求1所述的低时延音频信号超定盲源分离方法，其特征在于，该方法具体包括：步骤1)麦克风阵列中的第m个麦克风阵元拾取目标环境中的第n个待分离声源的声信号s
n
(t)，并将其转换成对应的数字信号，记为第m个麦克风信号x
m
(t)，并对其进行短时傅里叶变换得到对应的时频域观测信号X
m
(ω,k)，其中，1≤n≤N；t为离散时间；1≤m≤M；M为麦克风阵列中的麦克风阵元总数，k是帧标识，ω是频率；步骤2)利用得到的时频域观测信号X
m
(ω,k)，进行不断迭代更新，直至达到收敛，估计第n个待分离声源的方差λ
n
(ω,k
‑
l)和解混合向量w
n,l
(ω)，利用得到的解混合向量w
n,l
(ω)，构建解混合矩阵；并更新解混合矩阵W(ω)，其中，1≤n≤N；0≤l≤L
n
；L
n
表示第n个待分离声源待估计的反射声数目，N表示待估计声源数目；步骤3)对所述解混合矩阵W(ω)求逆，得到混合矩阵H(ω)；步骤4)针对第n个待分离声源，基于混合矩阵H(ω)，构建第n个待分离声源的多通道维纳滤波器Ω
n
(ω,k)，并执行滤波，得到第n个待分离声源的时频域信号步骤5)对第n个待分离声源的时频域信号执行短时傅里叶逆变换，得到对应的时域波形并将其作为真实的待分离声源的声信号，完成低时延音频信号超定盲源分离。3.根据权利要求2所述的低时延音频信号超定盲源分离方法，其特征在于，所述麦克风阵列包括M个麦克风阵元，麦克风阵元的数量M大于待分离声源的声信号的总数，记为M＞N。4.根据权利要求2所述的低时延音频信号超定盲源分离方法，其特征在于，所有待估计的反射声数目之和等于麦克风阵元的总数目，记为5.根据权利要求2所述的低时延音频信号超定盲源分离方法，其特征在于，所述步骤2)具体包括：步骤201)利用得到的时频域观测信号X
m
(ω,k)，更新第n个待分离声源的第k
‑
l帧的方差λ
n
(ω,k
‑
l)：其中，F为短时傅里叶变换的窗长；x(ω,k)＝[X1(ω,k),
…
,X
M
(ω,k)]
T
；步骤202)利用λ
n
(ω,k
‑
l)，更新第n个待分离声源在最近L
n
帧的加权协方差矩阵V
n,l
(ω,k)：
其中，α是接近1的平滑因子；V
n,l
(ω,k
‑
1)为第(k
‑
1)帧的加权协方差矩阵；H为共轭转置；步骤203)利用V
n,l
(ω,k)，更新第n个待分离声源对应的L
n
个解混合向量w
n,l
(ω)：上式约定L0＝0，列向量的第(L0+
…
+L
n
‑1)+l个元素为1且其他剩余元素都是0，W(ω)＝[w
1,0
(ω),
…
,w
1,L
‑1(ω),
…
,w
N,0
(ω),
…
,w
N,L
‑1(ω)]
H
是解混合矩阵；步骤204)对上述更新的第n个待分离声源对应的L
n
...

【专利技术属性】
技术研发人员：王泰辉，
申请(专利权)人：中国科学院声学研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人