声源信号处理方法及装置、电子设备和存储介质制造方法及图纸

技术编号:25712114 阅读:35 留言:0更新日期:2020-09-23 02:58
公开了一种声源信号处理方法及装置、电子设备和存储介质,该方法包括:通过短时傅立叶变换将第一声源输入信号转换为频域输入信号;基于第一声源输入信号和当前的滤波器系数矩阵,确定频域输出信号的功率谱密度矩阵;基于频域输入信号,确定第一声源输入信号对应的修正矩阵;根据功率谱密度矩阵和修正矩阵,更新滤波器系数矩阵;基于更新后的滤波器系数矩阵,处理第二声源输入信号,第二声源输入信号与第一声源输入信号相隔指定时间间隔。本申请的技术方案,可提升盲源分离方法的分离性能。

【技术实现步骤摘要】
声源信号处理方法及装置、电子设备和存储介质
本专利技术涉及语音
,尤其涉及一种声源信号处理方法及装置、电子设备和存储介质。
技术介绍
现有的技术方案是通过多通道的语音增强的手段来提升语音音质,从而进一步提升语音识别率。其中,基于分布式麦克风系统的盲源分离技术一般采用ICA(IndependentComponentAnalysis,独立分量分析)或IVA(IndependentVectorAnalysis,独立向量分析)方法。然而,ICA、IVA等盲源分离技术在面对的干扰能量较大时,比如信号和干扰的能量比小于0dB的情况,声源定位准确度很低,另外,声源活动状态的变化也会对ICA、IVA等盲源分离技术的性能造成影响。因此,如何进一步提升盲源分离方法的分离性能,成为目前亟待解决的技术问题。
技术实现思路
为解决上述技术问题,本专利技术实施例提供了一种声源信号处理方法及装置、电子设备和存储介质,旨在解决相关技术中盲源分离方法的分离性能受干扰能量、声源活动状态等因素影响较大的技术问题。第一方面,本申请提供本文档来自技高网...

【技术保护点】
1.一种声源信号处理方法,包括:/n通过短时傅立叶变换将第一声源输入信号转换为频域输入信号;/n基于所述第一声源输入信号和当前的滤波器系数矩阵,确定频域输出信号的功率谱密度矩阵;/n基于所述频域输入信号,确定所述第一声源输入信号对应的修正矩阵;/n根据所述功率谱密度矩阵和所述修正矩阵,更新滤波器系数矩阵;/n基于更新后的滤波器系数矩阵,处理第二声源输入信号,所述第二声源输入信号与所述第一声源输入信号相隔指定时间间隔。/n

【技术特征摘要】
1.一种声源信号处理方法,包括:
通过短时傅立叶变换将第一声源输入信号转换为频域输入信号;
基于所述第一声源输入信号和当前的滤波器系数矩阵,确定频域输出信号的功率谱密度矩阵;
基于所述频域输入信号,确定所述第一声源输入信号对应的修正矩阵;
根据所述功率谱密度矩阵和所述修正矩阵,更新滤波器系数矩阵;
基于更新后的滤波器系数矩阵,处理第二声源输入信号,所述第二声源输入信号与所述第一声源输入信号相隔指定时间间隔。


2.根据权利要求1所述的声源信号处理方法,其中,所述基于所述第一声源输入信号和当前的滤波器系数矩阵,确定频域输出信号的功率谱密度矩阵的步骤,包括:
将所述频域输入信号与所述当前的滤波器系数矩阵相乘,得到所述频域输出信号;
确定所述频域输出信号的功率谱密度矩阵。


3.根据权利要求1所述的声源信号处理方法,其中,所述基于所述频域输入信号,确定所述第一声源输入信号对应的修正矩阵的步骤,包括:
获取所述频域输入信号中每个频点的特征矢量顶点至参考向量顶点的距离;
根据多个所述距离,对所述频域输入信号中的频点进行聚类;
根据聚类结果,确定所述声源输入信号的每个声源的活动状态;
对于以所述每个声源的活动状态作为元素的基础矩阵,确定所述基础矩阵的对角矩阵;
将所述对角矩阵与所述声源输入信号的声源数量的商确定为修正矩阵。


4.根据权利要求3所述的声源信号处理方法,其中,在所述获取所述频域输入信号中每个频点的特征矢量顶点至参考向量顶点的距离的步骤之前,还包括:
对所述每个频点的特征矢量进行归一化计算,得到所述指定时间间隔中每个频点的特征矢量;
为所述每个频点设置对应的参考向量。


5.根据权利要求4所述的声源信号处理方法,其中,所述更新滤波器系数矩阵的步骤,包括:
在实时监测状态下,通过第一自然梯度获取策略更新所述滤波器系数矩阵所涉及的自然梯度;
在离线监测状态下,通过第二自然梯度获取策略更新所述滤波...

【专利技术属性】
技术研发人员:王泽林卢晶
申请(专利权)人:湖南湘江地平线人工智能研发有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1