【技术实现步骤摘要】
基于门控递归融合深度嵌入式特征的多通道语音分离系统
本专利技术涉及信号处理
,尤其是涉及了基于门控递归融合深度嵌入式特征的多通道语音分离系统。
技术介绍
语音作为人类交流信息的主要手段之一,语音分离一直在语音信号处理中占据着重要的地位。语音分离又被称为鸡尾酒会议问题其目标是从含有多个混合说话人的语音信号中将每个目标源语音信号分离出来。当一段语音中同时含有多个说话人时,会严重影响语音识别、说话人识别和助听器等系统的性能,因此语音分离技术就显得尤其重要。在语音分离技术的发展过程中,目前很多基于深度学习的语音分离方法取得了很好的效果,比如深度聚类算法、排列不变性训练准则和Conv-TasNet等。但是这些都是单通道的语音分离方法,他们没有办法利用语音的空间信息。对于麦克风阵列,他们包含了每个源信号的方向信息。所以,对于多通道语音分离来说,可以利用麦克风阵列提供的空间信息来进一步提升语音分离的性能。为了利用空间信息,也有很多工作去处理解决多通道语音分离问题,比如多通道深度聚类算法(MDC)。MDC是将单通道的深度聚类算 ...
【技术保护点】
1.基于门控递归融合深度嵌入式特征的多通道语音分离系统,其特征在于包括:门控递归融合模块、深度嵌入式特征提取模块、语音分离模块、区分性训练模块和联合训练模块,门控递归融合模块,将空间信息和幅值谱信息进行深度融合,输出门控递归融合特征;深度嵌入式特征提取模块,通过深度嵌入式特征损失目标函数,从门控递归融合特征中提取更具有区分性的深度嵌入式特征;语音分离模块,基于句子级别的排列不变性训练准则进行语音分离,将深度嵌入式特征分离,得到每个源目标语音信号;区分性训练模块,通过区分后的源目标语音信号得到区分性损失目标函数;联合训练模块,通过对区分性损失目标函数和深度嵌入式特征损失目标函 ...
【技术特征摘要】
1.基于门控递归融合深度嵌入式特征的多通道语音分离系统,其特征在于包括:门控递归融合模块、深度嵌入式特征提取模块、语音分离模块、区分性训练模块和联合训练模块,门控递归融合模块,将空间信息和幅值谱信息进行深度融合,输出门控递归融合特征;深度嵌入式特征提取模块,通过深度嵌入式特征损失目标函数,从门控递归融合特征中提取更具有区分性的深度嵌入式特征;语音分离模块,基于句子级别的排列不变性训练准则进行语音分离,将深度嵌入式特征分离,得到每个源目标语音信号;区分性训练模块,通过区分后的源目标语音信号得到区分性损失目标函数;联合训练模块,通过对区分性损失目标函数和深度嵌入式特征损失目标函数的联合训练,优化门控递归融合模块、深度嵌入式特征提取模块和语音分离模块。
2.如权利要求1所述的基于门控递归融合深度嵌入式特征的多通道语音分离系统,其特征在于所述门控递归融合模块,使用通道间的相位差的正弦和余弦值作为空间信息特征,具体流程为:
h′p=r⊙hp
r是重置门,z是更新门,σ表示sigmoid函数,Wr和Wz是重置门和更新门的权重,hp是隐状态,是空间信息特征,⊙表示元素间的乘积,是记忆细胞,Wh是权重,hq即fGRF表示门控递归融合特征:
混合语音的幅值谱经深度神经网络提取得到幅值谱特征ry,空间信息特征和幅值谱特征ry交替利用门控递归融合模块完成深度的结合。
3.如权利要求1所述的基于门控递归融合深度嵌入式特征的多通道语音分离系统,其特征在于所述深度嵌入式特征提取模块,对输入的混合语音信号进行短时傅里叶变换,将时域信号变换到频域信号,然后对其进行建模,获得更具有区分性的深度嵌入式特征,深度嵌入式特征采用深度神经网络训练得到:
Nm表示麦克风阵列的通道数,训练损失目标函数为:
JDC表示深度嵌入式特征...
【专利技术属性】
技术研发人员:范存航,温正棋,
申请(专利权)人:中科极限元杭州智能科技股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。