【技术实现步骤摘要】
本专利技术涉及一种基于波束形成的门控循环单元网络说话人分离方法及装置,属于语音分离。
技术介绍
1、语音分离,是指通过运用一定的方法从混合语音信号中计算出个体语音信号的信号处理技术,目前的语音分离可以分为两个方向,一是在混合语音中进行多个声源之间的分离,二是在混合语音中进行单一声源与噪声等干扰的分离。
2、深度学习在语音识别领域的应用越来越广泛,在基于深度学习基础上的语音分离技术在训练阶段所需的时间和精力占主要部分。
3、当前深度学习模型采取的都是对语音信号频域特征提取,之后对该特征进行训练,得到输入特征和语音信号频谱特征间非线性映射关系,该方法虽然可以解决分离问题,但是语音频谱结构差异不太大的情况下,分离结果较差。
技术实现思路
1、本专利技术的目的在于克服现有技术中的不足,提供一种基于波束形成的门控循环单元网络说话人分离方法及装置,结合波束形成算法和深度学习gru网络,在混合语音中进行多个声源之间的分离,充分利用了语音信号的空间特征和频谱特征,有效提高分离性能。
2、为本文档来自技高网...
【技术保护点】
1.一种基于波束形成的门控循环单元网络说话人分离方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于波束形成的门控循环单元网络说话人分离方法,其特征在于,提取所述语音信号的特征,包括:
3.根据权利要求1所述的基于波束形成的门控循环单元网络说话人分离方法,其特征在于,所述门控循环单元模型包括:
4.根据权利要求3所述的基于波束形成的门控循环单元网络说话人分离方法,其特征在于,所述门控循环单元模型的训练方法包括:
5.根据权利要求4所述的基于波束形成的门控循环单元网络说话人分离方法,其特征在于,所述训练集为Vox
...【技术特征摘要】
1.一种基于波束形成的门控循环单元网络说话人分离方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于波束形成的门控循环单元网络说话人分离方法,其特征在于,提取所述语音信号的特征,包括:
3.根据权利要求1所述的基于波束形成的门控循环单元网络说话人分离方法,其特征在于,所述门控循环单元模型包括:
4.根据权利要求3所述的基于波束形成的门控循环单元网络说话人分离方法,其特征在于,所述门控循环单元模型的训练方法包括:
5.根据权利要求4所述的基于波束形成的门控循环单元网络说话人分离方法,其特征在于,所述训练集为voxceleb。
6.根据权利要求1所述的基于波束形成的门控循...
【专利技术属性】
技术研发人员:王晓琴,张若雨,李郡,尚德龙,周玉梅,
申请(专利权)人:中科南京智能技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。