基于波束形成的门控循环单元网络说话人分离方法及装置制造方法及图纸

技术编号：40873301 阅读：19 留言：0更新日期：2024-04-08 16:41

本发明专利技术涉及一种基于波束形成的门控循环单元网络说话人分离方法及装置，方法包括：获取输入的语音信号；提取所述语音信号的特征；将所述语音信号的特征输入训练好的门控循环单元模型中，得到语音信号的二值掩码；所述门控循环单元模块的输入是语音信号的特征，输出是语音信号的二值掩码；基于所述语音信号的二值掩码进行信号分离，得到分离信号的频谱特征和空间特征，结合所述分离信号的频谱特征和空间特征对语音信号进行重构操作，还原得到原始语音信号。在一般的基于深度学习的门控循环单元网络的基础上，对特征提取阶段使用波束形成算法，充分利用信号的空间特征和频谱特征。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于波束形成的门控循环单元网络说话人分离方法及装置，属于语音分离。

技术介绍

1、语音分离，是指通过运用一定的方法从混合语音信号中计算出个体语音信号的信号处理技术，目前的语音分离可以分为两个方向，一是在混合语音中进行多个声源之间的分离，二是在混合语音中进行单一声源与噪声等干扰的分离。

2、深度学习在语音识别领域的应用越来越广泛，在基于深度学习基础上的语音分离技术在训练阶段所需的时间和精力占主要部分。

3、当前深度学习模型采取的都是对语音信号频域特征提取，之后对该特征进行训练，得到输入特征和语音信号频谱特征间非线性映射关系，该方法虽然可以解决分离问题，但是语音频谱结构差异不太大的情况下，分离结果较差。

技术实现思路

1、本专利技术的目的在于克服现有技术中的不足，提供一种基于波束形成的门控循环单元网络说话人分离方法及装置，结合波束形成算法和深度学习gru网络，在混合语音中进行多个声源之间的分离，充分利用了语音信号的空间特征和频谱特征，有效提高分离性能。

2、为本文档来自技高网...

【技术保护点】

1.一种基于波束形成的门控循环单元网络说话人分离方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于波束形成的门控循环单元网络说话人分离方法，其特征在于，提取所述语音信号的特征，包括：

3.根据权利要求1所述的基于波束形成的门控循环单元网络说话人分离方法，其特征在于，所述门控循环单元模型包括：

4.根据权利要求3所述的基于波束形成的门控循环单元网络说话人分离方法，其特征在于，所述门控循环单元模型的训练方法包括：

5.根据权利要求4所述的基于波束形成的门控循环单元网络说话人分离方法，其特征在于，所述训练集为Voxceleb。

...

【技术特征摘要】

1.一种基于波束形成的门控循环单元网络说话人分离方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于波束形成的门控循环单元网络说话人分离方法，其特征在于，提取所述语音信号的特征，包括：

3.根据权利要求1所述的基于波束形成的门控循环单元网络说话人分离方法，其特征在于，所述门控循环单元模型包括：

4.根据权利要求3所述的基于波束形成的门控循环单元网络说话人分离方法，其特征在于，所述门控循环单元模型的训练方法包括：

5.根据权利要求4所述的基于波束形成的门控循环单元网络说话人分离方法，其特征在于，所述训练集为voxceleb。

6.根据权利要求1所述的基于波束形成的门控循...

【专利技术属性】
技术研发人员：王晓琴，张若雨，李郡，尚德龙，周玉梅，
申请(专利权)人：中科南京智能技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人