基于并改进的深度聚类语音分离方法技术

技术编号:24012964 阅读:48 留言:0更新日期:2020-05-02 02:22
本发明专利技术涉及一种基于并改进的深度聚类语音分离方法,其中,包括:步骤一:混合实验数据,提取对数功率谱特征;步骤二:搭建改进的深度聚类语音分离模型,并用训练集进行模型训练;步骤三:将测试集混合语音通过步骤二训练好的深度聚类语音分离模型得出嵌入空间向量v

Deep clustering speech separation method based on and improved

【技术实现步骤摘要】
基于并改进的深度聚类语音分离方法
本专利技术涉及语音分离
,特别涉及一种基于并改进的深度聚类语音分离方法。
技术介绍
“鸡尾酒会问题”在语音分离任务上一直是一个难题,主要因为这个问题属于一个说话人无关的语音分离问题,对于说话人事先不知道其先验信息。通过参考Jonathan等人提出的基于理想二值掩蔽的深度聚类方法(deep-clustering),本专利技术在其基础上将聚类方法进行了改进,使用双向长短时记忆网络模型和均值漂移聚类,并在TIMIT语音数据集下进行了实验。最终分离效果显示,在低输入信噪比情况下,分离效果较之前模型有提高。语音分离一词最初源于“鸡尾酒会问题”,是指从混合的说话人声音中得到想要的目标说话人(一人或多人)的语音信号。在复杂的声音环境下,除了目标说话人的声音以外,通常还伴有其他人的说话声音,干扰人的语音信号会严重影响目标说话人的语音识别性能,这时候便需要语音分离技术来跟踪目标语音并且抑制干扰,从而进一步通过一系列的方法得到想要的语音信息。目前随着深度学习领域的迅速发展,以深度神经网络(DNN)为代表的深度本文档来自技高网...

【技术保护点】
1.一种基于并改进的深度聚类语音分离方法,其特征在于,包括:/n步骤一:混合实验数据,提取对数功率谱特征;/n步骤二:搭建改进的深度聚类语音分离模型,并用训练集进行模型训练;/n步骤三:将测试集混合语音通过步骤二训练好的深度聚类语音分离模型得出嵌入空间向量v

【技术特征摘要】
1.一种基于并改进的深度聚类语音分离方法,其特征在于,包括:
步骤一:混合实验数据,提取对数功率谱特征;
步骤二:搭建改进的深度聚类语音分离模型,并用训练集进行模型训练;
步骤三:将测试集混合语音通过步骤二训练好的深度聚类语音分离模型得出嵌入空间向量vi,对其在嵌入子空间上通过meanshift聚类方法聚类,将得到的结果作为训练目标理想二值掩蔽值,利用理想二值掩蔽值与输入语音信号特征计算得出分离出的两个语音信号的特征估计;
步骤四:波形重构,恢复语音信号。


2.如权利要求1所述的基于并改进的深度聚类语音分离方法,其特征在于,步骤一包括:
将原始的说话人语音数据按采样频率SR=8000Hz采样;
按照不同的输入信噪比,随机两两混合说话人语音,构成混合说话人语音训练集、验证集和测试集;
提取混合语音对数功率谱特征。


3.如权利要求2所述的基于并改进的深度聚类语音分离方法,其特征在于,计算对数功率谱...

【专利技术属性】
技术研发人员:王昕蒋志翔张杨寇金桥常新旭徐冬冬闫帅赵晓燕
申请(专利权)人:北京计算机技术及应用研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1