基于自适应非平行训练的语音转换方法技术

技术编号：10596617 阅读：389 留言：0更新日期：2014-10-30 09:22

本发明专利技术公开了一种基于自适应非平行训练的语音转换方法，该方法包括以下步骤：从采集到的语音样本中检测出有效语音信号，对有效语音信号进行预处理；对于预处理后得到的有效语音信号提取语音特征参数；基于语音特征参数进行UBM训练，得到一个与说话人无关的UBM模型；基于所述UBM模型，得到与说话人有关的独立说话人语音模型，基于所述独立说话人语音模型，得到频谱参数和基频参数的转换函数；将待转换语音的语音特征参数输入到转换函数中，得到转换后的目标说话人的语音特征参数；将转换后的目标说话人的语音特征参数进行合成，得到目标语音。本发明专利技术不仅具有较好的转换性能，而且具有很好的系统扩展性。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种，该方法包括以下步骤：从采集到的语音样本中检测出有效语音信号，对有效语音信号进行预处理；对于预处理后得到的有效语音信号提取语音特征参数；基于语音特征参数进行UBM训练，得到一个与说话人无关的UBM模型；基于所述UBM模型，得到与说话人有关的独立说话人语音模型，基于所述独立说话人语音模型，得到频谱参数和基频参数的转换函数；将待转换语音的语音特征参数输入到转换函数中，得到转换后的目标说话人的语音特征参数；将转换后的目标说话人的语音特征参数进行合成，得到目标语音。本专利技术不仅具有较好的转换性能，而且具有很好的系统扩展性。【专利说明】
本专利技术涉及语音信号分析、语音信号处理、语音转换以及语音合成等领域，具体涉及一种，属于语音信号处理领域中的语音转换分支。
技术介绍
语音转换是指在保持语义内容不变的前提下，改变说话人的个性特征，使源说话人的语音在经过变换后听起来像是目标说话人说的一样。语音转换是对语音综合与识别技术的深度发展，语音转换作为语音信号处理领域的新的分支，具有高度的理论研究价值和应用前途。借鉴语音分析与合成、语音识别技术、语音编解码技术、语音增强以及说话人确认和辨识等领域的知识，为语音转换技术的发展提供技术支持，而语音转换技术的研究，又将促进这些领域的发展，为这些领域的进一步研究提供极具价值的参考意义。目前，语音转换从大的类别上可分为同种语言之间的语音转换和跨语言的语音转换。对于同种语言之间的语音转换，在训练阶段，因语料的选择不同，又分为平行语料训练和非平行语料训练。对...

【技术保护点】
一种基于自适应非平行训练的语音转换方法，其特征在于，该方法包括以下步骤：步骤1，从采集到的语音样本中检测出有效语音信号，对所述有效语音信号进行预处理；步骤2，对于预处理后得到的有效语音信号提取语音特征参数；步骤3，基于所述语音特征参数进行UBM训练，得到一个与说话人无关的UBM模型；步骤4，基于所述UBM模型，得到与说话人有关的独立说话人语音模型，基于所述独立说话人语音模型，得到频谱参数和基频参数的转换函数；步骤5，将待转换语音的语音特征参数输入到所述步骤4得到的转换函数中，得到转换后的目标说话人的语音特征参数；步骤6，将转换后的目标说话人的语音特征参数进行合成，得到目标语音。

【技术特征摘要】

【专利技术属性】
技术研发人员：王飞跃，孔庆杰，熊刚，朱凤华，朱春雷，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人