【技术实现步骤摘要】
韵律短语边界预测模型训练方法和韵律短语边界预测方法
本专利技术属于语音合成
,主要涉及一种韵律短语边界预测模型训练方法、韵律短语边界预测方法、韵律短语边界预测模型训练装置、以及电子设备。
技术介绍
在语音合成中,文本数据的韵律预测一直是前端文本处理的重要工作,预测位置的正确与否直接影响着合成语音的自然度和语义信息的理解。因此,正确的预测出文本数据的韵律边界有着重要的意义。现有的韵律短语预测方法一般都是针对单个语种来构建模型,这种模型一般为条件随机场模型(CRF)、最大熵模型(ME)等,通过模型训练后获得预测模型,通过预测模型得到韵律短语边界的预测结果。由于是基于单个语种的文本来进行韵律预测,训练的模型也只是针对单个语种之间,样本数量少。某一个语种的韵律短语预测的模型对于和它相似语序的语种没有普适性,对于稀缺的语种文本,由于数据过少难以建立有效的模型结构,此外由于对文本端提取的特征也过于简单,无法挖掘到语种文本的更深层信息,很难使用神经网络的模型训练,从而无法有效的预测文本的韵律短语边界,对后期语音合成的效果影响 ...
【技术保护点】
1.一种韵律短语边界预测模型训练方法,包括:/n获取训练文本集,其中,所述训练文本集中的每条训练文本包括至少两种相似语序语种的训练文本;/n获取每条所述训练文本的文本特征,其中所述文本特征包括所述训练文本中每个单词的词面、词性、词长、词缀、停顿概率、词向量、以及语种标志位;/n利用每条所述训练文本的文本特征、以及所述训练文本的标签训练初始韵律短语边界预测模型,得到经训练得到的韵律短语边界预测模型,其中所述训练文本的标签用于表征所述训练文本中每个单词的停顿状态。/n
【技术特征摘要】
1.一种韵律短语边界预测模型训练方法,包括:
获取训练文本集,其中,所述训练文本集中的每条训练文本包括至少两种相似语序语种的训练文本;
获取每条所述训练文本的文本特征,其中所述文本特征包括所述训练文本中每个单词的词面、词性、词长、词缀、停顿概率、词向量、以及语种标志位;
利用每条所述训练文本的文本特征、以及所述训练文本的标签训练初始韵律短语边界预测模型,得到经训练得到的韵律短语边界预测模型,其中所述训练文本的标签用于表征所述训练文本中每个单词的停顿状态。
2.根据权利要求1所述的训练方法,所述韵律短语边界预测模型包括降维特征模型和DNN网络,其中所述降维特征模型用于对所述训练文本进行降维处理得到高阶特征向量,所述DNN网络用于输出所述训练文本中每个单词的停顿状态。
3.根据权利要求1所述的训练方法,其中,利用所述训练文本的文本特征、以及所述训练文本的标签训练初始韵律短语边界预测模型,得到经训练得到的韵律短语边界预测模型包括:
利用所述训练文本的文本特征训练初始降维特征模型,得到经训练得到的降维特征模型;
将所述训练文本的文本特征输入所述降维特征模型,输出所述训练文本的高阶特征向量;
利用所述训练文本的高阶特征向量、以及所述训练文本的标签训练初始DNN网络,得到经训练得到的DNN网络;
将所述降维特征模型和所述DNN网络结合,得到所述韵律短语边界预测模型。
4.根据权利要求3所述的训练方法,其中,利用所述训练文本的文本特征训练初始降维特征模型,得到经训练得到的降维特征模型包括:
将所述训练文本的文本特征输入所述初始降维特征模型;
通过误差反向传播算法调整所述初始降维特征模型的网络权值,使得所述初始降维特征模型的输出层节点值逼近输入层节点值,直到在所述输出层节点值和所述输入层节点值的差值满足预设条件的情况下,得到经训练得到的降维特征模型。
5.根据权利要求3所述的训练方法,其中,利用所述训练文本的高阶特征向量、以及所述训练文本的标签训练初始DNN网络,得到经训练得到的DNN网络包括:
将所述训练文本的高阶特征向量、以及所述训练文本的标签输入...
【专利技术属性】
技术研发人员:江源,窦云峰,凌震华,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。