韵律结构预测方法和装置制造方法及图纸

技术编号：11942006 阅读：111 留言：0更新日期：2015-08-26 13:06

本发明专利技术提出一种韵律结构预测方法和装置，该韵律结构预测方法包括：对无标注数据进行学习获得词语的词向量；对所述词语的词向量进行聚类，获得所述词向量的聚类特征；将所述词向量的聚类特征加入从标注数据提取的特征集合中；对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型；通过所述韵律结构预测模型进行韵律结构预测。本发明专利技术在训练获得韵律结构预测模型时，引入了词向量的聚类特征，提升了韵律结构预测模型的性能，进而可以提升语音合成的效果。

全部详细技术资料下载

【技术实现步骤摘要】
韵律结构预测方法和装置
本专利技术涉及语音合成
，尤其涉及一种韵律结构预测方法和装置。
技术介绍
韵律结构预测技术是语音合成技术的核心，韵律结构预测的准确与否，直接影响到语音合成系统后端的声学建模部分，由此可见，韵律结构预测在语音合成系统中的重要地位。现有的韵律结构预测模型主要是利用监督学习的方法来训练得到的，为了使得韵律结构预测模型达到较好的性能，往往需要大量人工标注的训练数据。由于韵律结构预测问题属于自然语言处理(NaturalLanguageProcessing；以下简称：NLP)中的结构化预测问题，而结构化预测问题的训练数据又很难获得，并且还存在标注一致性的问题，因此，基于监督学习方法的韵律结构预测模型的性能往往受制于训练数据的数量以及质量，这主要体现在训练数据的稀疏性和歧义性这两个方面，经常导致基于监督学习方法的韵律结构预测模型无法正确预测出句子或句子中的词语的韵律结构。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的第一个目的在于提出一种韵律结构预测方法。该方法在训练获得韵律结构预测模型时，引入了词...
韵律结构预测方法和装置

【技术保护点】
一种韵律结构预测方法，其特征在于，包括：对无标注数据进行学习获得词语的词向量；对所述词语的词向量进行聚类，获得所述词向量的聚类特征；将所述词向量的聚类特征加入从标注数据提取的特征集合中；对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型；通过所述韵律结构预测模型进行韵律结构预测。

【技术特征摘要】
1.一种韵律结构预测方法，其特征在于，包括：对无标注数据进行学习获得词语的词向量；对所述词语的词向量进行聚类，获得所述词向量的聚类特征；将所述词向量的聚类特征加入从标注数据提取的特征集合中；对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型；通过所述韵律结构预测模型进行韵律结构预测。2.根据权利要求1所述的方法，其特征在于，所述对无标注数据进行学习获得词语的词向量包括：通过类神经网络语音模型以无监督学习的方式对无标注数据进行学习获得词语的词向量。3.根据权利要求1所述的方法，其特征在于，所述对所述词语的词向量进行聚类，获得所述词向量的聚类特征包括：对所述词语的词向量进行聚类；获得聚类后的每个类别的类中心向量；计算给定的词语的词向量与所有类中心向量的余弦相似度；判断所述余弦相似度中最大的余弦相似度是否大于预先设置的阈值；如果是，则确定所述给定的词语的词向量的聚类特征为所述最大的余弦相似度所对应的类别符号。4.根据权利要求1-3任意一项所述的方法，其特征在于，所述对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型包括：通过监督学习的方式对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型。5.一种韵律结构预测装置，其特征在于，包括：学习模块，用于对无标注数据进行学习获得词语的词向量；...

【专利技术属性】
技术研发人员：陈志杰，李秀林，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人