韵律结构预测方法和装置制造方法及图纸

技术编号:11942006 阅读:90 留言:0更新日期:2015-08-26 13:06
本发明专利技术提出一种韵律结构预测方法和装置,该韵律结构预测方法包括:对无标注数据进行学习获得词语的词向量;对所述词语的词向量进行聚类,获得所述词向量的聚类特征;将所述词向量的聚类特征加入从标注数据提取的特征集合中;对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型;通过所述韵律结构预测模型进行韵律结构预测。本发明专利技术在训练获得韵律结构预测模型时,引入了词向量的聚类特征,提升了韵律结构预测模型的性能,进而可以提升语音合成的效果。

【技术实现步骤摘要】
韵律结构预测方法和装置
本专利技术涉及语音合成
,尤其涉及一种韵律结构预测方法和装置。
技术介绍
韵律结构预测技术是语音合成技术的核心,韵律结构预测的准确与否,直接影响到语音合成系统后端的声学建模部分,由此可见,韵律结构预测在语音合成系统中的重要地位。现有的韵律结构预测模型主要是利用监督学习的方法来训练得到的,为了使得韵律结构预测模型达到较好的性能,往往需要大量人工标注的训练数据。由于韵律结构预测问题属于自然语言处理(NaturalLanguageProcessing;以下简称:NLP)中的结构化预测问题,而结构化预测问题的训练数据又很难获得,并且还存在标注一致性的问题,因此,基于监督学习方法的韵律结构预测模型的性能往往受制于训练数据的数量以及质量,这主要体现在训练数据的稀疏性和歧义性这两个方面,经常导致基于监督学习方法的韵律结构预测模型无法正确预测出句子或句子中的词语的韵律结构。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种韵律结构预测方法。该方法在训练获得韵律结构预测模型时,引入了词向量的聚类特征,提升了韵律结构预测模型的性能,进而可以提升语音合成的效果。本专利技术的第二个目的在于提出一种韵律结构预测装置。为了实现上述目的,本专利技术第一方面实施例的韵律结构预测方法,包括:对无标注数据进行学习获得词语的词向量;对所述词语的词向量进行聚类,获得所述词向量的聚类特征;将所述聚类特征加入从标注数据提取的特征集合中;对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型;通过所述韵律结构预测模型进行韵律结构预测。本专利技术实施例的韵律结构预测方法,对无标注数据进行学习获得词语的词向量,然后对上述词语的词向量进行聚类,获得上述词向量的聚类特征,再将上述词向量的聚类特征加入从标注数据提取的特征集合中,最后对加入上述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型,从而在训练获得韵律结构预测模型时,引入了词向量的聚类特征,提升了韵律结构预测模型的性能,然后通过上述韵律结构预测模型进行韵律结构预测,进而可以提升语音合成的效果。为了实现上述目的,本专利技术第二方面实施例的韵律结构预测装置,包括:学习模块,用于对无标注数据进行学习获得词语的词向量;聚类模块,用于对所述学习模块获得的所述词语的词向量进行聚类,获得所述词向量的聚类特征;添加模块,用于将所述聚类模块获得的所述词向量的聚类特征加入从标注数据提取的特征集合中;训练模块,用于对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型;预测模块,用于通过所述训练模块获得的韵律结构预测模型进行韵律结构预测。本专利技术实施例的韵律结构预测装置中,学习模块对无标注数据进行学习获得词语的词向量,然后聚类模块对上述词语的词向量进行聚类,获得上述词向量的聚类特征,再由添加模块将上述词向量的聚类特征加入从标注数据提取的特征集合中,最后训练模块对加入上述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型,从而在训练获得韵律结构预测模型时,引入了词向量的聚类特征,提升了韵律结构预测模型的性能,然后预测模块通过上述韵律结构预测模型进行韵律结构预测,进而可以提升语音合成的效果。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术韵律结构预测方法一个实施例的流程图;图2为本专利技术韵律结构预测方法中韵律结构预测模型的架构一个实施例的示意图;图3为本专利技术韵律结构预测方法中进行了聚类特征提取后的训练语料的示意图;图4为本专利技术采用改进后的韵律结构预测模型的语音合成系统一个实施例的示意图;图5为本专利技术韵律结构预测装置一个实施例的结构示意图;图6为本专利技术韵律结构预测装置另一个实施例的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1为本专利技术韵律结构预测方法一个实施例的流程图,如图1所示,该韵律结构预测方法可以包括:步骤101,对无标注数据进行学习获得词语的词向量。具体地,对无标注数据进行学习获得词语的词向量可以为:通过类神经网络语音模型以无监督学习的方式对无标注数据进行学习获得词语的词向量。步骤102,对上述词语的词向量进行聚类,获得上述词向量的聚类特征。具体地,对上述词语的词向量进行聚类,获得上述词向量的聚类特征可以为:对上述词语的词向量进行聚类,获得聚类后的每个类别的类中心向量;计算给定的词语的词向量与所有类中心向量的余弦相似度;判断上述余弦相似度中最大的余弦相似度是否大于预先设置的阈值;如果是,则确定上述给定的词语的词向量的聚类特征为上述最大的余弦相似度所对应的类别符号。而如果上述余弦相似度中最大的余弦相似度小于或等于预先设置的阈值,则可以确定上述给定的词语的词向量的聚类特征为“-1”。步骤103,将上述词向量的聚类特征加入从标注数据提取的特征集合中。步骤104,对加入上述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型。具体地,对加入上述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型可以为:通过监督学习的方式对加入上述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型。步骤105,通过上述韵律结构预测模型进行韵律结构预测。上述韵律结构预测方法中,对无标注数据进行学习获得词语的词向量,然后对上述词语的词向量进行聚类,获得上述词向量的聚类特征,再将上述词向量的聚类特征加入从标注数据提取的特征集合中,最后对加入上述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型,从而在训练获得韵律结构预测模型时,引入了词向量的聚类特征,提升了韵律结构预测模型的性能,然后通过上述韵律结构预测模型进行韵律结构预测,进而可以提升语音合成的效果。本专利技术图1所示实施例提供的韵律结构预测方法实质上是基于半监督学习方法的韵律结构预测技术。该方法首先通过类神经网络语言模型以无监督学习的方式对海量无标注数据进行学习获得词语的词向量,进而对上述词语的词向量进行聚类,获得上述词向量的聚类特征,然后将聚类特征作为新增特征加入到特征集合中,最后再通过监督学习的方式对加入上述词向量的聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型。由于本专利技术采用的是无监督学习方法和监督学习方法的结合技术,因此本专利技术也可以称为基于半监督学习方法的韵律结构预测技术。图2为本专利技术韵律结构预测方法中韵律结构预测模型的架构一个实施例的示意图。从图2中可以看出,本专利技术提供的韵律结构预测方法区别于现有的韵律结构预测技术的主要创新点是引入了基于海量无标注数据的聚类特征。聚类特征的生成是利用聚类算法对词向量作聚类而得到的。由于基于词向量的聚类特征利用了海量无标注数据所本文档来自技高网...
韵律结构预测方法和装置

【技术保护点】
一种韵律结构预测方法,其特征在于,包括:对无标注数据进行学习获得词语的词向量;对所述词语的词向量进行聚类,获得所述词向量的聚类特征;将所述词向量的聚类特征加入从标注数据提取的特征集合中;对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型;通过所述韵律结构预测模型进行韵律结构预测。

【技术特征摘要】
1.一种韵律结构预测方法,其特征在于,包括:对无标注数据进行学习获得词语的词向量;对所述词语的词向量进行聚类,获得所述词向量的聚类特征;将所述词向量的聚类特征加入从标注数据提取的特征集合中;对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型;通过所述韵律结构预测模型进行韵律结构预测。2.根据权利要求1所述的方法,其特征在于,所述对无标注数据进行学习获得词语的词向量包括:通过类神经网络语音模型以无监督学习的方式对无标注数据进行学习获得词语的词向量。3.根据权利要求1所述的方法,其特征在于,所述对所述词语的词向量进行聚类,获得所述词向量的聚类特征包括:对所述词语的词向量进行聚类;获得聚类后的每个类别的类中心向量;计算给定的词语的词向量与所有类中心向量的余弦相似度;判断所述余弦相似度中最大的余弦相似度是否大于预先设置的阈值;如果是,则确定所述给定的词语的词向量的聚类特征为所述最大的余弦相似度所对应的类别符号。4.根据权利要求1-3任意一项所述的方法,其特征在于,所述对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型包括:通过监督学习的方式对加入所述聚类特征的特征集合进行训练获得带有聚类特征的韵律结构预测模型。5.一种韵律结构预测装置,其特征在于,包括:学习模块,用于对无标注数据进行学习获得词语的词向量;...

【专利技术属性】
技术研发人员:陈志杰李秀林
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1