用于生成信息的方法和装置制造方法及图纸

技术编号:16820653 阅读:36 留言:0更新日期:2017-12-16 14:41
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取待合成语音对应的文本;提取该文本的文本特征;将该文本特征导入预先建立的时长信息生成模型,生成发音时长信息序列,其中,该发音时长信息序列包括该文本对应的音素序列中各音素的发音时长信息,其中,该时长信息生成模型用于表征文本特征与发音时长信息序列之间的对应关系,该时长信息生成模型基于包括跳层神经网络的神经网络建立,跳层神经网络为具有跳层连接结构的神经网络。该实施方式提高了生成的发音时长信息的准确性。

Methods and devices used to generate information

A method and device for generating information is disclosed in the present application embodiment. One embodiment of the method includes: obtaining the corresponding text to speech synthesis; text feature extraction of the text; the text features into the pre established time information generating model, long information sequence, which generate pronunciation, the pronunciation length information sequence including the phoneme phoneme sequence of the text in the corresponding pronunciation length information, the information model is used to generate a long correspondence between the sequence length information of text features and characterization of the pronunciation, the length of information generating model including neural network neural network based on the layer jump, jump layer neural network with neural network layer jump connection structure. The implementation method improves the accuracy of the long information when the pronunciation is generated.

【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
,具体涉及语音合成
,尤其涉及用于生成信息的方法和装置。
技术介绍
语音合成技术,又称文语转换技术,是通过机械的、电子的方法产生人造语音的技术。它是将计算机本地产生的或外部输入的文字信息转变为可以被人听得懂的、流利的语音的技术。在语音合成的过程中,需要对拼接多个语音单元对应的音频,语音单元可以是拼音,也可以是音素。然而,现有的语音合成的方法,通常是对语音单元的发音时长信息不做区分,即生成的发音时长信息相同。
技术实现思路
本申请实施例的目的在于提出一种用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成信息的方法,上述方法包括:获取待合成语音对应的文本;提取上述文本的文本特征;将上述文本特征导入预先建立的时长信息生成模型,生成发音时长信息序列,其中,上述发音时长信息序列包括上述文本对应的音素序列中各音素的发音时长信息,其中,上述时长信息生成模型用于表征文本特征与发音时长信息序列之间的对应关系,上述时长信息生成模型基于包括跳层神经网络的神经网络建立,跳层神经网络为具有跳层连接结构的神经网络。第二方面,本申请实施例提本文档来自技高网...
用于生成信息的方法和装置

【技术保护点】
一种用于生成信息的方法,其特征在于,所述方法包括:获取待合成语音对应的文本;提取所述文本的文本特征;将所述文本特征导入预先建立的时长信息生成模型,生成发音时长信息序列,其中,所述发音时长信息序列包括所述文本对应的音素序列中各音素的发音时长信息,其中,所述时长信息生成模型用于表征文本特征与发音时长信息序列之间的对应关系,所述时长信息生成模型基于包括跳层神经网络的神经网络建立,跳层神经网络为具有跳层连接结构的神经网络。

【技术特征摘要】
1.一种用于生成信息的方法,其特征在于,所述方法包括:获取待合成语音对应的文本;提取所述文本的文本特征;将所述文本特征导入预先建立的时长信息生成模型,生成发音时长信息序列,其中,所述发音时长信息序列包括所述文本对应的音素序列中各音素的发音时长信息,其中,所述时长信息生成模型用于表征文本特征与发音时长信息序列之间的对应关系,所述时长信息生成模型基于包括跳层神经网络的神经网络建立,跳层神经网络为具有跳层连接结构的神经网络。2.根据权利要求1所述的方法,其特征在于,所述时长信息生成模型包括第一神经网络和第二神经网络,其中,所述第一神经网络包括所述跳层神经网络,所述第一神经网络的输出是所述第二神经网络的输入。3.根据权利要求2所述的方法,其特征在于,所述第一神经网络包括一维卷积层,其中,所述一维卷积层的输出是所述跳层神经网络的输入。4.根据权利要求3所述的方法,其特征在于,所述第一神经网络还包括时间递归神经网络,所述跳层神经网络的输出是所述时间递归神经网络的输入。5.根据权利要求2-4中任一项所述的方法,其特征在于,所述文本特征为至少两种文本特征,并且所述时长信息生成模型包括的第一神经网络为预设数目个,所述预设数目个第一神经网络的输出是所述第二神经网络的输入;以及将所述文本特征导入预先建立的时长信息生成模型,生成发音时长信息序列,包括:对所述至少两种文本特征进行分组,生成所述预设数目个文本特征组;将所述预设数目个文本特征组分别导入所述预设数目个第一神经网络,得到由所述第二神经网络输出的发音时长信息序列。6.一种用于生成信息的装...

【专利技术属性】
技术研发人员:张黄斌
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1