通过多形式段的生成和连接进行的合成制造技术

技术编号：5418983 阅读：191 留言：0更新日期：2012-04-11 18:40

描述了一种语音合成系统和方法。语音段数据库参考具有各种不同语音表示结构的语音段。语音段选择器从所述语音段数据库选择对应于目标文本的语音段候选的序列。语音段定序器根据所述语音段候选生成对应于所述目标文本的定序的语音段。语音段合成器组合定序的语音段来产生对应于所述目标文本的合成语音信号输出。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音合成(speech synthesis)。
技术介绍
机器生成的语音能够以许多不同的方式产生，并且用于许多不同的应用，但是当前存在两种广泛使用的用于合成语音信号的基本方法。一种方法试图使用模型来构造语音信号，而另一种方法连接(concatenate)预先存储的语音段(segment)。基于模型的方法倾向于在存储和灵活性方面是高效的，但是产生相当不自然的声音语音。基于模型的语音合成的示例是例如在 Proc. of Eurospeech, 1999，第 2347—2350 页的 T. Yoshimura^K. Tokuda、 Τ. Masuko> Τ.Kobayashi 禾口 Τ·Kitamura 的“Simultaneous Modeling Of Spectrum, Pitch And DurationIn HMM-Based Speech Synthesis，，中描述的基于隐 Markov 模型 (Hidden-Markov-Model, HMM)的语音合成，通过引用将其结合于此。语音合成的另一方法-段连接处于其最佳状态时能够产生非常自然的语音，但是相当不灵活并且需要大量的存储。大的语音数据语料库(corpus)需要被记录并且被准确地标记，以在商业可行的文本到语音系统中使用。基于段连接的方法的示例是例如在 Proceedings of ICSLP2000，第 395—398 页的 G. Coorman、J. FackrelU P. Rutten 禾口 B. Van Coile 的"Segment Selection...

【技术保护点】
一种语音合成系统，包括：语音段数据库，参考具有多个不同语音表示结构的语音段；语音段选择器，用于从所述语音段数据库选择对应于目标文本的语音段候选的序列；语音段定序器，用于根据所述语音段候选生成对应于所述目标文本的定序的语音段；以及语音段合成器，用于组合所述定序的语音段来产生对应于所述目标文本的合成语音信号输出。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：V波莱，A布里恩，
申请(专利权)人：微差通信公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人