语音合成装置及其方法制造方法及图纸

技术编号:3048218 阅读:199 留言:0更新日期:2012-04-11 18:40
一种语音合成装置,包括:从外部获取用于语音合成的文本数据的文本获取装置;对文本数据执行形态分析/解析的语言处理器;根据文本数据的与韵律和语言有关的属性,诸如重音和词性,向语音合成器输出合成单元串的韵律处理器;根据合成单元串产生合成语音的语音合成器;以及在输出合成语音被积累后或者在其被输出时顺序地再现规定量的输出合成语音的语音波形输出装置。

【技术实现步骤摘要】
【国外来华专利技术】
本申请涉及语音合成装置、语音合成方法和语音合成程序,其允许根 据在自然语言表现中使用的诸如音素符号/音节符号或者字符序列的音位 符号来合成语音。
技术介绍
如在日本声学学会的2004年秋季会汉的会汉录第369 - 370页所述的, 已知作为提高传统的语音合成器的声音质量的方法,增加可用的波形数据 是有效的。实现该方法的推荐方案是在存储器和硬盘之间分布大量的波形 数据并使用。根据日本专利申请公开号07-141000所公开的内容,在产生每个由多 个合成单元的组合构成的合成单元串(处理单元)的合成语音的语音合成 装置中,当大量的波形数据分布在存储器和硬盘之间时,更频繁使用的波 形数据在允许数据以高速获取的存储器中具有优先权。日本专利申请公开号2005-266010公开了一种基于多个子成本从开头 顺序地确定合成片段的方法,其中子成本包括与访问存储有合成片段(在 日本专利申请公开号07-14100中称为语音片段)的波形数据的存储设 备的访问速度有关的成本(访问速度成本)。根据由日本专利申请爿i^开号07-14100和2005-266010所7>开的方法,用于产生与多个处理单元对应的合成语音所需要的总处理时间可以在一定 程度上减少,如果不需要严格的可靠性。时,在允许数据仅以低速获取的硬盘中提供的波形数据可能被集中地使用。 在这种情况下,用于从硬盘获取波形数据所需要的时间占了用于产生与处 理单元对应的合成语音所需要的时间的过多的百分比,这可导致处理单元 时间在多个处理单元中变化很大。然而,既没有避免该变化的方法,也没的增加的方法。如前所述,根据传统技术,在用于产生合成语音所需要的时间上在多 个处理单元之间有很大的不同。由于数据获取操作造成的在用于产生合成 语音所需要的时间上的增加不能完全减小。
技术实现思路
因此,本专利技术旨在解决上述的问题,本专利技术的目的在于提供一种语音 合成器、语音合成方法和语音合成程序,其使由于数据获取操作造成的在 用于产生合成语音所需要的时间上的增加能够被完全防止,而在用于产生根据本专利技术的实施例,语音合成器获取与在输入合成单元串中包括的 规定处理单元中多个合成单元对应的合成片段的波形数据,并通过连接波形数据而合成语音,该语音合成器包括属性信息存储々某体,其存储除了 波形数据之外的所述合成片段的属性信息;多个波形数据存储媒体,其存储所述合成片段的波形数据,其中所述合成片段具有不同的用于获取所述所存储的波形数据的数据获取时间;数据位置信息存储媒体,其存储包括据位置信息;候选获取单元,其根据所述处理单元中每个所述合成单元的 属性信息,从所述属性信息存储媒体中获取与每个所述合成单元对应的合 成片段候选;合成片段选择器,其获取多个序列,其中每个序列包括对每6个所述合成单元获取的多个合成片段候选的组合,并根据所述位置信息从 所述多个序列中选择一个序列,以使得用于获取所述处理单元中所述合成片段的波形数据所需要的总时间不超过数据获取时间的上限;合成片段产 生单元,其组合所述所选择的一个序列上的合成片段以产生合成片段串; 以及波形生成器,其从每个所述波形数据存储媒体中获取在所述合成片段 串中包括的合成片段的波形数据并连接这些数据。根据本专利技术,在用于产生合成语音所需要的时间上在处理单元之间不 会产生大的不同,并且由于数据获取操作造成的在用于产生合成语音所需 要的时间上的增加能够完全减少。附图说明图l是才艮据本专利技术的第一实施例的语音合成装置的结构的框图2是才艮据第一实施例的语音合成装置中的语音合成器14的结构的框图3是说明根据第一实施例的语音合成装置的操作的流程图; 图4是说明根据第一实施例的语音合成装置中的语音合成器14的操作 的流程图5是说明初步选择的图6A是说明当与获取数据有关的条件没有满足时的处理的图; 图6B是(与波形数据有关的)数据位置信息的内部结构的例子的表; 图7A和7B是说明连接成本计算的图; 图8是i^明总成本计算的图9是说明获取数据的条件(每个访问等级中的最佳路径计算1)的图IO是说明获取数据的条件(每个访问等级中的最佳路径计算2)的图ll是说明获取数据的条件(每个访问等级中的最佳路径计算3)的图;图12是说明存储所有访问等级中的最佳路径的路径和总成本的方式的图13是说明获取数据的条件(当对处理单元的应用完成时的结果)的图14是说明获取数据的条件(处理单元中的最佳路径)的图; 图15是示出本专利技术的第二实施例的总体结构的语音合成装置的结构 的框图16是根据第二实施例的语音合成装置中的语音合成器17的结构的 框图17是说明根据第二实施例的语音合成装置中的语音合成器17的操 作的流程图18A是说明当与获取数据有关的条件没有满足时的处理的图18B是(与波形数据有关的)数据位置信息的内部结构的例子的表;图19是说明获取数据的条件(每个访问等级中的最佳路径选择l)的图20是说明获取数据的条件(每个访问等级中的最佳路径选择2)的图21示出所有等级中的最佳路径;图22是说明获取数据的条件(当在处理单元处获取数据的条件的应用 完成时)的图23是示出如何将获取数据的条件应用于多个合成单元之间的间隔的图。具体实施方式 术语的定义在描述本专利技术的实施例之前,在此定义将要^f吏用的术语。 术语合成单元指构成合成语音或人发出的语音的基本单元,和当 形成多个共享某个共同特征的波形数据组时使用的一类单元。在传统的例素、cvc、 vcv等(其中c表示辅 音,v表示元音)。术语合成单元串是多个合成单元的序列。 术语处理单元指满足规定条件的多个合成单元的序列。 术语条件,,包括例如与目标合成语音的合成单元对应的段的时长的 数量或者总和。术语音位符号对应于提供给基于某个合成单元的每个分类集合的 标签。例如,当合成单元是音素时,音素符号对应于音位符号。在传统的 例子中,有音素符号、语音符号、音节符号及其组合。术语合成片段指属于任何基于某个合成单元的分类集合的单元。 例如,当音素是合成单元时,只有共享规定的共同特征的波形数据属于具 有相同音素符号的所记录的语音段的波形数据的集合。通过向这些类型的 波形数据提供属性而不是波形数据,完成一个合成片段,其中,属性是诸 如采用自然语言的发音段中的与语言有关的属性(诸如距离重音核心的距 离、包括该段的词的词类),所发出的语音段的声学属性(诸如基频)有 关的值(属性值)。术语片段属性指除了波形数据之外的合成片段的任何属性。片段 属性包括例如上述的与语言有关的属性(语言属性)和声学属性。术语片段数据总体表示合成片段的属性的值。该术语总体表示每 个合成片段的波形数据、片段属性基频的数据等。术语片段ID是分配^个合成片段以识别其自身的标识符。 现在参照附图并使用这些术语描述本专利技术的实施例。 第一实施例现在参照图1至图14描述根据本专利技术的第一实施例的语音合成装置。 (1)语音合成装置的结构图1是才艮据本实施例的语音合成装置10的结构的框图。 语音合成装置10包括从外部获取用于语音合成的文本数据的文本获 取装置11、对文本数据执行形态分析/解析的语言处理器12、根据文本数9据的与韵律和语言相关的属性(诸如重音和词性)向语音合成器14输出合 成单元串的韵律处理器13、根据合成单元串产生合成语音的语本文档来自技高网
...

【技术保护点】
一种语音合成装置,其获取与在输入合成单元串中包括的规定处理单元中多个合成单元对应的合成片段的波形数据,并通过连接所述波形数据来合成语音,所述装置包括: 属性信息存储媒体,其存储除了所述波形数据之外的所述合成片段的属性信息; 多个 波形数据存储媒体,其存储所述合成片段的波形数据,用于从所述多个波形数据存储媒体中获取所述所存储的波形数据所需要的时间彼此不同; 数据位置信息存储媒体,其存储包括存储每个所述合成片段的所述波形数据的波形数据存储媒体的标识符的数据位置信息 ; 候选获取装置,其被配置为根据所述处理单元中每个所述合成单元的属性信息,从所述属性信息存储媒体中获取与每个所述合成单元对应的合成片段候选; 合成片段选择器,其被配置为获取多个序列,其中每个序列包括对于每个所述合成单元获取的多个 合成片段候选的组合,并根据所述数据位置信息从所述多个序列中选择一个序列,以使得用于获取所述处理单元中所述合成片段的波形数据所需要的总时间不超过数据获取时间的上限; 合成片段生成器,其被配置为组合所述所选择的一个序列上的合成片段以生成合 成片段串;以及 波形生成器,其被配置为从每个所述波形数据存储媒体中获取在所述合成片段串中包括的合成片段的波形数据,并连接所述波形数据。...

【技术特征摘要】
【国外来华专利技术】JP 2006-3-29 092489/20061. 一种语音合成装置,其获取与在输入合成单元串中包括的规定处理单元中多个合成单元对应的合成片段的波形数据,并通过连接所述波形数据来合成语音,所述装置包括属性信息存储媒体,其存储除了所述波形数据之外的所述合成片段的属性信息;多个波形数据存储媒体,其存储所述合成片段的波形数据,用于从所述多个波形数据存储媒体中获取所述所存储的波形数据所需要的时间彼此不同;数据位置信息存储媒体,其存储包括存储每个所述合成片段的所述波形数据的波形数据存储媒体的标识符的数据位置信息;候选获取装置,其被配置为根据所述处理单元中每个所述合成单元的属性信息,从所述属性信息存储媒体中获取与每个所述合成单元对应的合成片段候选;合成片段选择器,其被配置为获取多个序列,其中每个序列包括对于每个所述合成单元获取的多个合成片段候选的组合,并根据所述数据位置信息从所述多个序列中选择一个序列,以使得用于获取所述处理单元中所述合成片段的波形数据所需要的总时间不超过数据获取时间的上限;合成片段生成器,其被配置为组合所述所选择的一个序列上的合成片段以生成合成片段串;以及波形生成器,其被配置为从每个所述波形数据存储媒体中获取在所述合成片段串中包括的合成片段的波形数据,并连接所述波形数据。2. 根据权利要求l所述的装置,其中,所述数据获取时间的上限被转 换为多少次从每个所述波形数据存Wf某体中获取数据的数量。3. 根据权利要求l所述的装置,其中,所述数据获取时间的上限被转 换为对每个所述波形数据存储媒体的访问时间。4. 根据权利要求l所述的装置,其中,所述的数据获取时间的上限能够改变。5. 根据权利要求l所述的装置,其中,当所述合成片段选择器根据所 述数据位置信息从所述多个序列中选择一个序列以使得所述数据获取时间 的上限不^^过时,所述合成片段选择器选择没有使所述数据获取时间的 上限被超过的多个序列,根据通过逐级划分所述数据获取时间的上限而产 生的等级而对所述数据串分级,在...

【专利技术属性】
技术研发人员:西山修森田真弘笼岛岳彦
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1