利用可变长子字的语音合成系统和方法技术方案

技术编号:3046435 阅读:157 留言:0更新日期:2012-04-11 18:40
一种语音合成方法,包括:    接收输入文本串;    将所述输入文本串与索引的声音目录进行比较;    从所述声音目录中检索出与所述输入文本串相应的完整子字波形;    从所述声音目录中检索出与所述输入文本串相应的音素串波形;    从所述声音目录中检索出与所述输入文本串相应的单个音素波形;和    联接所述波形,以提供与所述输入文本串相应的合成语音。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及一种利用一个相对较小的声音目录实现语音合成的方法和系统。本专利技术特别适用于,但不仅限于,例如移动电话和个人数字助理等的手持装置的语音合成。
技术介绍
熟知的复杂的语音合成技术使用的是一种联接的方法。该技术使用的是存储在发音数据库中的讲话发音的实际记录。发音的各个部分经重新组合或联接,来生成各种口语短语。被重新组合的部分可以包括完整的词语,词语段或者甚至是单个音节的更小分段。当较大的词语段被联接时,所得到的合成语音听起来要更为自然一些。然而,当使用较大的词语段时,就需要大容量的存储器来存放声音数据,才能够维持一个可以合成相当大词汇量的声音数据库。可以通过仅仅存储较小的段,例如双音素或者单音,来减小这种声音数据库的大小;然而由此得到的合成语音的质量也通常会降低。这是因为形成正确的音调和非常短的语音段之间过渡时间长度,从而产生自然发声的语音是困难的。存在复杂的技术分析小的音素链单元,例如CV和VCV(在此C代表辅音,V代表元音)。然而实现该技术的算法将会非常复杂和需要加强处理器。其他用于减小与语音合成系统相关的声音数据库大小的方法包括使用称为共振峰合成法的技术。使用本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音合成方法,包括接收输入文本串;将所述输入文本串与索引的声音目录进行比较;从所述声音目录中检索出与所述输入文本串相应的完整子字波形;从所述声音目录中检索出与所述输入文本串相应的音素串波形;从所述声音目录中检索出与所述输入文本串相应的单个音素波形;和联接所述波形,以提供与所述输入文本串相应的合成语音。2.根据权利要求1的方法,还包括通过如下步骤生成所述声音目录的步骤对大文本语料库实施一个统计分析来决定常用词,和将所述常用词划分成位置音节。3.根据权利要求2的方法,其中所述产生所述声音目录的步骤还包括以下步骤将来自所述位置音节的音素归类;和舍弃具有低清晰度的所述音素。4.根据权利要求2的方法,其中所述产生所述声音目录的步骤还包括以下步骤计算CV型子字在所述大文本语料库中的频率;和选择在所述的大文本语料库中最常用的所述子字。5.根据权利要求1的方法,其中所述联接所述波形的步骤包括硬联接所述子字波形。6.根据权利要求...

【专利技术属性】
技术研发人员:祖漪清陈桂林俞振利岳东剑
申请(专利权)人:摩托罗拉公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1