语音合成方法和装置制造方法及图纸

技术编号:3044129 阅读:174 留言:0更新日期:2012-04-11 18:40
与目标语音对应的音素序列被分割成多个段。对于每个段,从存储具有至少一个帧的语音单元的语音单元存储器中选择多个语音单元。多个语音单元具有与目标语音一致或相似的韵律特征。对于多个语音单元的每个帧,生成具有至少一个共振峰频率的共振峰参数。根据多个语音单元的每个帧的共振峰参数生成每个帧的融合共振峰参数。根据每个帧的融合共振峰参数生成每个段的融合语音单元。通过拼接每个段的融合语音单元生成合成语音。

【技术实现步骤摘要】

本专利技术涉及使用诸如音素序列、基音和音素时长的信息生成合成语音信号的语音合成方法和装置
技术介绍
根据任意的句子人工地生成语音信号被称为“文本语音合成”。通常,文本语音合成包括三个步骤:语言处理、韵律处理和语音合成。 首先,语言处理部从语形和语义上分析输入文本。其次,韵律处理部基于分析结果处理文本的重音和语调,并输出音素序列/韵律信息(基频、音段时长、功率)。第三,语音合成部基于音素序列/韵律信息合成语音信号。这样,可实现文本语音合成。 下面说明合成任意音素符号序列的合成器的原理。假设元音用“V”表示,辅音用“C”表示。诸如CV、CVC、和VCV的基本单元的特征参数(语音单元)被事先存储。通过控制基音和时长来拼接语音单元,从而合成语音。在该方法中,合成语音的质量大大取决于所存储的语音单元。 作为这样的语音合成方法的一种,通过以输入音素序列/韵律信息为目标,对每个合成单元(每一段)选择多个语音单元。通过融合多个语音单元生成新的语音单元,并通过拼接新的语音单元来合成语音。以下,该方法称为多单元选择融合方法。例如,该方法在JP-A No.2005-164749(公开号)中公本文档来自技高网...

【技术保护点】
一种合成语音的方法,包括: 将与目标语音对应的音素序列分割成多个段; 对于每个段,从存储具有至少一个帧的语音单元的语音单元存储器中选择多个语音单元,所述多个语音单元具有与所述目标语音一致或相似的韵律特征; 对于所述多个语音单元的每个帧,生成具有至少一个共振峰频率的共振峰参数; 根据所述多个语音单元的每个帧的共振峰参数,生成每个帧的融合共振峰参数; 根据每个帧的融合共振峰参数,生成每个段的融合语音单元;以及 通过拼接每个段的融合语音单元来生成合成语音。

【技术特征摘要】
JP 2007-8-17 212809/20071.一种合成语音的方法,包括将与目标语音对应的音素序列分割成多个段;对于每个段,从存储具有至少一个帧的语音单元的语音单元存储器中选择多个语音单元,所述多个语音单元具有与所述目标语音一致或相似的韵律特征;对于所述多个语音单元的每个帧,生成具有至少一个共振峰频率的共振峰参数;根据所述多个语音单元的每个帧的共振峰参数,生成每个帧的融合共振峰参数;根据每个帧的融合共振峰参数,生成每个段的融合语音单元;以及通过拼接每个段的融合语音单元来生成合成语音。2.根据权利要求1所述的方法,其中,生成共振峰参数包括从存储分别与每个语音单元对应的共振峰参数的共振峰参数存储器中提取所述多个语音单元的每一个的共振峰参数。3.根据权利要求2所述的方法,其中,所述共振峰参数存储器对应地存储所述共振峰参数的每一个、用于识别语音单元的语音单元号码和用于识别所述语音单元中的帧的帧号码。4.根据权利要求3所述的方法,其中,所述共振峰参数包括共振峰频率和表示所述语音单元的共振峰的形状的形状参数。5.根据权利要求4所述的方法,其中,所述共振峰参数存储器存储与相同的语音单元号码对应的多个共振峰参数,所述多个共振峰参数的每一个对应于所述帧号码。6.根据权利要求4所述的方法,其中,所述形状参数至少包括窗函数、相位和功率。7.根据权利要求4所述的方法,其中,所述形状参数至少包括功率和共振峰带宽。8.根据权利要求1所述的方法,其中,生成共振峰参数包括如果所述多个语音单元的每一个中的帧的个数不同,则使所述多个语音单元的每一个的帧的个数相等;以及通过相同的帧位置对应所述多个语音单元中的每个帧。9.根据权利要求1所述的方法,其中,生成融合共振峰参数包括如果所述多个语音单元的相对应的帧中的共振峰参数的共振峰频率的个数不同,则对应所述相对应的帧中的共振峰参数的每个共振峰频率,以使所述...

【专利技术属性】
技术研发人员:森中亮田村正统笼岛岳彦
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利