语速相依韵律讯息产生装置及语速相依的阶层式韵律模块制造方法及图纸

技术编号：9867897 阅读：115 留言：0更新日期：2014-04-03 04:34

本案系提供一种可控制语速的韵律讯息产生装置，包含一第一输入端，用以接收一语速；一第二输入端，用以接收一语言参数；一语速相依的韵律生成模块，用以接收该语言参数及该语速，以产生该语速相依的一韵律声学特征参数；及一输出端，用以输出与该语速相依的一韵律声学特征参数。

全部详细技术资料下载

【技术实现步骤摘要】
语速相依韵律讯息产生装置及语速相依的阶层式韵律模块
本专利技术系关于一种韵律讯息产生装置，尤指一种以语速相依的阶层式韵律模块为基础的韵律讯息产生装置。
技术介绍
目前对于相异语速语音合成的讨论不少，但始终不能达成一流畅的自然合成语音。其中有以每个语音音框的时间轴进行伸张及压缩，藉以调整说话速度慢及快的研究，但并未考虑到语速对于韵律结构的影响；以线性预估的方式对输入语音进行语速修正，对输入的语音信号以线性插入或移除信号本身的研究，该方法虽简易有效率，但对于语速的考虑过于粗糙；以清化元音(devoiced vowel)的决定中考虑了语速影响,有效地改进清化元音在慢语速的退化程度的研究，但其韵律的产生方法并未考虑语速的影响；以对不同语速语料库建立韵律结构的转换关系，藉以达到语速转换的目的的研究，但该方法并不能掌握到连续语速的转换变化；虽有文献实现了可控制语速的TTSCText-to-Speech)，首先对三种速度(快、正常、慢)各自建立音长模型，对三个音长模型以内插方式来产生目标语速所需的音长，最后结合于HMM为基础的语音合成器，此方法仅考虑韵律之中的音长部份，并未对其它韵律参数进行语速影响调整，且由于不同语速需各自建立自己的音长模型，会使得模型参数量大增；再则它使用内插法去产生音长，无法获得准确的语速控制；另有文献对正常及快速语料分别建立HSMM模型，再以CMLLR对音长模型进行音长平均值的语速调适，该方法仅考虑韵律之中的音长部份，且由于不同语速需各自建立自己的音长模型，会使得模型参数量大增；及有进行大规模主观测试三种语速控制的方法研究，分别为:(I)...

【技术保护点】
一种可控制语速的韵律讯息产生装置，包含：一第一输入端，用以接收一语速；一第二输入端，用以接收一语言参数；一语速相依的韵律生成模块，用以配合该语言参数及该语速，以产生该语速相依的一韵律声学特征参数；及一输出端，用以输出与该语速相依的该韵律声学特征参数。

【技术特征摘要】
2012.09.10 TW 1011330591.一种可控制语速的韵律讯息产生装置，包含: 一第一输入端，用以接收一语速；一第二输入端，用以接收一语言参数；一语速相依的韵律生成模块，用以配合该语言参数及该语速，以产生该语速相依的一韵律声学特征参数 '及一输出端，用以输出与该语速相依的该韵律声学特征参数。2.如权利要求1所述的装置，其中根据所产生的语速相依的韵律声学特征参数，可使用习知的语音合成器来合成出相对应的任一指定语速的合成语音。3.如权利要求1所述的装置，其中该语言参数至少包含两参数，其中各该参数系选自由包含词类、标点符号、词长、声调、基本音节类型及韵母类型及其组合之一。4.如权利要求1所述的装置，其中该语速相依的韵律生成模块包含一语速相依的阶层式韵律模块、一语速相依的韵律讯息产生器、以及至少一个预估器，其中各该预估器系选自由包含一停顿标记预估器及一韵律状态预估器。5.如权利要求4所述的装置，其中该语速相依的韵律讯息产生器，根据一语速正规化函式、该语速相依的阶层式韵律模块的音节韵律声学模型及停顿声学模型、该韵律状态预估结果、该停顿标记预估结果、该输入语速及该语言参数，以产生一对应语速的韵律声学特征参数。6.如权利要求5所述的装置，其中该语速正规化函式用以调整韵律声学特征参数的统计特性成任一语速的统计特性；其所使用的正规化参数系采用整体语料的统计分布经平滑化而得到。`7.如权利要求4所述的装置，其中该语速相依的阶层式韵律模块包含一音节韵律声学模型、一停顿声学模型、一韵律状态模型、一停顿语法模型，俾与一语速相依。8.如权利要求4所述的装置，其中该停顿标记预估器，根据该语速、该语言参数和该语速相依的阶层式韵律模块的停顿语法模型而执行一停顿标记预估操作，以产生一停顿标记预估结果。9.如权利要求4所述的装置，其中该韵律状态预估器，根据该语速、该语速相依的阶层式韵律模...

【专利技术属性】
技术研发人员：陈信宏，王逸如，江振宇，谢乔华，
申请(专利权)人：财团法人交大思源基金会，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人