定量的F0轮廓生成装置及方法、以及用于生成F0轮廓的模型学习装置及方法制造方法及图纸

技术编号：13145151 阅读：57 留言：0更新日期：2016-04-07 05:07

本发明专利技术提供一种基于统计模型的F0轮廓的合成装置，能够在确保精度的同时使语言学信息与F0轮廓的对应变得明确。HMM学习装置包括：参数估计部，其将与连续F0轮廓(132)拟合的F0轮廓(133)作为短语成分与音调成分之和来表征，并估计这些成分的目标点；和HMM学习单元，其将拟合后的F0轮廓作为学习数据来进行HMM(139)的学习。也可以将连续F0轮廓(132)分离为音调成分(134)、短语成分(136)及微韵律成分(138)来进行单独的HMM(140、142、144)的HMM学习。利用文本解析的结果，单独地根据HMM(140、142、144)来生成音调成分、短语成分及微韵律成分，并进行合成来获得F0轮廓。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及声音合成技术，特别是涉及声音合成时的基频轮廓（fundamental frequency contours)的合成技术。
技术介绍
声音的基频的时间变化轮廓（以下称为"F0轮廓"）有助于使句子的划分明确、表现音调(accent)位置、或者区分单词。F0轮廓还在传递伴随于发声的感情等非语言的信息方面发挥着很大作用。进而，F0轮廓对于发声的自然度也会产生较大影响。特别是，为了使发声中的焦点所在的位置明了，从而使句子的构造明确，需要使句子以适当的语调来发声。若 F0轮廓不适当，则有损于合成声音的可理解性。因此，在声音合成中，如何合成期望的F0轮廓成为大的问题。作为F0轮廓的合成方法，存在后述的非专利文献1中公开的被称为藤崎模型的方法。藤崎模型是通过少量的参数来定量地描述F0轮廓的F0轮廓生成过程模型。参照图 1，该F0轮廓生成过程模型30是将F0轮廓作为短语成分、音调成分与基底成分F b之和来表现的模型。所谓短语成分是指在发声之中按照下述方式变化的成分，即，该成分具有在一个短语开始之后立即上升到顶峰，然后直至短语结束为止缓慢下降。所谓音调成分是指由与词对应的局部凹凸来表征的成分。参照图1的左侧，在藤崎模型中，由短语控制机构42针对在短语的起始处产生的脉冲型的短语指令40的响应来表征短语成分。另一方面，音调成分同样由音调控制机构46针对台阶状的音调指令44的响应来表征。通过利用加法器48将这些短语成分、音调成分与基底成分F b的对数l〇geFb进行加法运算，从而可获得F0轮廓50的对数表现l〇g eF0(t)...

【技术保护点】
一种定量的基频F0轮廓生成装置，其中，包括：针对通过文本解析而获得的发声的韵律词，利用所赋予的数量的目标点来生成基频F0轮廓的音调成分的单元；按照包含发声的构造的语言信息，将发声分为包含一个以上的韵律词的小组，从而利用被限定的数量的目标点来生成基频F0轮廓的短语成分的单元；和基于所述音调成分和所述短语成分来生成基频F0轮廓的单元。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：倪晋富，志贺芳则，
申请(专利权)人：国立研究开发法人情报通信研究机构，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人