歌唱合成中基频参数生成方法及系统技术方案

技术编号:9463618 阅读:137 留言:0更新日期:2013-12-19 01:19
本发明专利技术涉及语音合成处理技术领域,公开了一种歌唱合成中基频参数生成方法及系统,所述方法包括:接收待合成简谱信息,所述简谱信息包括:歌词标注、音高标注、时长标注和节奏信息;根据所述音高标注确定各基本合成单元的理论基频参数;根据所述歌词标注确定各基本合成单元的基频参考模型;根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化。利用本发明专利技术,不仅可以保证基频参数的稳定性,而且还可以保证基频参数符合发音人的发声特点及基频范围,有效地改善了合成语音的听感。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及语音合成处理
,公开了一种歌唱合成中基频参数生成方法及系统,所述方法包括:接收待合成简谱信息,所述简谱信息包括:歌词标注、音高标注、时长标注和节奏信息;根据所述音高标注确定各基本合成单元的理论基频参数;根据所述歌词标注确定各基本合成单元的基频参考模型;根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化。利用本专利技术,不仅可以保证基频参数的稳定性,而且还可以保证基频参数符合发音人的发声特点及基频范围,有效地改善了合成语音的听感。【专利说明】歌唱合成中基频参数生成方法及系统
本专利技术涉及语音合成处理
,具体涉及一种歌唱合成中基频参数生成方法及系统。
技术介绍
近年来,歌唱合成系统得到了广泛的研究和应用,其中有基于隐马尔科夫模型(Hidden Markov Model,HMM)的参数合成系统以及基于波形拼接合成的系统。相比于基于波形拼接合成的系统,参数合成方法对训练数据量要求较少且系统规模较小,因而具有较好的实用价值。基于参数合成的歌唱合成系统首先分别确定各基本合成单元(如音节,音素等)的时长参数序列,基频参数序列以及频谱参数序列,随后再根据各参数序列利用参数合成器得到连续歌唱信号。作为语音信号最主要影响因素的基频参数,其准确性对歌唱合成效果有着至关重要的作用。目前传统系统主要采用如下两种方式生成:(I)基于数据驱动的统计模型挑选方法:该方法预先录制歌唱语音训练数据并根据对应简谱标注信息(如歌词标注、音高标注及时长标注等)训练得到各基本合成单元的基于真实数据驱动的基频模型;在接收到歌唱合成请求时,根据简谱标注信息获取各基本合成单元对应的基频模型进而生成相应的基频参数。该方法通过对真实数据的统计模拟得到符合发音人音色特点的基频模型,然而由于建模本身带来的损失、以及基频模型选择的不完全准确性,该方法很难保证最终合成效果的稳定性。(2)基于规则生成的方法:该方法根据简谱音高标注确定各基本合成单元对应的标准音高,并根据音高基频转换公式直接生成基频参数。这种方法实现简单高效,但由于简谱的标注音高并不一定满足发音人音域分布,从而导致根据标准音高获取的基频参数与发音人频谱参数间存在明显不符现象,影响合成语音的听感。
技术实现思路
本专利技术实施例提供一种歌唱合成中基频参数生成方法及系统,以使基频参数更符合发音人的音域范围,并保证最终合成效果的稳定性。为此,本专利技术提供如下技术方案:一种歌唱合成中基频参数生成方法,包括:接收待合成简谱信息,所述简谱信息包括:歌词标注、音高标注、时长标注和节奏信息;根据所述音高标注确定各基本合成单元的理论基频参数;根据所述歌词标注确定各基本合成单元的基频参考模型;根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化。优选地,所述根据所述歌词标注确定各基本合成单元的基频参考模型包括:对所述歌词标注进行切分,获取各基本合成单元;对所述各基本合成单元进行文本解析,获得所述基本合成单元的上下文信息,所述上下文信息包括:音素序列、声调、韵律词、韵律短语;获取所述基本合成单元对应的基频二叉决策树;根据所述上下文信息在所述基频二叉决策树中进行路径决策,得到对应的叶节占.将所述叶节点对应的基频模型作为所述合成单元的基频参考模型。优选地,所述方法还包括按以下方式构建各基本合成单元对应的基频二叉决策树:采集训练数据并对所述训练数据进行信息标注;从所述训练数据中提取各基本语音合成单元对应语音片断的基频参数;根据所述基本合成单元对应语音片断的标注信息和基频参数,构建所述基本合成单元对应的基频二叉决策树;对所述基频二叉决策树的各节点分别训练得到一个基频模型。优选地,所述根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化包括:对所述理论基频参数进行升降调处理,得到不同基调下的基频参数;计算不同基调下的基频参数与所述基频参考模型的似然度;选择具有最大似然度的基频参数作为优化的基频参数。优选地,所述根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化包括:根据简谱信息中的节奏信息计算各基本合成单元的理论时长;根据所述理论时长获取简谱对应的理论基频参数序列;获取所述简谱对应的基频参考模型序列;根据所述基频参考模型序列对所述理论基频参数序列进行联合优化。优选地,所述根据所述基频参考模型序列对所述理论基频参数序列进行联合优化包括:分别对所述理论基频参数序列中所有理论基频参数统一升降调处理,得到不同基调下的基频参数序列;计算所述不同基调下基频参数序列与所述基频参考模型序列的似然度;选择具有最大似然度的基频参数序列作为优化的基频参数序列。一种歌唱合成中基频参数生成系统,包括:接收模块,用于接收待合成简谱信息,所述简谱信息包括:歌词标注、音高标注、时长标注和节奏信息;理论基频参数确定|旲块,用于根据所述首闻标注确定各基本合成单兀的理论基频参数;基频参考模型确定模块,用于根据所述歌词标注确定各基本合成单元的基频参考模型;优化模块,用于根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化。优选地,所述基频参考模型确定模块包括:切分单元,用于对所述歌词标注进行切分,获取各基本合成单元;解析单元,用于对所述各基本合成单元进行文本解析,获得所述基本合成单元的上下文信息,所述上下文信息包括:音素序列、声调、韵律词、韵律短语;二叉决策树获取单元,用于获取所述基本合成单元对应的基频二叉决策树;决策单元,用于根据所述上下文信息在所述基频二叉决策树中进行路径决策,得到对应的叶节点;输出单元,用于将所述叶节点对应的基频模型作为所述合成单元的基频参考模型。优选地,所述系统还包括:二叉决策树构建模块,用于构建各基本合成单元对应的基频二叉决策树;所述二叉决策树构建模块包括:标注单元,用于采集训练数据并对所述训练数据进行信息标注;提取单元,用于从所述训练数据中提取各基本语音合成单元对应语音片断的基频参数;构建单元,用于根据所述基本合成单元对应语音片断的标注信息和基频参数,构建所述基本合成单元对应的基频二叉决策树;训练单元,用于对所述基频二叉决策树的各节点分别训练得到一个基频模型。可选地,所述优化模块包括:第一音调处理单元,用于对所述理论基频参数进行升降调处理,得到不同基调下的基频参数;第一似然度计算单元,用于计算不同基调下的基频参数与所述基频参考模型的似然度;选择单元,用于选择具有最大似然度的基频参数作为优化的基频参数。可选地,所述优化模块包括:时长计算单元,用于根据简谱信息中的节奏信息计算各基本合成单元的理论时长;获取单元,用于根据所述理论时长获取简谱对应的理论基频参数序列;模型序列获取单元,用于获取所述简谱对应的基频参考模型序列;联合优化单元,用于根据所述基频参考模型序列对所述理论基频参数序列进行联合优化。优选地,所述联合优化单元包括:第二音调处理单元,用于分别对所述理论基频参数序列中所有理论基频参数统一升降调处理,得到不同基调下的基频参数序列;第二似然度计算单元,用于计算所述不同基调下基频参数序列与所述基频参考模型序列的似然度;第二选择单元,用于选择具有最大似然度的基频参数序列作为优化的基频参本文档来自技高网
...

【技术保护点】
一种歌唱合成中基频参数生成方法,其特征在于,包括:接收待合成简谱信息,所述简谱信息包括:歌词标注、音高标注、时长标注和节奏信息;根据所述音高标注确定各基本合成单元的理论基频参数;根据所述歌词标注确定各基本合成单元的基频参考模型;根据所述基本合成单元的基频参考模型对所述基本合成单元的理论基频参数进行优化。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙见青凌震华何婷婷胡郁胡国平
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1