一种个性化歌唱语音的合成方法技术

技术编号：3044302 阅读：501 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种个性化歌唱语音的合成方法，包括以下步骤：对语音的线谱频率系数进行建模，并训练得到相关的决策树模型；录制特定用户的朗读风格语音，得到该用户的线谱频率系数模型；得到简谱中的歌词上下文相关的属性集，根据决策树模型和个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息；根据简谱约定生成基频信息，并与生成的时长、频谱参数合并后，得到所有的合成参数，将这些参数输入参数化语音合成声码器，可合成出个性化的歌唱语音。本发明专利技术提供了只要对少数的韵律参数进行调整，就能合成出歌唱风格的合成语音，只要能录制一个少量的朗读风格库，就能合成出歌唱风格语音的合成方法。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音合成方法，具体涉及一种在只有少量朗读风格训练数据的情况下，合成出目标发音人歌唱风格语音的合成方法。
技术介绍
近年来，语音合成技术获得了很大的发展，由于现在合成语音的音质和自然度都不错，大家对合成系统提出了更多的需求，比如多样化的语音合成，包括多个发音人、多种发音风格、多语种等，所以在可训练语音合成技术基础上发展起来的模型自适应技术得到了越来越广泛的应用，模型自适应技术在合成朗读风格语音的时候可以取得很好的效果，但是在针对歌唱风格的语音合成时缺乏足够的应用研究。 .此外，为了合成出具有歌唱风格的合成语音，有关研究机构也进行了相关研究，主要方法是借鉴朗读风格的语音合成方法，首先录制一个规模较大的歌唱风格库，然后根据可训练语音合成方法来合成出歌唱风格的语音，这种方法可以合成比较自然真实的合成语音，但是由于歌唱时的控制很难，所以歌唱风格库的录制难度要远高于朗读风格库的录制，而且，如果要合成另外一个发音人的歌唱语音时，需要对这个发音人再录制一个歌唱风格库，对于大多数普通人来说，录制这样一个规模的歌唱风格库基本上是不可能的。专...

【技术保护点】
一种个性化歌唱语音的合成方法，其特征在于包括以下步骤实现：　　　　（１）在大规模标准语音数据库上，用隐马尔科夫模型对语音的线谱频率系数进行建模，并训练得到基于上下文相关属性集的线谱频率系数和声韵母时长的决策树模型；　　　　（２）录制特定用户的少量朗读风格语音，并在录音数据库上对线谱频率系数的隐马尔科夫模型进行自适应，得到该用户的个性化的线谱频率系数模型；　　　　（３）对文本化的简谱中的歌词，经过文本处理分析后，得到上下文相关的属性集，然后根据（１）训练得到的决策树模型和（２）得到个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息；　　　　（４）根据简谱对于唱歌的音调、节拍的约定，生...

【技术特征摘要】
1、一种个性化歌唱语音的合成方法，其特征在于包括以下步骤实现(1)在大规模标准语音数据库上，用隐马尔科夫模型对语音的线谱频率系数进行建模，并训练得到基于上下文相关属性集的线谱频率系数和声韵母时长的决策树模型；(2)录制特定用户的少量朗读风格语音，并在录音数据库上对线谱频率系数的隐马尔科夫模型进行自适应，得到该用户的个性化的线谱频率系数模型；(3)对文本化的简谱中的歌词，经过文本处理分析后，得到上下文相关的属性集，然后根据(1)训练得到的决策树模型和(2)得到个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息；(4)根据简谱对于唱歌的音调、节拍的约定，生成基频信息，并对(3)中预测得到的时长信息进行调整；(5)得到(4)生成的时长、基频与(3)中预测得到的频谱参数合并后，就生成了最后的参数。这些参数是既具有目标说话人特征，又具有歌唱特征的基频、时长和线谱频率参数，将这些参数输入参数化语音合成声码器，即可合成出个性化的歌唱语音。2、根据权利要求1所述的一种个性化歌唱语音的合成方法，其特征在于所述的个性化的线谱频率系数模型，通过标准线谱频率系数模型自适...

【专利技术属性】
技术研发人员：王玉平，江源，凌震华，胡国平，胡郁，刘庆峰，王仁华，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：34[中国|安徽]

全部详细技术资料下载我是这个专利的主人