一种语音合成方法及系统技术方案

技术编号：13595790 阅读：64 留言：0更新日期：2016-08-26 12:56

本发明专利技术公开了一种语音合成方法及系统，该方法包括：接收待合成文本；确定对应所述文本的基本合成单元序列，所述基本合成单元序列包括一个或多个基本合成单元；确定各基本合成单元是否弱读；依次提取所述基本合成单元序列中各基本合成单元的韵律特征，并且如果所述基本合成单元为弱读，则所述基本合成单元的韵律特征包括弱读特征；根据所述基本合成单元的韵律特征确定所述基本合成单元对应的合成参数模型或语音片断，得到对应所述基本合成单元序列的合成参数模型序列或语音片断序列；根据所述合成参数模型序列生成连续语音，或拼接所述语音片断序列中的语音片断得到连续语音。利用本发明专利技术，可以简单有效地提高连续合成语音的自然度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音合成
，尤其涉及一种语音合成方法及系统。
技术介绍
实现人机之间人性化、智能化的有效交互，构建高效自然的人机交流环境，已经成为当前信息技术应用和发展的迫切需求。语音合成技术将文字信息转化为自然的语音信号，实现任意文本的实时转换，改变了传统通过录音回放实现机器开口说话的繁琐操作,并节省了系统存储空间，在信息交互日益增多的当今特别是在信息内容需要经常变动的动态查询应用方面发挥了越来越重要的作用。近年来，随着信息社会的需求发展，用户对人机交互提出了更高的要求，高自然度的语音合成效果已经成为高性能语音合成系统的重要标志。韵律是语音合成自然度的关键问题。韵律包括两个层面的问题：(1)字词间断(break)，(2)重读(focus)。字词间断及字音重读等反映语音抑扬顿挫节奏感的韵律问题受到越来越多研究人员的关注。字词间断可以通过词性等句法信息分析加以解决，在训练数据足量的情况下可以获得80％以上的正确率，满足实用需求。而字音重读的问题由于涉及语义焦点分析尚不能很好解决，对此很多语音合成系统常采用避免提供字音重读功能的方法，导致合成语音在调上没有高低起伏的节奏感，影响了合成的自然效果。在现有技术中，一般采用基于语义分析的重音预测方法，即通过语义分析确定连续输入文本的焦点进而确定需要重读的合成单元并标注，然后根据重音预测结果和合成特征获得相应的合成模型，进而得到连续合成语音信号。然而重音预测存在很大的不确定性，其预测结果往往不够准确，特别是在内容不限的文本中更容易产生问题，在重读信息用在了不合适的
地方时会带来明显的负面影响。专利...

【技术保护点】
一种语音合成方法，其特征在于，包括：接收待合成文本；确定对应所述文本的基本合成单元序列，所述基本合成单元序列包括一个或多个基本合成单元；确定各基本合成单元是否弱读；依次提取所述基本合成单元序列中各基本合成单元的韵律特征，并且如果所述基本合成单元为弱读，则所述基本合成单元的韵律特征包括弱读特征；根据所述基本合成单元的韵律特征确定所述基本合成单元对应的合成参数模型或语音片断，得到对应所述基本合成单元序列的合成参数模型序列或语音片断序列；根据所述合成参数模型序列生成连续语音，或拼接所述语音片断序列中的语音片断得到连续语音。

【技术特征摘要】
1.一种语音合成方法，其特征在于，包括：接收待合成文本；确定对应所述文本的基本合成单元序列，所述基本合成单元序列包括一个或多个基本合成单元；确定各基本合成单元是否弱读；依次提取所述基本合成单元序列中各基本合成单元的韵律特征，并且如果所述基本合成单元为弱读，则所述基本合成单元的韵律特征包括弱读特征；根据所述基本合成单元的韵律特征确定所述基本合成单元对应的合成参数模型或语音片断，得到对应所述基本合成单元序列的合成参数模型序列或语音片断序列；根据所述合成参数模型序列生成连续语音，或拼接所述语音片断序列中的语音片断得到连续语音。2.根据权利要求1所述的方法，其特征在于，所述确定所述基本合成单元是否弱读包括：获取所述基本合成单元所属的音节串和/或音节；确定所述音节串和/或音节是否为弱读，如果是，则确定所述基本合成单元为弱读。3.根据权利要求2所述的方法，其特征在于，所述确定所述音节串和/或音节是否弱读包括：检查所述基本合成单元所属的音节串是否在预设的弱读词表中；如果是，则确定所述基本合成单元弱读；否则，检查所述基本合成单元所属的音节是否在预设的弱读词表中；如果所述基本合成单元所属的音节在预设的弱读词表中，则提取所述音节的韵律特征，然后根据所述音节的韵律特征及预先构建的弱读决策树确定所述音节是否弱读；如果所述音节弱读，则所述基本合成单元弱读，否则所述基本合成单元不弱读；如果所述基本合成单元所属的音节不在预设的弱读词表中，则确定所
\t述基本合成单元不弱读。4.根据权利要求3所述的方法，其特征在于，所述弱读词表的构建过程包括：获取候选弱读词，形成弱读词集；获取训练语料；依次计算所述弱读词集中各候选弱读词在所述训练语料中的弱读频度；如果所述弱读频度大于频度阈值，则确定所述候选弱读词为弱读词；由确定的弱读词生成弱读词表。5.根据权利要求3所述的方法，其特征在于，所述弱读决策树的构建过程包括：获取基于弱读词表的大量文本作为训练数据；对所述训练数据进行分词处理，并确定各分词包含的各音节；对所述各音节进行韵律标注，韵律标注信息包括：弱读信息；根据所述训练数据及对应的各音节的韵律标注信息，训练得到弱读决策树。6.根据权利要求1所述的方法，其特征在于，所述根据所述基本合成单元的韵律特征确定所述基本合成单元对应的合成参数模型或语音片断包括：如果所述基本合成单元的韵律特征包括弱读特征，则获取所述基本合成单元对应的弱读合成参数模型或弱读语音片段；如果所述基本合成单元的韵律特征不包括弱读特征，则获取所述基本合成单元对应的常规合成参数模型或常规语音片段。7.根据权利要求6所述的方法，其特征在于，所述方法还包括：预先构建对应各弱读基本合成单元的弱读合成参数模型，具体包括：获取文本训练数据及对应的语音数据；确定对应所述文本训练数据的基本合成单元序列，所述基本合成单元序列中包括弱读基本合成单元；对所述基本合成单元进行韵律标注，基本合成单元的韵律标注信息包括：弱读基本合成单元的弱读标注信息；选取弱读基本合成单元对应的训练数据；根据选取的训练数据的韵律标注信息建立决策树分类问题集；利用选取的带有韵律标注信息的训练数据及所述决策树分类问题集指导基于决策树的上...

【专利技术属性】
技术研发人员：祖漪清，王祖燕，黄维，邵鹏飞，胡国平，胡郁，刘庆峰，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人