一种用于语音合成的语音片段拼接系统和方法技术方案

技术编号：11316467 阅读：347 留言：0更新日期：2015-04-17 18:09

本发明专利技术涉及一种用于语音合成的语音片段拼接系统和方法，首先，从语音库中提取待拼接的两个语音片段作为第一语音片段和第二语音片段，并从第一语音片段和第二语音片段中选择出最佳采样点；然后，对最佳采样点进行一阶平滑，生成语音拼接点；一阶平滑方法为：计算最佳采样点U1、U2处的斜率ka、kb，以及最佳采样点U1、U2的数值差异值deltaU；根据斜率ka、kb和差异值deltaU进行预测，生成语音拼接点。最后，将语音拼接点插入第一语音片段和第二语音片段之间，生成第三语音片段。本发明专利技术解决了现有技术中直接拼接出现的语音频谱跳变的问题，以及通过自相关查找再累加平滑方法计算量过大的问题，通过一阶平滑的方法使拼接处的频谱获得良好的连续性，增强了用户听觉感受。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术涉及，首先，从语音库中提取待拼接的两个语音片段作为第一语音片段和第二语音片段，并从第一语音片段和第二语音片段中选择出最佳采样点；然后，对最佳采样点进行一阶平滑，生成语音拼接点；一阶平滑方法为：计算最佳采样点U1、U2处的斜率ka、kb，以及最佳采样点U1、U2的数值差异值deltaU；根据斜率ka、kb和差异值deltaU进行预测，生成语音拼接点。最后，将语音拼接点插入第一语音片段和第二语音片段之间，生成第三语音片段。本专利技术解决了现有技术中直接拼接出现的语音频谱跳变的问题，以及通过自相关查找再累加平滑方法计算量过大的问题，通过一阶平滑的方法使拼接处的频谱获得良好的连续性，增强了用户听觉感受。【专利说明】
本专利技术涉及语音合成领域，特别涉及一种用于语音合成的语音片段拼接系统和方法。
技术介绍
现有语音合成方法有基于语音特征参数和基于波形拼接两种方法。相对于基于参数的方法，基于波形拼接的语音合成能够得到质量更高的合成语音，声音听起来也更自然，更为接近原始发音人的音色。因此，目前主流的在线语音合成都是偏重于采用基于波形拼接的语音合成方案。基于波形拼接的语音合成方法原理为：先从预先录制和完成标注的语音库中挑选合适的语音单元作为待拼接的语音片段，然后通过语音片段之间的拼接得到最终的合成语音。采用这种拼接方法，如果拼接的片段在连接处处理不好，在频谱上会出现跳变，就会导致用户在听觉感受上的不自然。因此一个关键的技术问题是：采用什么样的拼接方法使得完成拼接的语音片段能够流畅的输出。目前现有...
一种<a href="http://www.xjishu.com/zhuanli/21/201410734257.html" title="一种用于语音合成的语音片段拼接系统和方法原文来自X技术">用于语音合成的语音片段拼接系统和方法</a>

【技术保护点】
一种用于语音合成的语音片段拼接系统，其特征在于，包括语音库、采样点选择模块、语音拼接点生成模块和拼接模块；所述语音库，其用于存储录制并完成标注的语音片段；所述采样点选择模块，其用于从语音库中提取出待拼接的两个语音片段分别作为第一语音片段和第二语音片段，并从所述第一语音片段和第二语音片段中选择出最佳采样点；所述语音拼接点生成模块，其用于对最佳采样点进行一阶平滑，生成语音拼接点；所述拼接模块，其用于将语音拼接点插入第一语音片段和第二语音片段之间，生成第三语音片段。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘青松，
申请(专利权)人：北京云知声信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人