一种实现合成语音增强的方法及系统技术方案

技术编号：12272800 阅读：213 留言：0更新日期：2015-11-04 21:39

本发明专利技术涉及语音合成技术领域，公开了一种实现合成语音增强的方法及系统，该方法包括：基于训练数据构建初始语音合成模型，所述训练数据包括文本数据及与所述文本数据对应的语音数据；建立增强模型，所述增强模型用于模拟所述初始语音合成模型生成的合成语音参数与自然语音参数的映射关系；在接收到待合成文本后，根据所述初始语音合成模型和所述增强模型生成对应所述待合成文本的合成语音参数；利用所述合成语音参数生成连续语音信号。利用本发明专利技术，可以有效提高合成语音的增强效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音合成
，具体涉及一种实现合成语音增强的方法及系统。
技术介绍
实现人机之间人性化、智能化的有效交互，构建高效自然的人机交流环境，已经成为当前信息技术应用和发展的迫切需求。作为语音技术中实用的一项重要技术，语音合成技术或称文语转换技术（Text-To-Speech，TTS)，将文字信息转化为自然的语音信号，实现文本的实时转换，改变了传统通过录音回放实现机器开口说话的繁琐操作，节省了系统存储空间，在信息交互日益增多的当今，特别是在信息内容需要经常变动的动态查询应用领域发挥了越来越重要的作用。基于参数合成的语音合成系统由于具有较好的鲁棒性和推广性得到了广泛的应用，然而该方法具有较强的平滑作用，合成的语音平淡且音质容易受损，在合成自然度方面表现不够理想，实际应用中存在一定的提升空间。如何提高合成语音的自然度是合成系统实用化的重要保障。为此，现有技术中主要采用合成语音增强的方法来提高合成语音的自然度，其主要技术可以归纳为：基于人的听感特性等经验知识对生成频谱参数或合成语音进行后滤波处理，比如对合成语音的共振峰进行增强处理、加强生成频谱参数的动态特性，从而改善合成语音的音质。实际上，不同发音人的声学特性存在细节差异，且对于同一个发音人，其在发不同音时，声学特性也存在细节差异。而基于经验知识的合成语音增强方法，只能使得增强后的合成语音在总体上符合人的听感，其增强效果并不理想。
技术实现思路
本专利技术实施例提供一种实现合成语音增强的方法及系统，以提高合成语音的增强效果。为此，本专利技术实施例提供...

【技术保护点】
一种实现合成语音增强的方法，其特征在于，包括：基于训练数据构建初始语音合成模型，所述训练数据包括文本数据及与所述文本数据对应的语音数据；建立增强模型，所述增强模型用于模拟所述初始语音合成模型生成的合成语音参数与自然语音参数的映射关系；在接收到待合成文本后，根据所述初始语音合成模型和所述增强模型生成对应所述待合成文本的合成语音参数；利用所述合成语音参数生成连续语音信号。

【技术特征摘要】

【专利技术属性】
技术研发人员：孙见青，陈凌辉，凌震华，江源，胡国平，胡郁，刘庆峰，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人