说话人可选的语音合成系统及其实现方法技术方案

技术编号：7606282 阅读：187 留言：0更新日期：2012-07-22 11:35

本发明专利技术公开了一种说话人可选的语音合成系统及其实现方法，该语音合成系统包括：目标说话人数据提取装置、模型自适应装置以及目标说话人语音合成装置。该实现方法包括：(A)目标说话人数据提取装置采集目标说话人的语音数据；(B)模型自适应装置根据目标说话人的语音数据生成目标说话人模型，并存储至目标说话人模型库；(C)当用户激活该语音合成系统后，目标说话人语音合成装置实现语音合成功能。本发明专利技术的手机嵌入式版本可以根据用户喜好选择指定目标人阅读短信和手机文本，扩展了手机的功能，并使用户利用手机获取信息的过程更充满趣味性和互动性。另外，本发明专利技术的语音合成系统还可应用于除手机外的平台。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音合成系统，尤其是一种说话人可选的语音合成系统。本专利技术还涉及该语音合成系统的实现方法。
技术介绍
当前的手机平台一般以文字来表达短信或文本文件的内容信息，形式单一，没有趣味，互动性不强。而语音合成技术可以一定程度上地解决这一问题，即将文字信息转换为音频，用人声把手机中的文字朗读给用户听。但现有的语音合成系统大多是单一化的，一个合成系统一般只包括一到两个说话人，仍不能满足用户多样化的情感需求。如果用户不喜欢系统自带的说话人声音，甚至还会对使用系统产生抵触情绪。现有的技术能一定程度上解决上述问题，如中国专利号为200480010899. X，名称为“依赖于源的文本到语音系统”的专利描述了一种从文本消息生成语音的方法，该方法包括确定与文本消息的源相关联的声音的语音特征向量，并且比较该语音特征向量和多个语者模型，但是其缺点是语者模型由系统给定并且固定，对于用户要求的适应性不强。中国专利号为01116305. 4，名称为“由文本生成个性化语音的方法”的专利介绍了一种具体的生成自适应模型的方法，但没有阐述获得目标说话人语音数据的具体方法。另外，除了上述手机平台外，目前还没有对于其他平台的、用户体验效果较好的语音合成系统。
技术实现思路
本专利技术要解决的技术问题是提供一种说话人可选的语音合成系统，它富有趣味性和表现力，不仅可以提升用户之间沟通的乐趣(如手机用户之间利用短信沟通的乐趣)，也可以提升用户对于阅读的体验。为解决上述技术问题，本专利技术的说话人可选的语音合成系统，包括目标说话人数据提取装置，用于提取目标说话人的语音数据，该数据包括音频数据...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：吴悦，
申请(专利权)人：盛乐信息技术上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人