个性化文本语音合成和个性化语音特征提取制造技术

技术编号：5979579 阅读：240 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及个性化文本语音合成和个性化语音特征提取。个性化文本语音合成装置包括：个性化语音特征库创建部，其被设置为，通过对特定讲话人的随意性的语音片断与预先设定的关键字进行比对，识别该特定讲话人的个性化语音特征，由此创建与该特定讲话人相关联的个性化语音特征库，并将该个性化语音特征库与该特定讲话人相关联地存储起来；和文本语音合成部，其被设置为，基于与该特定讲话人相关联的个性化语音特征库，对源于该特定讲话人的文本消息进行语音合成，以生成并输出具有该特定讲话人的发音特点的语音片断。根据本发明专利技术，不必通过专门的训练过程，即可建立特定讲话人的个性化语音特征库，从而对文本进行个性化语音合成，以输出带有讲话人的个性化发音特点的语音。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术总体上涉及语音特征提取和文本语音合成(Text-To-Speech，简称TTS)技术，更具体地说，涉及通过基于预先设置的关键字从随机采集的某个人的语音片断中提取他/她的个性化语音特征的方法和装置，和利用提取的个性化语音特征，对源于该人的文本消息进行个性化TTS的装置和方法，以及包括该装置的通信终端和通信系统。
技术介绍
TTS是用于从文本合成语音的技术，具体地说，是一种将任意文字信息转化为标准、流畅语音的技术。TTS涉及自然语言处理、韵律学、语音信号处理、声音感知等多种前沿的高新科技，横跨声学、语言学、数字信号处理等多个学科，是文字信息处理领域的一项前沿技术。传统的标准TTS系统只能用一种标准的男声或女声来进行发音，声音单调，无法反映出生活中各种人五花八门的说话习惯；例如，如果语音缺乏娱乐性，收听者或者听众可能感觉不亲切，或者不能感受有意的幽默。例如，美国专利No. 7277855提出了一种个性化的文本语音合成方案。根据该方案，通过让特定讲话人事先说一些固定的文字，并对生成的语音进行分析，获得该特定讲话人的一些语音特征数据。然后利用...

【技术保护点】
１．一种个性化文本语音合成装置，其包括：个性化语音特征库创建部，其被设置为，通过对特定讲话人的随意性的语音片断与预先设定的关键字进行比对，识别所述特定讲话人的个性化语音特征，由此创建与所述特定讲话人相关联的个性化语音特征库，并将所述个性化语音特征库与所述特定讲话人相关联地存储起来；和文本语音合成部，其被设置为，基于由所述个性化语音特征库创建部所创建的与所述特定讲话人相关联的个性化语音特征库，对源于该特定讲话人的文本消息进行语音合成，以生成并输出具有所述特定讲话人的发音特点的语音片断。

【技术特征摘要】

【专利技术属性】
技术研发人员：何守春，王庆芳，
申请(专利权)人：索尼爱立信移动通讯有限公司，
类型：发明
国别省市：SE[瑞典]

全部详细技术资料下载我是这个专利的主人