语音合成的方法和系统技术方案

技术编号：4262088 阅读：225 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供一种用于在客户端对文本内容进行语音合成的方法。该方法包括：基于客户端的语料库中的当前语料单元集合Ｓ↓［当前］，对文本内容进行语音合成；响应于判断需要更新客户端语料库的当前语料单元集合：分析文本内容，并生成具有相应语境特征的目标单元的列表，基于比客户端语料库的当前语料单元集合Ｓ↓［当前］更丰富的语料单元集合Ｓ↓［总］，根据语境特征为每个目标单元选择多个候选语料单元，根据多个候选单元为文本内容确定可用于语音合成的语料单元；以及基于所确定的语料单元，更新客户端语料库的当前语料单元集合。本发明专利技术还提供相应的系统。根据本发明专利技术的技术方案，客户端的ＴＴＳ系统能够随着用户对该系统的进一步使用自适应的更新语料库，从而获得语音合成质量的有效改善。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般地涉及文本到语音转换(TTS)技术，并且更特别地涉及在客户端对文本内容进行语音合成的方法和系统。
技术介绍
文本到语音转换(TTS)系统是当前广泛使用的使得人们能够通过语音访问所需信息的技术。典型的一种应用是在诸如台式计算机、膝上型计算机、诸如移动点话、个人数字助理等的手持设备之类的客户端上，将用户所访问的因特网上的文本内容转换成语音，从而使得用户可以无需阅读文本即可获得信息。对于这样的应用，用户需要在其客户端中装载TTS系统，而目前越来越多的用户倾向于通过因特网下载TTS系统，而不是利用存储介质所记录的拷贝。目前，大多数TTS系统基于语料单元的选择和拼接进行语音合成。基于单元选择和拼接的语音合成，为了能够得到令人满意的语音，需要大量的语料单元。例如，在IBM中文TTS系统中合成高质量的语音需要使用25000个句子作为语料库，其大小约为4GB，当然，可以利用一些语音编码算法将这些语料单元压缩成200MB,而不会过分地降低语音质量。但是对于将要通过网络进行下载的用户而言，一次性下载200MB的语音数据仍然是非常庞大的，这...

【技术保护点】
一种用于在客户端对文本内容进行语音合成的方法，包括：　ａ．基于所述客户端的语料库中的当前语料单元集合Ｓ当前，对文本内容进行语音合成；　ｂ．响应于判断需要更新所述客户端语料库的当前语料单元集合：　ｂ１）分析所述文本内容，生成具有相应语境特征的目标单元的列表；　ｂ２）基于比所述客户端语料库的当前语料单元集合Ｓ当前更丰富的语料单元集合Ｓ总，根据所述语境特征为每个目标单元选择多个候选语料单元；　ｂ３）根据所述多个候选单元为所述文本内容确定可用于语音合成的语料单元；以及　ｃ．基于所确定的语料单元，更新所述客户端语料库的当前语料单元集合。

【技术特征摘要】
1.一种用于在客户端对文本内容进行语音合成的方法，包括a.基于所述客户端的语料库中的当前语料单元集合S当前，对文本内容进行语音合成；b.响应于判断需要更新所述客户端语料库的当前语料单元集合b1)分析所述文本内容，生成具有相应语境特征的目标单元的列表；b2)基于比所述客户端语料库的当前语料单元集合S当前更丰富的语料单元集合S总，根据所述语境特征为每个目标单元选择多个候选语料单元；b3)根据所述多个候选单元为所述文本内容确定可用于语音合成的语料单元；以及c.基于所确定的语料单元，更新所述客户端语料库的当前语料单元集合。2. 根据权利要求1所述的方法，包括下载能够完成各种文本内容的语音合成并确保可接受语音合成质量的小数目的语料单元集合S。，以作为所述客户端语料库中初始的当前语料单元集合使得S ,# = Sfl。3. 根据权利要求1所述的方法，其中所述步骤b3还包括将所述多个候选语料单元进行排序，按照对于该文本内容的重要性确定用于更新所述客户端语料库的当前语料单元集合的语料单元集合。4. 根据权利要求3所述的方法，其中所述步骤b还包括b4.将用于更新的语料单元集合中未包括在所述客户端语料库当前语料单元集合中的语料单元集合S,下载到所述客户端；并且其中在步骤c中更新所述客户端语料库的当前语料单元集合S *前，使得S当前-S当前+ Sa。5. 根据权利要求3所述的方法，其中按照每个候选单元被选择的次数进行排序。6. 根据权利要求5所述的方法，其中将不同目标单元的多个候选语料单元一起进行排序。7. 根据权利要求5所述的方法，其中将每个目标单元的多个候选语料单元分别进行排序。8. —种支持在客户端对文本内容进行语音合成的系统，包括语音合成装置，被配置为...

【专利技术属性】
技术研发人员：双志伟，孟繁平，施勤，秦勇，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人