【技术实现步骤摘要】
本专利技术一般地涉及文本到语音转换(TTS)技术,并且更特别地 涉及在客户端对文本内容进行语音合成的方法和系统。
技术介绍
文本到语音转换(TTS)系统是当前广泛使用的使得人们能够通 过语音访问所需信息的技术。典型的 一 种应用是在诸如台式计算机、 膝上型计算机、诸如移动点话、个人数字助理等的手持设备之类的 客户端上,将用户所访问的因特网上的文本内容转换成语音,从而 使得用户可以无需阅读文本即可获得信息。对于这样的应用,用户 需要在其客户端中装载TTS系统,而目前越来越多的用户倾向于通 过因特网下载TTS系统,而不是利用存储介质所记录的拷贝。目前,大多数TTS系统基于语料单元的选择和拼接进行语音合 成。基于单元选择和拼接的语音合成,为了能够得到令人满意的语 音,需要大量的语料单元。例如,在IBM中文TTS系统中合成高质 量的语音需要使用25000个句子作为语料库,其大小约为4GB,当然, 可以利用一些语音编码算法将这些语料单元压缩成200MB,而不会过 分地降低语音质量。但是对于将要通过网络进行下载的用户而言, 一次性下载200MB的语音数据仍然是非常庞大的,这 ...
【技术保护点】
一种用于在客户端对文本内容进行语音合成的方法,包括: a.基于所述客户端的语料库中的当前语料单元集合S当前,对文本内容进行语音合成; b.响应于判断需要更新所述客户端语料库的当前语料单元集合: b1)分析所述文本内容,生成具有相 应语境特征的目标单元的列表; b2)基于比所述客户端语料库的当前语料单元集合S当前更丰富的语料单元集合S总,根据所述语境特征为每个目标单元选择多个候选语料单元; b3)根据所述多个候选单元为所述文本内容确定可用于语音合成的语料单元; 以及 c.基于所确定的语料单元,更新所述客户端语料库的当前语料单元集合。
【技术特征摘要】
1.一种用于在客户端对文本内容进行语音合成的方法,包括a.基于所述客户端的语料库中的当前语料单元集合S当前,对文本内容进行语音合成;b.响应于判断需要更新所述客户端语料库的当前语料单元集合b1)分析所述文本内容,生成具有相应语境特征的目标单元的列表;b2)基于比所述客户端语料库的当前语料单元集合S当前更丰富的语料单元集合S总,根据所述语境特征为每个目标单元选择多个候选语料单元;b3)根据所述多个候选单元为所述文本内容确定可用于语音合成的语料单元;以及c.基于所确定的语料单元,更新所述客户端语料库的当前语料单元集合。2. 根据权利要求1所述的方法,包括下载能够完成各种文本内容的语音合成并确保可接受语音合成 质量的小数目的语料单元集合S。,以作为所述客户端语料库中初始 的当前语料单元集合使得S ,# = Sfl。3. 根据权利要求1所述的方法,其中所述步骤b3还包括将所述多个候选语料单元进行排序,按照对于该文本内容的重 要性确定用于更新所述客户端语料库的当前语料单元集合的语料单 元集合。4. 根据权利要求3所述的方法,其中所述步骤b还包括b4.将用于更新的语料单元集合中未包括在所述客户端语料库 当前语料单元集合中的语料单元集合S,下载到所述客户端;并且 其中在步骤c中更新所述客户端语料库的当前语料单元集合S *前,使得S当前-S当前+ Sa。5. 根据权利要求3所述的方法,其中按照每个候选单元被选择的次数进行排序。6. 根据权利要求5所述的方法,其中将不同目标单元的多个候 选语料单元一起进行排序。7. 根据权利要求5所述的方法,其中将每个目标单元的多个候选语料单元分别进行排序。8. —种支持在客户端对文本内容进行语音合成的系统,包括语音合成装置,被配置为...
【专利技术属性】
技术研发人员:双志伟,孟繁平,施勤,秦勇,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。