声音个性化的语音合成器制造技术

技术编号:3046786 阅读:844 留言:0更新日期:2012-04-11 18:40
将语音合成器个性化,使声音类似于或能模仿单个讲话人的语音特征。单个讲话人提供可从少量语音中抽取的一定量的注册数据18,而且由系统修改基础合成参数12以便能更好地模拟新的讲话人36的参数。更具体地说,可以将合成参数12分解成特定讲话人语音参数30,例如与上下文无关的参数,和非特定讲话人语音参数32,例如与上下文有关的参数。用从新的讲话人处得到的注册数据18对特定讲话人语音参数30进行适配。适配后,把特定讲话人语音参数30和非特定讲话人语音参数进行组合从而提供个性化的合成参数群42。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术主要涉及语音合成。更确切地说,本专利技术涉及使语音合成器的输出个性化以便在特定讲话人提供了注册数据后能模拟或模仿出该讲话人细微差异的系统和方法。
技术介绍
在很多使用文本-语音转换(text-to-speech,TTS)合成器的领域中,都期望使合成器的输出声音能模拟特定讲话人的特征。目前,花费在开发语音合成器方面的很多努力都在于使合成的声音尽可能人性化。尽管在这方面不断有进展,但是目前合成器产生的准自然语音表现的是用于构建合成器的语音数据资料库中包含的混合音素变体。当前,没有有效的方法能生产模仿特定讲话人特性的语音合成器,也无法让讲话人花费一些时间记录他或她的语言实例以便用其构成合成器。尽管非常期望能够仅用少量从特定讲话人得到的注册数据(enrollment data)将现有语音合成器定型或个性化,但是,迄今为止还不存在这种技术。最近设计的语音合成器已经能将主要是文本格式的信息转换成合成语音。通常,这些合成器是以合成方法为基础并与某些合成参数相关联。通常,通过操作人的实际语音链接单元产生合成参数,所述实际语音已经过预记录、数字化和分段,从而使包含在该语音中的单个音素变体本文档来自技高网...

【技术保护点】
一种将语音合成器个性化的方法,其特征在于,包括:获得用参数群表示的语音数据资料库,所述参数可供所述产生合成语音的语音合成器使用;将所述参数群分解成特定讲话人语音参数群和非特定讲话人语音参数群;从新的讲话人处获取注册数 据并用所述注册数据和与所述特定讲话人系统的参数进行适配,由此产生适配的特定讲话人语音参数;把所述非特定讲话人语音参数和所述适配的特定讲话人语音参数进行组合以构建供所述语音合成器在产生合成语音时使用的个性化合成参数。

【技术特征摘要】
US 2001-2-26 09/792,9281.一种将语音合成器个性化的方法,其特征在于,包括获得用参数群表示的语音数据资料库,所述参数可供所述产生合成语音的语音合成器使用;将所述参数群分解成特定讲话人语音参数群和非特定讲话人语音参数群;从新的讲话人处获取注册数据并用所述注册数据和与所述特定讲话人系统的参数进行适配,由此产生适配的特定讲话人语音参数;把所述非特定讲话人语音参数和所述适配的特定讲话人语音参数进行组合以构建供所述语音合成器在产生合成语音时使用的个性化合成参数。2.根据权利要求1所述的方法,其特征在于,非特定讲话人语音参数数量超过特定讲话人语音参数数量。3.根据权利要求1所述的方法,其特征在于,所述分解步骤是通过识别与上下文有关的信息和采用所述与上下文有关的信息表示的所述非特定讲话人语音参数实现的。4.根据权利要求1所述的方法,其特征在于,所述分解步骤是通过识别与上下文无关的信息和采用所述与上下文无关的信息表示的所述特定讲话人语音参数实现的。5.根据权利要求1所述的方法,其特征在于,所述语音数据包括频率参数群,所述频率参数群对应于与人的语音相关联的共振峰轨迹。6.根据权利要求1所述的方法,其特征在于,所述语音数据包括时间域参数群,所述时间域参数群对应于与人的语音相关联的声门源信息。7.根据权利要求1所述的方法,其特征在于,所述语音数据包括的参数群对应于与人的语音相关联的韵律信息。8.根据权利要求1所述的方法,其特征在于,进一步包括用从指定讲话人群得到的特定讲话人语音参数构建本征空间并用所述本征空间以及所述注册数据与所述特定讲话人语音参数进行适配。9.根据权利要求1所述的方法,其特征在于,进一步包括用从指定讲话人群得到的特定讲话人语音参数构建本征空间,而且如果所述注册数据并不单独代表合成器使用的所有音素的话,用所述本征空间以及所述注册数据与所述特定讲话人语音参数进行适配。10.一种构建个性化语音合成器的方法,其特征在于,包括提供基础合成器,所述合成器采用预定的合成方法并且具有供所述合成方法使用以产生合成语音的初始参数群;将所述初始参数群表示成特定讲话人语音参数和非特定讲话人语音参数;从讲话人处获取注册数据;和用所述注册数据修改与所述特定讲话人系统参数并由此将所述基础合成器个性化,使之能模仿所述讲话人的语音特性。...

【专利技术属性】
技术研发人员:杰克劳德约库阿佛罗伦特佩罗宁罗兰德科恩帕特里克恩古因
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1