语音合成器产生系统与方法技术方案

技术编号:3044193 阅读:226 留言:0更新日期:2012-04-11 18:40
提供一种语音合成器产生系统与方法。使用者输入语音输出需求规格至语音合成器产生系统,该系统可自动产生符合该需求描述的语音合成器。使用者亦可将此需求规格通过语音合成器产生系统的录音脚本产生器自动产生录音脚本,使用者依此脚本录制客制化或扩充语料。此语料经上传至语音合成器产生系统后,语音合成器产生器可自动产生符合需求的语音合成器。客户端的语音输出即可藉由该语音合成器完成。

【技术实现步骤摘要】

本专利技术涉及一种语音输出系统与方法,且特别是涉及一种自动产生语音 合成器的系统与方法。现有技术随着科技的进步,自动化的服务与设备需求与日遽增。在这些需求中, 语音输出是常见的服务,藉由语音的导引,除了可节省人力费用外,更可提 供自动化的服务。而对于高品质语音输出更是各种服务中常常需要的一个使 用者界面。特别是在显示画面有限的行动装置上,最自然、方便、安全的信 息输出就是语音。另外,有声书读物也是充分运用时间的有效学习方式,特 别是外语学习更是如此。然而,目前的语音输出,基本上有两种可能模式,亦各有其缺点。 一种 才莫式为人工录音,此才莫式制作费时、成本高、语音输出内容为固定。而另外 一种模式则为语音合成,其成品的语音品质较差、制作的语音不具弹性、且 声音客制化困难。请参照图1,在美国第7,013,282号专利中,AT&T公司提出一种在可携 式装置中文字转换语音的系统与方法(System and method for text—to—speech processing in a portable device),在;t匕方法中,1吏用者 130输入文句(Text)到桌上型计算机110内。而桌上型计算机110将输入的 文句经由文句转换语音(Text-to-Speech,底下称为TTS)模块112转换, 也就是经由文句分析模块(Text Analysis Module)114与语音合成模块(Speech Synthesis Module) 116的操作,转换为语音输出118。此专利技术是将 文句转换语音(TTS)的转换操作设置在运算能力比较强的桌上型计算机110 上。而合成的语音信号118从桌上型计算机110传送到运算能力较差的手持 式电子装置120。 TTS模块112所输出的语音信号118包括载句音段(Carrier Phrase)与词槽音段(Slot Information),传送到手持式电子装置120的内存中。此装置端的语音输出即为这些载句音段与词槽音段的串接。然而,在此专利中,所使用的文句转换语音的内容固定不变,缺乏弹性。 另外,由桌上型计算机110端的语音合成引擎完成转换,此语音合成引擎固定不变。另外,桌上型计算机110与手持式电子装置120必须同步操作。另外,在美国第6,725,199号专利与第7,062,439号专利中,HP公司提 出 一种语音合成装置与选择方法(Speech synthesis apparatus and selection method),在这些专利中,提出一种音质评量的方法,主要是以r客 观音质评估器」对整句评分。而音质改善从多个文句转换语音(TTS)模块中挑 选分数最高者。若只有一个文句转换语音(TTS^莫块,则将文句改写成其它语 意相同的文句,再挑选音质分数较高的语音输出。
技术实现思路
本专利技术提出一种新的语音输出系统,能够在人工录音和语音合成之间取 得平衡。亦即此系统能够保有语音合成的输出内容弹性,却具有较佳的语音 合成音质,并且容易客制化声音与减少人工录音的成本。本专利技术提出一种语音合成器产生系统,其中,至少包含来源语料库与语 音合成器产生器。使用者输入语音输出需求规格至语音合成器产生系统,语 音合成器产生器可自动产生符合该需求描述的语音合成器。本专利技术提出一种语音合成器产生系统,更包括录音脚本产生器与合成单 元产生器,使用者可将语音输出需求规格通过该脚本产生器以自动产生录音 脚本,使用者依此脚本录制客制化或扩充语料。此语料经上传至语音合成器 产生系统后,合成单元产生器将其转换为语音合成单元并汇入来源语料库, 然后,语音合成器产生器可自动产生符合需求的语音合成器。本专利技术提出一种语音合成器产生系统,包括语音语料库、语音合成器产 生器、录音脚本产生器以及合成单元产生器。此来源语料库用以储存多数个 语音语料。而语音合成器产生器用以接收语音输出需求规格,并根据此语音 输出需求规格,从来源语料库中选择语音语料后,产生一语音合成器。录音 脚本产生器则用以接收语音输出需求规格,并产生录音脚本,以便让使用者 依脚本录制一客制化或扩充语料。合成单元自动产生器则根据该语料,产生 符合语音输出需求规格的多个合成单元,并传送到来源语料库,用以让上述 语音合成器产生器可选择性地根据来自该客制化或扩充语料所产生的合成单 元更新语音合成器。本专利技术提出 一种语音合成器产生方法,包括根据语音输出规格产生 一 录 音脚本。根据此录音脚本产生一录音界面。使用此录音界面,根据一客制化 要求或一扩充语料的内容,完成多个合成单元输入一来源语料库。根据此来 源语料库产生符合此语音输出规格的语音合成器。为让本专利技术的上述特征和优点能更明显易懂,下文特举较佳实施例,并 配合附图,作详细说明如下。附图说明图1是现有的一种在可携式装置中文字转换语音的系统示意图。图2是依照本专利技术一较佳实施例的语音合成器产生系统的结构的示意图。图3是本专利技术 一较佳实施例的语音输出需求规格的格式示意图。 图4是说明本专利技术实施例的语音合成器产生器,以及语音合成?l擎与语 音合成单元库产生的方法示意图。图5A与5B分别说明本专利技术实施例的系统运作流程。 .附图符号说明130:使用者110:桌上型计算机120:手持式电子装置112:文句转换语音(TTS)模块114:文句分析模块(Text Analysis Module)116:语音合成才莫块(Speech Synthesis Module)118:语音输出200:语音合成器产生系统201:语音合成器产生器202:来源语料库203:录音脚本产生器204:录音界面工具^f莫块205:合成单元产生器210:语音输出规格220:录音脚本 230:客制化或扩充语料240:语音合成器241:语音合成引擎242:语音合成单元库510:语音输出规格512:语音合成器产生器514:来源语料库516:语音合成器520:录音脚本产生器522:录音脚本524:录音界面工具才莫块526:客制化或扩充语料528:合成单元产生器。具体实施例方式本专利技术提出一种新的语音输出系统,能够在人工录音和语音合成之间取 得平衡。亦即此系统能够保有语音合成的输出内容弹性,却具有较佳的语音 合成音质,并且容易客制化声音与减少人工录音的成本。此系统可解决目前两种语音输出模式的缺点(1)若采用人工录音,则制作费时、成本高、以 及语音输出内容固定;(2)若完全采用语音合成,则语音品质较差、声音客制 化困难。本专利技术提出一种新的语音输出系统,其文句内容不受限,可达成会员制 语音输出服务。此语音输出藉由客户端的语音合成引擎与特定服务相关的语 音合成单元库所构成。会员可以是个人使用者,也可以是服务提供者,经由 上传标准的语音输出需求规格至此系统,便可下载获得所需的语音输出功能。本专利技术所提出语音合成器产生系统的结构的实施例,则如图2所示。此 语音合成器产生系统200至少包括一个大型的来源语料库202,其包含欲合 成的目标语言的所有单音。语音输出藉由在客户端的语音合成器240,也就 是包括语音合成引擎241与特定服务相关的语音合成单元库242所输出。此 语音合成器产生系统200的使用对象可以是个人使用者或是服务提供者 (Service Provid本文档来自技高网
...

【技术保护点】
一种语音合成器产生系统,包括: 一语音输出规格,描述欲合成的句型与词汇、合成器的执行软硬件平台、以及语者条件; 一欲合成的目标语言的来源语料库,包含欲合成的语言的所有单音; 一语音合成器产生器,用以接收该语音输出规格,并根据该规格从该来源语料库中选择该些语音语料后,产生一能在指定平台上执行的语音合成器,该合成器包含一语音合成单元库与一语音合成引擎。

【技术特征摘要】
1.一种语音合成器产生系统,包括一语音输出规格,描述欲合成的句型与词汇、合成器的执行软硬件平台、以及语者条件;一欲合成的目标语言的来源语料库,包含欲合成的语言的所有单音;一语音合成器产生器,用以接收该语音输出规格,并根据该规格从该来源语料库中选择该些语音语料后,产生一能在指定平台上执行的语音合成器,该合成器包含一语音合成单元库与一语音合成引擎。2. 如权利要求1所述的语音合成器产生系统,其中,该语音输出规格中 的句型与词汇可采用一语法或一语意方式定义。3. 如权利要求2所述的语音合成器产生系统,其中,该语音输出规格中 的该句型的语法定义方式包括一句型词槽、 一语法树、 一上下文无关文法或 一常规表达式其中之一的方式。4. 如权利要求2所述的语音合成器产生系统,其中,该语音输出规格中 的该句型的语意采用一语用方式定义,包括问候句、质问句、直述句、命令 句、肯定句、否定句或惊叹句其中之一的方式。5. 如权利要求2所述的语音合成器产生系统,其中,该语音输出规格中 的该词汇的语法定义方式可采用穷举、文数字符号的排列组合、或常规表达 式其中之一的方式。6. 如权利要求2所述的语音合成器产生系统,其中,该语音输出规格中 的该词汇的语意定义方式可用人名、地名、组织名、或城市名其中之一的方 式定义专有名词,或是可用电话、金额、或时间其中之一的方式定义数字。7. —种语音合成器产生系统,包括一语音输出规格,描述欲合成的句型与词汇、合成器的执行软硬件平台、 以及语者条件;一欲合成的目标语言的来源语料库,包含名欠合成的语言的所有单音; 一录音脚本产生器,用以接收该语音输出规格,并根据该规格产生录音 用的标音文字脚本,以便让使用者依该脚本录制一客制化或扩充语料; . 一录音界面工具模块,提供录音员进行录音; 一合成单元产生器,用以接收该客制化或扩充语料,汇入该来源语料库; 以及一语音合成器产生器,用以接收该语音输出规格,并根据该规格从该来 源语料库中选择该些语音语料后,产生 一 能在指定平台上执行的语音合成器, 该合成器包含一语音合成单元库与一语音合成引擎。8. 如权利要求7所述的语音合成器产生系统,其...

【专利技术属性】
技术研发人员:郭志忠沈民新
申请(专利权)人:财团法人工业技术研究院
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利