使用分级概括语音模板用于定制语音合成器数据库的方法和工具技术

技术编号：3046596 阅读：280 留言：0更新日期：2012-04-11 18:40

一种语音合成定制系统（１０）提供一种用于产生分级定制用户数据库的机制。该定制系统包括模板管理工具（１４），用于根据从用户（１８）得到的定制数据和从文本－语音转换（ＴＴＳ）合成器（１２）得到的相关的复制动态合成数据（２０）产生模板。复制的动态合成数据按照具有分级的动态数据结构组织。该定制系统进一步包括补充合成器的标准数据库的用户数据库（２２）。工具将模板组装在用户数据库中，这样模板使得用户数据库可以在动态数据结构的所有级层上统一地覆盖顺序产生的语音合成数据。（*该技术在2022年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音合成。特别地，本专利技术涉及一种语音合成器定制系统，其可以在动态数据结构的所有级层覆盖语言合成数据。
技术介绍
随着语音合成器输出质量的不断提高，越来越多的应用开始加入合成技术。例如，汽车导航系统，用于视觉受损的装置也开始加入语音合成器。然而，随着语音合成普及度的增加，常规方式中的一些局限性变得明显。一个值得注意的困难就是，容量和开发成本的考虑限制了常规合成器可以处理的词汇量。附图1和2简要示出了典型的合成器具有分级的动态数据结构，其中动态数据结构包括语言树20和声学树22。语言树20包含用于将要被合成的句子的语法和语言对象，而声学树22具有用于该句子的韵律和声学对象。这样，在合成一个句子的时候，根据输入的文本构建(或组装)这两个分级树状结构。通常需要意识到的是，树具有节点，这样“父节点”具有到每一“子节点”的“分支”。这里语言树20和声学树22被称作树状结构是因为父节点只能对第一子节点和末尾子节点进行访问，而其余的子节点被包括在一个表中。而且，每一子节点可以对相应的父节点进行访问。然而，树结构的层次组成了分级结构。在固定(或标准)数据库的辅...

【技术保护点】
一种语言合成器定制系统，包括：　　　　模板管理工具，用于根据从用户得到的定制数据和从文本－语音转换合成器复制的动态合成数据产生模板，被复制的动态合成数据按照具有分级的动态数据结构组织；和　　　　用户数据库，用于补充合成器标准数据库；　　　　该工具将模板组装在用户数据库中，这样模板使得用户数据库可以在动态数据结构的所有级层上统一地覆盖顺序产生的合成语音数据。

【技术特征摘要】
US 2001-3-15 09/808,1321.一种语言合成器定制系统，包括模板管理工具，用于根据从用户得到的定制数据和从文本-语音转换合成器复制的动态合成数据产生模板，被复制的动态合成数据按照具有分级的动态数据结构组织；和用户数据库，用于补充合成器标准数据库；该工具将模板组装在用户数据库中，这样模板使得用户数据库可以在动态数据结构的所有级层上统一地覆盖顺序产生的合成语音数据。2.权利要求1所述的定制系统，其中每一模板定义一个模板被用以覆盖语音合成数据的条件，和为了覆盖语音合成数据所要执行的动作。3.权利要求2所述的定制系统，其中条件与语言树结构的级层相对应。4.权利要求2所述的定制系统，其中条件与声学树结构的级层相对应。5.权利要求1所述的定制系统，其中工具包括模板产生器，用于根据定制数据处理复制的动态合成数据；输出界面，用于将复制的动态合成数据以图形的方式显示给用户；和一个或多个输入界面，用于从用户获得定制数据。6.权利要求5所述的定制系统，其中输入界面包括命令解释器，可操作地连接在键盘输入装置和模板产生器之间。7.权利要求5所述的定制系统，其中输入界面包括图形工具模块，可操作地连接在鼠标输入装置和模板产生器之间。8.权利要求5所述的定制系统，其中输入界面包括声音处理模块，可操作地连接在麦克风输入装置和模板产生器之间。9.权利要求8所述的定制系统，其中声音处理模块包括输入波形子模块，用于根据从麦克风输入装置得到的数据产生输入波形；音调提取子模块，用于根据输入波形产生音调数据；共振峰分析子模块，用于根据输入波形产生共振峰数据；和音素标识子模块，用于根据输入波形自动标识音素。10.一种用户数据库，包括多个模板，用于覆盖文本-语音转换合成...

【专利技术属性】
技术研发人员：史蒂夫皮尔森，彼得维普莱克，吉恩克劳德詹奎，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人