文本至话音装置及方法和用于提供信息的系统制造方法及图纸

技术编号:3047008 阅读:141 留言:0更新日期:2012-04-11 18:40
一种文本至话音装置,包括: 第一存储部分(14),其中存储多个定义子句句型; 第二存储部分(24),其中存储多个话音韵律句型,每个话音韵律句型预设为相应于该定义子句句型之一并且以自然的音调话音声音再生该相应的一个定义子句句型;以及 文本话音部分(22),用于当在待读出的文本句子中至少出现该一个定义子句句型时,根据相应于该一个定义子句句型的一个话音韵律句型读出至少一个文本句子。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及文本至话音(缩写为TTS)装置和方法,它变换文本句子为话音以便读出变换的文本内容,以及使用上述的文本至话音装置和方法的信息提供系统。
技术介绍
在先前建议的信息提供系统中,信息从信息中心发送至车辆内信息终端,该车辆内信息终端提供该信息给用户。文件作为文本数据从信息中心发送,并且在该车辆内信息终端中,已经使用先前建议的文本至话音装置,该装置变换该文本数据为话音数据以便读出该文本数据。
技术实现思路
但是,先前建议的文本至话音装置在该文本文件以话音读出时导致话音没有音调。为了获得近乎自然的音调话音,TTS装置的性能需要提高,但是需要求许多费用来改进其性能。因此,本专利技术的目的是提供改进的文本至话音(TTS)装置和方法以及使用该改进的文本至话音(TTS)装置和方法的信息提供系统,它可以实现以最小可能的费用以实质上自然的音调话音读出文本。根据本专利技术的一个方面,提供一种文本至话音装置,其包括第一存储部分,其中存储多个定义子句句型;第二存储部分,其中存储多个话音韵律(prosody)句型,每个话音韵律句型预设为对应于定义的子句句型之一并且以自然的音调话音再生该对应的定义子句句型;以及文本话音部分,当在待读出的文本句子中至少出现定义的子句句型之一时,根据对应于该定义的子句句型的话音韵律句型之一读出至少一个文本句子。根据本专利技术的另一个方面,提供一种信息提供系统,其包括信息中心,用于发送包括至少一个待读出的文本句子的各种信息,该信息中心包括第一存储部分,其中存储多个定义的子句句型,并且在待读出的文本句子中包含至少一个定义的子句句型的情况下,规定在第一存储部分中存储的定义的子句句型之一;以及至少一个信息终端,该信息终端从该信息终端接收包括该文本句子的各种信息,该信息终端包括第二存储部分,其中存储多个话音韵律句型,每个话音韵律句型预设为相应于定义的子句句型之一并且以自然的音调话音再生该定义的子句句型的相应的句型;以及文本话音部分,当在所接收的待读出的文本句子中至少出现定义的子句句型之一时,根据该话音韵律句型之一读出至少一个文本句子。根据本专利技术的另一个方面,提供文本至话音方法,包括存储多个定义的子句句型;存储多个话音韵律句型,每个话音韵律句型预设为相应于定义的子句句型之一,并且以自然的音调话音再生该相应的定义的子句句型之一;以及当在待读出的文本句子中至少出现该定义的子句句型之一时,根据对应于定义的子句句型之一的话音韵律句型之一读出至少一个文本句子。本专利技术的这个概要不必描述所有的必要的特征,因此本专利技术也可以是这些描述的特征的子组合。附图说明图1是表示优选实施例中的信息提供系统的电路方框图,根据本专利技术的优选实施例的文本至话音(TTS)装置和方法可应用在该信息提供系统中;图2示出了代表在图1所示的信息提供系统中使用的路由线路名字和它们的业务量信息的方向的子句句型的例子的表;图3示出了代表在图1所示的信息提供系统中使用的业务量信息的阻塞和调节的子句句型的例子的表;图4示出了业务量信息的公共的固定的子句句型的例子的表; 图5A、5B和5C示出了关于该业务量信息的话音内容的例子的表;图6示出了天气预报的子句句型的例子的表;图7示出了代表天气预报中降雨概率的子句句型的例子的表;图8示出了代表天气预报的固定的子句句型的例子的表;图9A和9B示出了关于天气预报的话音内容的例子的表;图10示出了将从图1表示的信息中心发送的读出文本文件的形式的说明图;图11A、11B、11C、11D、11E、11F和11G是表示从图1中所示的该信息中心发送至车辆内信息终端的话音内容的表;图12是表示图1中所示的该信息中心和车辆内信息终端之间的信息提供操作的操作流程图;图13是在图12的步骤S5执行的、有关NPM相应文本的信息再生的子程序。具体实施例方式以下参考附图能更好地理解本专利技术。下面描述根据本专利技术的文本至话音(TTS)装置的一个优选实施例,它可应用到车辆信息提供系统,其中来自信息中心的各种信息发送至车辆内信息终端并且该信息从该车辆内信息终端提供给用户。应该注意,本专利技术不限制为车辆信息提供系统,而是可应用到每个信息提供系统。例如,根据本专利技术的文本至话音(TTS)装置可以应用于PDA(个人数字助理)或者移动的个人计算机。因此,可以获得以自然的音调读出的文本话音。本专利技术还可应用到作为车辆内信息终端和便携信息终端(或者PDA)的信息终端。该车辆内和便携的兼容信息终端可用作为具有在预定位置的终端机的车辆内信息终端,以及如果该车辆内信息终端从该车辆的预定位置拿出并且携带着则作为个人数字助理(PDA)。图1表示上述的TTS装置的优选实施例的大致的配置。安装有该实施例中的文本至话音装置的车辆信息提供系统是由信息中心10和车辆内信息终端20构成的。注意,虽然在图1中仅仅示出一套车辆内信息终端20,但也可在许多汽车中安装多个相同的车辆内信息终端。还要注意,信息中心10和车辆内信息终端20是通过无线电话电路通信的。信息中心10包括用于实现信息处理的处理单元11;用于存储各种信息内容的信息数据库(DB)12;用于存储用户信息的用户数据库(DB)13;用于存储文本文件的子句句型的子句句型存储器14;和通信设备15,用于通过无线电话电路与车辆内信息终端20实现通信。信息中心10还包括服务器16,用于通过因特网从外部信息源30输入该信息;和服务器17,用于从诸如公共道路交通信息中心和气象机构这样的外部信息源40直接地输入道路交通信息和气象信息。另一方面,车辆内信息终端20包括用于从信息中心10输入该信息并且从信息中心10再现该输入信息的处理单元21;语音合成器22,它将文本文件转换为话音(语音)以便驱动扬声器23;用于存储话音韵律句型的话音韵律句型存储器23,每个话音韵律句型对应于一个定义的子句句型;图像再生单元25,它产生图像数据,再生该产生的图像数据并且在显示器26显示该图像数据;具有诸如开关的操作部件的输入设备27;通信设备28,用于通过GPS(全球定位系统)接收机29与信息中心10进行通信,GPS接收机29检测安装有车辆内信息终端20的汽车目前的位置。然后,根据稍后将叙述的通常称为NPM(自然韵律映象)的话音合成方法,语音合成器22转换该文本(文件)为话音(TTS文本至话音)。注意,在本说明书中,该文本(文件或者句子)是根据对应文本读出被称作NPM(自然韵律映象)的话音韵律句型以话音的形式(或者语音形式)读出的。执行对应于NPM的文本发音读出的文本文档,文本句子和子句块分别称作NPM对应的文本文档,NPM对应的文本句子和NPM对应的子句块。另一方面,未使用话音韵律句型的先前建议的文本读出被称作NPM对应的文本读出。执行不对应于NPM的文本读出的文本文档,文本文件和子句块称作NPM非对应的文本文档,NPM非对应的文本句子和NPM非对应的子句块。下面描述在这个实施例中在TTS装置中执行的文本读出方法。也就是说,分析表示诸如交通信息或者气象预报之类的话音内容的写入。从句子中提取例如使用频率比较高的一个或者多个子句以定义子句句型。然后,通过组合包括未定义的子句句型的多个子句句型构成话音内容。另外,预设并且存储话音韵律句型,以便以基本上自然的音调说出再生和定义的各个本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本至话音装置,包括第一存储部分(14),其中存储多个定义子句句型;第二存储部分(24),其中存储多个话音韵律句型,每个话音韵律句型预设为相应于该定义子句句型之一并且以自然的音调话音声音再生该相应的一个定义子句句型;以及文本话音部分(22),用于当在待读出的文本句子中至少出现该一个定义子句句型时,根据相应于该一个定义子句句型的一个话音韵律句型读出至少一个文本句子。2.根据权利要求1的文本至话音装置,其中存储在第一存储部分中的每个定义子句句型包括由可以任意的片语替换的可变的片语和不同于该可变的片语的公用的固定片语构成的子句。3.根据权利要求1或者2的文本至话音装置,其中待读出的文本句子是表示预定的话音声音内容的句子。4.根据前面的权利要求1至3的任何一个的文本至话音装置,其中存储在第一存储部分中的每个子句句型是具有预定的高使用率、从表示预定的话音声音内容的句子中提取的子句。5.根据权利要求3或者4的文本至话音装置,其中该预定的话音声音内容是气象预报信息。6.根据权利要求3或者4的文本至话音装置,其中该预定的话音声音内容是道路交通信息。7.根据权利要求3或者4的文本至话音装置,其中该预定的话音声音内容是有关观看秋天红叶的最佳时间的信息。8.根据权利要求3或者4的文本至话音装置,其中该预定的话音声音内容是有关滑雪场条件的信息。9.根据前面的权利要求1至8的任何一个的文本至话音装置,其中在信息中心(10)内提供第一存储部分,在至少一个定义子句句型包含在待读出的文本句子中的情况下,该信息中心规定存储在第一存储部分的该一个定义子句句型,并且传送该文本句子给至少一个信息终端,并且其中在该信息终端(20)内提供第二存储部分和文本话音部分,该信息中心(10)和该信息终端(20)构成信息提供系统。10.根据权利要求9的文本至话音装置,其中该文本句子是由多个子句块构成的,该信息中心(10)对于待读出的文本句子的每个子句块,规定是否应该使用话音韵律句型执行相应的一个子句块的读出,并且该信息终端(20)使用该话音韵律句型执行由该信息中心规定的相应的子句块的读出,并且不使用该话音韵律句型执行未由该信息中心规定的文本句子的相应的一个子句块的读出。11.根据权利要求9或者10的文本至话音装置,其中在由该信息中心(10)规定的文本句子的一个子句块对应于定义子句句型之一的情况下,该信息终端(10)根据存储在第二存储部分(24)中的相应的一个话音韵律句型执行构成该文本句子的相应的一个子句块的读出,并且在由该信息中心(10)规定的文本句子的一个子句块对应于一个定义子句句型且相应的一个话音韵律句型没有存储在第二存储部分(24)中的情况下,不使用任何话音韵律句型执行构成该文本句子的相应的一个子句块的读出。12.根据前面的权利要求9至11的任何一个的文本至话音装置,其中该信息终端(20)包括由用户便携的至少一个PDA和安装在汽车中的车辆内信息终端(20)。13...

【专利技术属性】
技术研发人员:直井和美
申请(专利权)人:日产自动车株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1