混合语言文语转换制造技术

技术编号：3046035 阅读：166 留言：0更新日期：2012-04-11 18:40

一种用于混合语言文语转换合成的方法，包括接收（２２０）两种语言的混合语言文本字符串。然后，分离步骤（２３）将文本字符串内的文本分离为：（ｉ）基于语音的字符的字符串，每一字符代表一个单一音节；（ｉｉ）或包含一个或多个单词的单词字符串，该单词由字母表的字母形成，并且一些单词代表多于一个音节。为每一基于音节的字符指定语音单元（２４０），并为每一单词指定音素（２６０）。选择（２５０，２７０）、拼接（２７５）并合成（２８５）语音单元和音素的单独的声学单元。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术总的来说涉及文语转换(TTS)合成。具体的说，本专利技术适用于多语言文本合成发音的字母到语音的转换。
技术介绍
文语(TTS)转换，通常被称为拼接文语转换合成，允许电子装置接收输入文本字符串，并以合成语音的形式提供该字符串的转换的表示。然而，可能需要一种装置合成来自数目不定的接收文本字符串的语音，这将导致在提供高质量的实际合成语音时出现困难。一个难点是基于在字母到语音转换中，根据其他相邻字母以及在要合成的文本段中的位置，相同字母或字母组可能具有不同的发音以及元音重音/重点。出现了混合语言TTS合成，并将其应用到多个领域，例如呼叫中心和手持装置等。在下文中，混合语言TTS指的是用于可从文本字符串的分析中识别和检测两种或多种语言的语音合成技术。当考虑两种语言文本字符串的混合语言TTS时，一种包含大部分文本的占有优势的语言通常被称为主要语言，并且另一种是次要语言。通常，例如亚洲语言(普通话、广东话、日语、韩语、泰语等)的主要语言和英语混合。在基于拼接合成的TTS系统中，通过将若干语音段拼接在一起合成话语。虽然将拼接语音合成被认为是实现实际混合语言TTS系统的非常有希望的方法，但是识别语音单元、音素以及它们对应的声学单元还是有问题的。同样，在每一拼接点或在两个连续单元之间的听觉不连续性影响了合成的语音质量。此外，在每一拼接点的语音平滑滤波以及在两种语言的合成语音段之间的过渡的平滑滤波也影响了质量。在此包括权利要求的说明书中，术语“包括”、“包含”或类似术语意在表示非独占的包含，从而包括元素列表的方法或设备并不仅仅包括这些元素，还包括其他未列出的元素。...

【技术保护点】
一种用于混合语言文语转换合成的方法，该方法包括：接收至少两种语言的混合语言文本字符串；将文本字符串内的文本分离成：（ｉ）至少一个基于音节的字符的字符串，每一字符都表示单一音节；（ｉｉ）或至少一个包含一个或多个由字母表的字母形成的单词的单词符列，至少一些单词表示多于一个音节；为每一基于音节的字符指定语音单元；为每一单词指定音素，一个或多个音素形成单独的音节；为语音单元和音素选择单独的声学单元；以及将单独的声学单元拼接为具有对应于混合语言文本字符串的顺序的拼接的有序声学单元；以及使用拼接的有序声学单元执行语音合成。

【技术特征摘要】
1.一种用于混合语言文语转换合成的方法，该方法包括接收至少两种语言的混合语言文本字符串；将文本字符串内的文本分离成(i)至少一个基于音节的字符的字符串，每一字符都表示单一音节；(ii)或至少一个包含一个或多个由字母表的字母形成的单词的单词符列，至少一些单词表示多于一个音节；为每一基于音节的字符指定语音单元；为每一单词指定音素，一个或多个音素形成单独的音节；为语音单元和音素选择单独的声学单元；以及将单独的声学单元拼接为具有对应于混合语言文本字符串的顺序的拼接的有序声学单元；以及使用拼接的有序声学单元执行语音合成。2.如权利要求1的所述方法，其中，分离文本识别两种语言中的哪一种是文本字符串内的主要语言，哪一种是次要语言。3.如权利要求1的所述方法，其中，包含主要语言的文本包括一个或多个指示该文本距离次要语言的位置的伪间隔符。4.如权利要求1的所述方法，其中，指定语音单元包括通过最大匹配进行分段，进行最大匹配使得词典内的单词和最大数目的连续字符相匹配，并且最大数目的连续字符是和基于音节的字符文本段相匹配的最大数目连续字符，该分段提供最大匹配单词。5.如权利要求4的所述方法，其中，指定语音单元包括，确定最大匹配单词的词组边界，以识别未由标点明确标识的自然语音停顿。6.如权利要求5的所述方法，其中，指定语音单元包括，为每一字符识别语音单元，其中为最大匹配单词的每一字符考虑包括的字符。7.如权利要求6的所述方法，其中，存在和每一语音单元相...

【专利技术属性】
技术研发人员：岳东剑，陈桂林，俞振利，祖漪清，
申请(专利权)人：纽安斯通信有限公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人