利用判定树生成拼写单词的发音和对其评分的方法和设备技术

技术编号：3047577 阅读：198 留言：0更新日期：2012-04-11 18:40

混合判定树包含一个关于拼写单词序列中的邻接字母及与此拼写单词序列相对应的音素序列中的邻接音素的是否问题网。混合判定树的叶节点提供关于哪一种标音概率最大的信息。利用混合树可以对多个可能发音中的每一个进行评分，并且这些评分可用来选择最佳发音，以及用来按概率排列发音。由此系统生成的发音可用于语音合成和语音识别应用中，也可应用词典学的应用中。（*该技术在2019年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般涉及语音处理。更具体地讲，本专利技术涉及生成拼写单词的发音系统。本专利技术可用于多种语境，包含语音识别，语音合成和词典学。伴随有发音的拼写单词可出现于语音处理领域内的很多不同的语境中。在词典中的每一个单词的语音识别音标中在使用之前需要对识别器进行训练。传统的标音是由熟悉该某种语言的语音发音的细微差别的词典学家手工生成的。对词典中的每一个单词开发一个良好的标音是需要时间并且要求很高的水平。如果有一个能够根据单词的字母拼写生成其标音的可靠系统就不需要大量的这种劳动和专门技术。这种系统将把目前的识别系统扩展为可以识别像地名和人名这些在现有的词典中找不到的单词。拼写单词也经常在语音合成领域中碰到。现在的语音合成器通过从词典中检索数字取样声音单元并将这些声音单元连接而形成句子就可将文本转换为语音。正如上述各例所示，语音处理的语音识别和语音合成两个领域都会从可由拼写单词生成准确的发音的能力受益。然而，需要此种技术的并非只限于语音处理。如今词典学家已经完成多种主要世界语言的相当大型和准确的发音词典。但是，仍然存在成百上千种区域性语言还缺少良好的标音。由于迄今为止制作良好标音的工作主要是靠手工劳动，所以某些区域性语言可能需要多年才能得到标音，如果真的能够得到的话。如果能有一个良好的应用计算机来为标音准确度评分的技术，则标音过程就可以大大加速。这种评分系统将会利用现有的语言标音素材来标识标音原型中其发音受到怀疑的那些词条。这就会大大提高生成高质量标音的速度。迄今为止将拼写单词变为发音标音的努力只是依赖字母本身。这种方式留有很大的开拓余地。比如，单纯字母发...

【技术保护点】
一种用来为从预定字母表选择输入的字母序列生成至少一个标音的设备，其构成包括：用于存储与所述字母表相应的多个单纯字母判定树的存储器，所述单纯字母判定树具有表示在给定的序列中有关给定字母及其相邻字母的是否问题的内节点；所述存储器还存储与所述字母表相应的多个混合判定树，所述的混合判定树具有表示在所述给定的序列中有关给定字母及其相邻字母的是否问题的第一组多个内节点和具有在所述给定的序列中关于一音素及其相邻音素的是否问题的第二组多个内节点，所述单纯字母判定树和所述混合判定树还具有与将所述给定的字母与多个音素发音相联系的概率数据的叶节点；与用来处理输入的字母序列的所述单纯字母判定树连接并生成与所述输入的字母序列相应的第一组语音发音的音素序列生成器；与所述混合判定树连接用来处理所述第一组以生成第二组评分语音发音的评分估计器，此评分语音发音表示所述输入序列的至少一个语音发音。

【技术特征摘要】
US 1998-4-29 067764;US 1998-4-29 069308;US 1998-4-1．一种用来为从预定字母表选择输入的字母序列生成至少一个标音的设备，其构成包括用于存储与所述字母表相应的多个单纯字母判定树的存储器，所述单纯字母判定树具有表示在给定的序列中有关给定字母及其相邻字母的是否问题的内节点；所述存储器还存储与所述字母表相应的多个混合判定树，所述的混合判定树具有表示在所述给定的序列中有关给定字母及其相邻字母的是否问题的第一组多个内节点和具有在所述给定的序列中关于一音素及其相邻音素的是否问题的第二组多个内节点，所述单纯字母判定树和所述混合判定树还具有与将所述给定的字母与多个音素发音相联系的概率数据的叶节点；与用来处理输入的字母序列的所述单纯字母判定树连接并生成与所述输入的字母序列相应的第一组语音发音的音素序列生成器；与所述混合判定树连接用来处理所述第一组以生成第二组评分语音发音的评分估计器，此评分语音发音表示所述输入序列的至少一个语音发音。2．如权利要求1的设备，其中所述第二组包括每一个都带有从所述概率数据导出的关联评分的多个发音，并且还包括一个能接受所述第二组并可根据所述关联评分通过操作从所述第二组选择一个发音的发音选择器。3．如权利要求1的设备，其中所述音素序列生成器可生成预定数目的与给定的输入序列相应的不同发音。4．如权利要求1的设备，其中所述音素序列生成器可根据所述概率数据生成预定数目的与给定的输入序列相应并表示n-最佳发音的不同发音。5．如权利要求4的设备，其中所述评分估计器根据所述混合判定树对所述n-最佳发音进行再评分。6．如权利要求1的设备，其中所述序列生成器构造一个代表不同发音的可能音素组合的矩阵。7．如权利要求6的设备，其中序列生成器利用动态规划从所述矩阵选择n-最佳音素组合。8．如权利要求6的设备，其中序列生成器借助迭代置换从所述矩阵选择n-最佳音素组合。9．如权利要求1的设备，其中还包括具有用于识别器训练的发音词典的语音识别系统，并且其中所述第二组的至少一部分填充所述词典以便根据其拼写为单词提供发音。10．如权利要求1的设备，其中还包括可接受所述第二组的至少一部分以便根据单词的拼写生成其可听合成发音的语音合成系统。11．如权利要求10的设备，其中所述语音合成系统与电子邮件读出器结合。12．如权利要求10的设备，其中所述语音合成系统与用来按照概率顺序提供可能发音表的词典结合。13．如权利要求1的设备，其中还包括语言学习系统，该系统可利用所述至少一个单纯字母判定树和所述混合判定树来显示一个拼写单词和分析企图读出该单词的发音的人的发音，并且为用户提供他或她对该单词的发音的概率。14．一种拼写-发音数据的...

【专利技术属性】
技术研发人员：罗兰德昆恩，珍克劳德君夸，玛特欧康图丽尼，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人