词汇重音预测制造技术

技术编号：3046148 阅读：176 留言：0更新日期：2012-04-11 18:40

一种用于接收代表词的至少一部分的数据和输出代表词的词汇重音的位置的数据的词汇重音预测系统，该系统包括：多个重音预测模型装置，用于寻找在模型数据与接收的数据之间的匹配，多个模型装置包括：第一模型装置，用于接收所接收的数据和寻找在模型数据与接收的数据之间的匹配，以及如果找到对于接收数据的匹配，则输出代表相应于接收数据的词汇重音的预测的预测数据；以及缺省模型装置，用于如果在多个模型装置的任何其它模型装置中没有找到匹配，则接收所接收的数据，以及输出代表相应于接收数据的词汇重音的预测的预测数据。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及词汇重音预测。具体地，本专利技术涉及文本-语音合成系统以及用于该系统的软件。
技术介绍
语音合成在其中要把写出的词用口头表达出来的任何系统中是有用的。有可能把多个词的语音录音存储到发音词典中，以及当相应的写出的词在词典中被识别时播放语音录音的口头表达。然而，这样的系统具有缺点只可能输出被保持在词典中的词。任何不在词典中的词不能被输出，因为没有语音录音存储在这样的系统中。虽然多个词可以连同它们的语音录音一起被存储在词典中，但这导致增加词典尺寸以及相关的语音录音贮存要求。而且，添加所有的可能的词到词典简直不可能，因为系统可能被提供以新的词和来自外国语言的词。所以，有两个原因有利地试图预测在发音词典中的词的语音录音。首先，语音录音预测保证未保持在词典的词将接收语音录音。第二，其语音录音是可预测的词可被存储在词典中，而不用相应的录音，因此减小系统的贮存设备要求的尺寸。一个词的语音录音的一个重要成分是词的主要词汇重音的位置(在词中最加重地发音的音节)。预测词汇重音的位置的方法因此是预测一个词的语音录音的重要的部分。当前存在两种词汇重音预测的基本方法。这些方法的最早的方法是完全根据人为规定的法则(例如，Church，1985；专利US4829580；Ogden，专利US5651095)，它们具有两个主要缺点。首先，它们的创建和保持是费时的，这在创建用于新的语言的法则或移到新的音素组时尤其成问题的(音素是在语言内能够传达不同的意义的最小的语音单位)。第二，人为规定的法则通常不是鲁棒的，对于词生成差的结果，它们与被使用来开发法则，诸如适当的装置和外来语(...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于接收代表词的至少一部分的数据和输出代表词的词汇重音的位置的数据的词汇重音预测系统，该系统包括多个重音预测模型装置，用于寻找在模型数据与接收的数据之间的匹配，多个模型装置包括第一模型装置，用于接收所接收的数据和寻找在模型数据与接收的数据之间的匹配，以及如果找到对于接收数据的匹配，则输出代表相应于接收数据的词汇重音的预测的预测数据；以及缺省模型装置，用于如果在多个模型装置的任何其它模型装置中没有找到匹配，则接收所接收的数据，以及输出代表相应于接收数据的词汇重音的预测的预测数据。2.按照权利要求1的词汇重音预测系统，其中系统的模型装置被安排成通过识别在所述词的至少一部分内至少一个词汇识别符，而预测在所述词的至少一部分内的词汇重音位置。3.按照权利要求1或2的词汇重音预测系统，其中第一重音预测模型装置用于输出代表对于给定的语言的一个百分数的词的重音预测的预测数据，该百分数小于100，以及把剩余的不匹配的接收数据传送到在多个模型中的以后的模型装置。4.按照任一前述权利要求的词汇重音预测系统，其中缺省模型装置用于接收代表多个重音预测模型装置的任一其它模型装置没有为其作出重音预测的词的至少一部分的接收数据，和用于输出代表对于任何这样的接收的词的至少一部分的重音预测的预测数据。5.按照权利要求4的词汇重音预测系统，其中第一模型装置具有比起缺省重音预测模型装置的精度更精确的从其输出词的词汇重音的预测。6.按照权利要求3到5的任一项的词汇重音预测系统，还包括在第一模型装置与缺省模型装置之间的另一个重音预测模型装置，用于如果在第一模型装置中没有找到在接收数据与另一个的模型装置中另一个模型数据之间的匹配，接收所接收的数据，并寻找在另一个模型数据与接收数据之间的匹配，以及如果找到接收数据的匹配，输出代表相应于接收数据的词汇重音的预测的预测数据。7.按照任一权利要求的词汇重音预测系统，其中具有对于词汇重音预测的最低的百分数返回的模型装置是用于由它返回的词的至少一部分的重音预测的最精确的模型装置。8.按照任一权利要求的词汇重音预测系统，其中系统的缺省模型装置具有最低的特异性和精确性，以及每个前面的模型装置比起紧接在它后面的模型装置，具有更高的特异性和精确性。9.按照任何权利要求的词汇重音预测系统，其中代表所述词的至少一部分的数据表示所述词的所述至少一部分的音素信息。10.按照权利要求1到8的任一项的词汇重音预测系统，其中代表词的至少一部分的数据表示所述词的所述至少一部分的字母。11.按照任一前述的权利要求的词汇重音预测系统，还包括另一个模型装置，用于预测在词的特定的至少一部分与在词内的词汇重音的位置之间的负的相关。12.按照任一前述的权利要求的词汇重音预测系统，还包括另一个词汇重音预测系统，用于预测所述词的所述至少一部分的次要词汇重音。13.按照权利要求2或任一从属于其的权利要求的词汇重音预测系统，其中缀被用作为词汇识别符。14.一种预测词的词汇重音的方法，包括接收代表词的至少一部分的数据；把数据传送到包括多个重音预测模型装置的词汇重音预测系统，其中把接收数据传送到重音预测系统包括把接收数据传送到包含模型预测数据的第一模型装置；在第一模型装置中搜索在模型预测数据与接收数据之间的匹配；如果在第一模型装置中找到对于接收数据的匹配，则输出代表相应于接收数据的词汇重音的预测的预测数据；以及如果在多个模型装置的任一其它模型装置中没有找到对于接收数据的匹配，则把接收数据传送到缺省模型装置，在缺省模型装置中对于数据给出词汇重音预测，以及输出代表相应于接收数据的词汇重音的预测的预测数据。15.按照权利要求14的预测词汇重音的方法，其中第一重音预测模型装置预测一个百分数的词的词汇重音，该百分数小于100。16.按照权利要求14或15的预测词汇重音的方法，其中第一模型装置预测数据包括优先级信息，以及如果在...

【专利技术属性】
技术研发人员：卡布里尔·韦伯斯特，
申请(专利权)人：株式会社东芝，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人