【技术实现步骤摘要】
本专利技术涉及一种语言信息翻译装置,其将基于某些表达的语言信息转换为基于不同表达的语言信息,诸如语音合成装置、假名-汉字翻译装置、机器翻译装置等,具体地,涉及一种语言信息翻译装置,其使得当多个用户使用一个系统时,其它用户可以使用在其中一个用户的字典中注册的内容。
技术介绍
机器翻译是一种将基于某些语言的输入句子自动翻译为基于另一种语言的句子的技术。例如,在用于将日文翻译为英文的日文到英文机器翻译中,通过参照字典来实现从日文到英文的翻译,在此字典中注册了大量成对的信息片(information piece),每一对都包括日文单词和对应的英文单词。同样地,在用于通过参照字典将某些语言的表达翻译成另一种语言的表达的语言信息翻译技术中,已知了语音合成和假名-汉字翻译。语音合成是一种从包含了汉字和假名字符的混合的输入句子来人工地生成语音的技术。在语音合成处理中,假名-汉字混合字符串被转换为发音符号阵列。在这种情况下,由假名-汉字混合字符串和发音符号阵列所表达的单词对的信息被注册在字典中。此外,假名-汉字翻译是将假名字符串翻译为假名-汉字混合字符串的技术。在这种情况下,注册由所述有关的单词的假名字符串和假名-汉字混合字符串所表达的单词的对。在语言信息翻译技术中,预先准备了在其中收集和注册了常用词汇的字典(此后称为“基本字典”)。然而,当输入了未在所述基本字典中注册的单词,诸如技术术语、新词等时,在翻译中会出现错误。因此,为了注册没有出现在字典中的单词,并且实现正确的翻译结果,通常提供了允许用户进行注册的用户字典功能。目前为止已知了这样的技术,其允许多个用户共同拥有 ...
【技术保护点】
一种语言信息翻译装置,其可由多个用户使用并且将第一语言表达翻译为第二语言表达,该装置包括:用户字典,其被配置成存储注册词汇信息,其中所述注册词汇信息包含至少所述第一语言表达的指示词以及与各注册用户的所述指示词相对应的所述第二语言表达;基本字典,其被配置成存储基本词汇信息,其中所述基本词汇信息包含至少所述第一语言表达的指示词以及与所述指示词相对应的所述第二语言表达;语言信息翻译单元,其被配置成参照所述基本字典的所述基本词汇信息和所述用户字典的由所述用户注册的注册词汇信息,将由所述第一语言表达所表达的输入信息翻译为所述第二语言表达;重要单词提取单元,其被配置成参照所述多个用户字典的所述注册词汇信息,并且基于与相同的指示词相关联的注册词汇信息片的数目以及与所述相同的指示词相关联且其所述对应的第二语言表达还相互相一致的注册词汇信息片的数目中的至少一个,来提取将被加入所述基本字典的所述指示词;以及字典更新单元,其被配置成将所述提取的指示词的所述注册词汇信息作为基本词汇信息注册到所述基本字典中。
【技术特征摘要】
JP 2006-2-1 024980/20061.一种语言信息翻译装置,其可由多个用户使用并且将第一语言表达翻译为第二语言表达,该装置包括用户字典,其被配置成存储注册词汇信息,其中所述注册词汇信息包含至少所述第一语言表达的指示词以及与各注册用户的所述指示词相对应的所述第二语言表达;基本字典,其被配置成存储基本词汇信息,其中所述基本词汇信息包含至少所述第一语言表达的指示词以及与所述指示词相对应的所述第二语言表达;语言信息翻译单元,其被配置成参照所述基本字典的所述基本词汇信息和所述用户字典的由所述用户注册的注册词汇信息,将由所述第一语言表达所表达的输入信息翻译为所述第二语言表达;重要单词提取单元,其被配置成参照所述多个用户字典的所述注册词汇信息,并且基于与相同的指示词相关联的注册词汇信息片的数目以及与所述相同的指示词相关联且其所述对应的第二语言表达还相互相一致的注册词汇信息片的数目中的至少一个,来提取将被加入所述基本字典的所述指示词;以及字典更新单元,其被配置成将所述提取的指示词的所述注册词汇信息作为基本词汇信息注册到所述基本字典中。2.根据权利要求1的装置,其中,当具有所述相同的指示词的注册词汇信息片的数目或者具有所述相同的指示词且对应于所述有关的注册词汇信息片的所述第二语言表达相互一致的所述注册词汇信息片的数目等于或超过阈值时,所述重要单词提取单元提取所述指示词。3.根据权利要求1的装置,其中,所述重要单词提取单元、所述基本字典注册单元以及所述字典更新单元被通过网络连接到所述用户字典注册单元和所述语言信息翻译单元。4.根据权利要求1的装置,其中,为每个领域设置公用字典注册单元。5.根据权利要求1的装置,其中,所述重要单词提取单元进一步计算用户贡献度,所述用户贡献度对应于每个用户的由用户注册的注册词汇信息片之中的作为重要单词提取的注册词汇信息片的数目。6.根据权利要求5的装置,其中,所述重要单词提取单元进一步基于所述用户贡献度提取将被加入的指示词。7.根据权利要求1的装置,其中,所述第二语言表达包含至少对应于所述对应的第一语言表达的发音符号串。8.根据权利要求1的装置,其中,基于所述第一语言表达的语言不同于基于所述第二语言表达的语言。9.根据权利要求1的装置,其中,所述第一语言表达是发音符号串或假名字符串,且所述第二语言表达是汉字串、汉字-假名混合字符串以及单词串中的任何一种。10.根据权利要求1的装置,进一步包括用户字典注册单元,其被配置成将所述注册词汇信息注册到对应于用户ID的所述用户字典中。11.一种语言信息翻译装置,其可由多个用户使用并且将第一语言表达翻译为第二语言表达,该装置包括用户字典,其被配置成存储注册词汇信息,其中所述注册词汇信息包含至少所述第一语言表达的指示词以及与各注册用户的所述指示词相对应的所述第二语言表达;基本字典注册单元,其被配置成存储基本词汇信息,其中所述基本词汇信息包含至少所述第一语言表达的指示词以及与所述指示词相对应的所述第二语言表达;公用字典,其被配置成存储公用词汇信息,所述公用词汇信息包含至少所述第一语言表达的指示词以及与所述指示词相对应的所述第二语言表达;语言信息翻译单元,其被配置成参照所述基本字典的基本词汇信息,由所述有关的用户字典的所述用户注册的注册词汇信息,以及由所述用户指示的所述公用字典的公用词汇信息,并且将由所述第一语言表达所表达的输入信息翻译为所述第二语言表达;重要单词提取单元,其被配置成参照所述多个用户字典的所述注册词汇信息,并且基于与相同的指示词相关联的注册词汇信息片的数目以及与所述相同的指示词相关联且其所述对应的第二语言表达还相互一致的注册词汇信息片的数目中的至少一个,来提取...
【专利技术属性】
技术研发人员:笼岛岳彦,平林刚,清水勇词,徐大威,
申请(专利权)人:株式会社东芝,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。