机器翻译装置和方法制造方法及图纸

技术编号:2872744 阅读:157 留言:0更新日期:2012-04-11 18:40
一种包括多个目标语言文件数据库、用于将源语言翻译成目标语言的机器翻译装置,该机器翻译装置包括:    数据库控制单元,被配置用于对多个目标语言文件数据库的每一个分配优先程度,并且指示哪一个目标语言文件数据库具有最高优先程度;    翻译单词产生单元,被配置用于产生用于翻译的源词的多个翻译单词的候选者;和    翻译单词学习单元,被配置用于通过使用由所述的数据库控制单元指示的目标语言文件数据库,从多个翻译单词侯选者中选择翻译单词作为翻译结果。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及自动执行翻译单词学习的。
技术介绍
近来,出现了一种自动将第一语言(源语言)的句子翻译成第二语言(目标语言)的句子的机器翻译系统。在机器翻译系统的翻译处理中,首先,通过词法分析或句子结构分析,输入源句被分成诸如单词(词组)之类的预定处理单元。紧接着,通过检索翻译字典,对每一处理单元确定可适用的翻译规则和相对应的翻译单词(翻译词组)。然后,每一翻译单词按预定规则被合并以产生翻译句子。用这种方法,获得对应于输入源句的翻译句。为了实现在该机器翻译中的高正确率的翻译,使用适合于该翻译的词典是重要的。为了解决各种源句的翻译,对于相同语言的每一个源词,该词典通常具有多个翻译单词候选者。因此,用户必须从多个翻译单词候选者中选择一个适合于用户意图(喜好、领域或目的)的翻译单词。如果机器翻译系统了解用户的选择操作,则之后,翻译单词的选择可能适合于用户的意图。在产生不适合于用户意图的翻译单词的情况下,执行翻译单词的学习操作。作为学习操作,用户从其它翻译单词候选者中再次选择他或她的适合的翻译单词,并且对该系统指示所选择的翻译单词。通过执行学习操作,之后,该翻译单词被优先选择。用这种方法,通过学习操作选择适合于用户意图的翻译单词的功能被称做“翻译单词学习”。例如,对于“计算机”(英文)一词的可供选择的翻译单词有“Konpyuta”、“Konpyutah”、“Keisanki”(日文)。根据用户的喜好、领域(field)和使用目的,一个要被选择的翻译单词从这些翻译单词候选者中被确定。在现有技术的机器翻译系统中,通过用户的学习操作,翻译单词的学习被实现。更具体地说,在相同源词具有多个翻译单词候选者的情况下,用户面前呈现多个翻译单词候选者,用户从多个翻译单词候选者中选择一个翻译单词。响应用户的选择,对应于源词的该翻译单词被存储在系统中。之后,在翻译源词的情况下,该系统优先选择所存储的翻译单词。(Kokai)第PH9-81572号日本专利公开文献“翻译装置和字典优先设置方法”和(Kokai)第PH8-101836号日本专利公开文献“机器翻译的学习方法”说明了该翻译单词的学习。在该方法中,如果该系统首先选择了大量的不适合的翻译单词,则用户学习操作的次数也随之增加。结果,给用户增加了负担。因此,作为省去用户烦琐操作的翻译单词学习方法,通过诸如语言数据库之类的目标语言文件的统计信息,自动确定该翻译单词。在该翻译单词学习方法中,用户预先准备适合于用户意图的目标语言文件,并且可自动执行适合于用户意图的翻译单词学习。更具体地说,在目标语言文件中的每一单词的出现频率被预先计数,并且每一单词与出现频率被存储在表中。对于相同的源词,在产生多个可供选择的翻译单词的情况下,通过参照该表,在多个翻译单词候选者中出现频率最高的一个单词被选中。在文章“使用目标语言的单语言数据数据库的翻译单词学习方法”(刊登在第2002年第1卷的P276-280页的计算机语言联合会的第8次年会的会刊上)中和“(Kokai)第P2000-250914号日本专利公开文献”上的文章“机器翻译方法、装置和记录机器翻译程序的记录介质”中说明了该方法。然而,如上所述,在该自动翻译单词的学习方法中,通过使用目标语言的一个文件,翻译单词被确定。因此,对于源词来说,不适合的翻译单词经常被选择。在这种情况下,如果通过使用目标语言的另一个文件进行翻译单词学习,则可选择该源词适合的翻译单词。然而,即使预先准备多个目标语言文件,用户也很难选择一个通过其确定适合的翻译单词的目标语言文件。例如,在用户准备多个目标语言文件(每一个目标语言文件的内容是相同的)的情况下,如果用户不能充分地理解每一目标语言文件的内容,则他/她就不能选择一个有用的目标语言文件。简言之,在准备多个目标语言文件的情况下,即使用户指示一个适合他/她的意图的目标语言文件,有时也可能出现通过使用该指示的目标语言文件不适合的翻译单词被自动输出。因此,希望一种通过使用目标语言文件通常仅选择适合的翻译单词的方法。
技术实现思路
本专利技术针对的是通过使用目标语言文件通常选择适合于用户意图的翻译单词的。根据本专利技术的一个方面,提供了一种包括多个目标语言文件数据库、用于将源语言翻译成目标语言的机器翻译装置,该机器翻译装置包括数据库控制单元,被配置用于对多个目标语言文件数据库的每一个分配优先程度,并且指示最高优先程度的目标语言文件数据库;翻译单词产生单元,被配置用于产生用于翻译的源词的多个翻译单词候选者;翻译单词学习单元,被配置用于通过使用由所述数据库控制单元指示的目标语言文件数据库,从多个翻译单词候选者中选择翻译单词。根据本专利技术的另一个方面,也提供了一种在包括多个目标语言文件数据库用于将源语言翻译成目标语言的系统中的方法,该方法包括对多个目标语言文件数据库的每一个分配优先程度;指示最高优先程度的目标语言文件数据库;产生用于翻译的源词的多个翻译单词候选者;并且通过使用所指示的目标语言文件数据库从多个翻译单词候选者中选择翻译单词。根据本专利技术的其它方面,也提供了一种计算机程序产品,其包括一种配备在所述产品中的计算机可读程序码,以使计算机通过使用多个目标语言文件数据库将源语言翻译成目标语言,所述计算机可读程序码包括第一程序码,用于对多个目标语言文件数据库的每一个分配优先程度;第二程序码,用于指示最高优先程度的目标语言文件数据库;第三程序码,用于产生用于翻译的源词的多个翻译单词候选者;第四程序码,用于通过使用所指示的目标语言文件数据库,从多个翻译单词候选者中选择翻译单词。附图说明图1是根据本专利技术的实施例的示例性机器翻译系统的方框图。图2是图1中的翻译单元4的方框图。图3是图2中的翻译单词学习单元44的方框图。图4是图1中的目标语言文件数据库产生单元的方框图。图5是图1中的目标语言文件数据库存储器9的方框图。图6是图1中的数据库控制单元6的方框图。图7是存储在图6的控制数据库存储器63和64中的数据的一个示例的示意图。图8是根据本专利技术的实施例的目标语言文件数据库的添加产生处理的流程图。图9是根据本专利技术的实施例的目标语言文件数据库的新产生处理的流程图。图10是根据本专利技术的实施例的数据库产生对话的显示示例的示意图。图11是根据本专利技术的实施例的数据库新产生对话的显示示例的示意图。图12是对根据本专利技术的实施例的控制单元2的用户的交互处理的流程图。图13是根据本专利技术的实施例的目标语言文件数据库控制单元62的处理的流程图。图14是根据本专利技术的实施例的数据库的选择处理的流程图。图15是根据本专利技术的实施例的翻译单词学习的具体处理的流程图。图16是在图15中的步骤S407的翻译单词的选择的具体处理的流程图。图17是根据本专利技术的实施例的翻译数据库控制单元61的处理的流程图。具体实施例方式下面参照附图将说明本专利技术的各种实施例。图1是根据本专利技术的实施例的典型机器翻译系统的方框图。在本专利技术的实施例中,在将源语言翻译成目标语言的情况下,用户可编制多个目标语言文件数据库以提高翻译单词学习的准确性。此外,对于每一目标语言文件数据库,用户可标识或设置翻译单词选择的一个或多个非应用单词。在该系统中,每一目标语言文件数据库的优先程度根据翻译单词选择非应用单词的数量被确定。结果,通过使本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:鈴木博和
申请(专利权)人:株式会社东芝
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1