【技术实现步骤摘要】
本专利技术涉及利用例句对译词典的基于例句集合的翻译装置、方法和包括该基于例句集合的翻译装置的短语翻译装置。
技术介绍
机器翻译利用计算机将某一种语言翻译成另一种语言,这种研究开发在世界上已经进行了半个世纪。机器翻译方式可以大致分为1)基于分析的机器翻译方式、2)基于统计的机器翻译方式、3)基于例句的机器翻译方式。 基于分析的机器翻译方式是对第1语言进行分析(词素分析、句法/语义分析等),将分析结果转换成第2语言,进而生成第2语言译文的技术。因为自然语言分析技术是尚未成熟的技术,所以基于分析的机器翻译方式的实用化存在极限。并且,由于不能学习,所以具有很难对翻译引擎进行改善/改进的缺点。 基于统计的机器翻译方式是使用语言模型和统计模型来构建翻译模型的技术。因为该方式在各模型结构中限定了必要的学习数据(corpus语料库),所以实用化受到限制。 基于例句的机器翻译方式是模拟人学习外语的机制,参考已经学习过的翻译例句来翻译新的文件的技术。该翻译方式于19世纪80年代提出,此后进行了大量的研究开发。在基于例句的机器翻译技术中,根据所参照的对译例句模式的定义以及相 ...
【技术保护点】
一种基于例句集合的翻译装置,其特征在于,该基于例句集合的翻译装置具有: 例句对译词典,其存储有多个第1语言例句和作为其对应译文的第2语言对译例句来作为例句对译组; 输入第1语言短语的单元; 从所述例句对译词典中选择包含所述 输入短语的多个例句对译组的单元; 分别提取所述多个例句对译组中的各例句对译组相互之间的共同部分的组的单元; 计算所述提取出的多个共同部分的组针对所述输入短语的支持程度的单元;以及 输出根据所述计算出的支持程度而选择出的共同 部分的组中的对译短语,来作为针对所述输入短语的第2语言译文的单元。
【技术特征摘要】
JP 2008-3-24 2008-0764971.一种基于例句集合的翻译装置,其特征在于,该基于例句集合的翻译装置具有例句对译词典,其存储有多个第1语言例句和作为其对应译文的第2语言对译例句来作为例句对译组;输入第1语言短语的单元;从所述例句对译词典中选择包含所述输入短语的多个例句对译组的单元;分别提取所述多个例句对译组中的各例句对译组相互之间的共同部分的组的单元;计算所述提取出的多个共同部分的组针对所述输入短语的支持程度的单元;以及输出根据所述计算出的支持程度而选择出的共同部分的组中的对译短语,来作为针对所述输入短语的第2语言译文的单元。2.根据权利要求1所述的基于例句集合的翻译装置,其特征在于,计算针对所述输入短语的支持程度的单元进一步包括在所述提取出的共同部分的各组中的第1语言例句之间的共同部分与输入短语处于预定的一致程度的情况下,选择其第2语言对应译文中的共同部分来作为译文候选的单元;以及对所述选择出的译文候选的出现次数进行计数,来表示其支持程度的单元。3.根据权利要求2所述的基于例句集合的翻译装置,其特征在于,在所述提取出的共同部分的各组中的第1语言例句之间的共同部分与输入短语完全一致的情况,或者所述共同部分包含输入短语、并且其对应译文中的共同部分成为译文候选的情况中的任意一种情况下,选择所述译文候选的单元选择其第2语言对应译文中的共同部分来作为译文候选。4.根据权利要求1、2或3所述的基于例句集合的翻译装置,其特征在于,在以下任意一种情况下,输出基于所述计算出的支持程度而选择出的共同部分的组中的对译短语来作为针对所述输入短语的第2语言译文的单元,输出出现次数最多的译文候选来作为针对所述输入短语的第2语言译文,即该出现次数最多的译文候选的该出现次数超过第1阈值的情况,或者该出现次数在第1阈值以下、...
【专利技术属性】
技术研发人员:刘绍明,吴宏林,胡海鹏,
申请(专利权)人:富士施乐株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。