评价中间语的词语的方法和装置以及机器翻译方法和设备制造方法及图纸

技术编号:10574129 阅读:152 留言:0更新日期:2014-10-29 09:25
本发明专利技术涉及一种对中间语的词语进行评价的方法和对中间语的词语进行评价的装置以及机器翻译方法和机器翻译设备。对中间语的词语进行评价的方法,包括确定中间语的词语相对于源语言的第一特定属性;确定中间语的词语相对于目标语的第二特定属性;根据第一特定属性和第二特定属性来计算中间语的词语的可靠性分数;以及根据可靠性分数来评价中间语的词语,其中,中间语的词语是将源语言的特定词语翻译成目标语的词语的桥梁。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种对中间语的词语进行评价的方法和对中间语的词语进行评价的装置以及机器翻译方法和机器翻译设备。对中间语的词语进行评价的方法,包括确定中间语的词语相对于源语言的第一特定属性;确定中间语的词语相对于目标语的第二特定属性;根据第一特定属性和第二特定属性来计算中间语的词语的可靠性分数;以及根据可靠性分数来评价中间语的词语,其中,中间语的词语是将源语言的特定词语翻译成目标语的词语的桥梁。【专利说明】评价中间语的词语的方法和装置以及机器翻译方法和设备
本专利技术涉及语言处理领域,具体涉及对中间语的词语进行评价的方法和对中间语 的词语进行评价的装置以及机器翻译方法和机器翻译设备。
技术介绍
平行的词汇信息在交叉语言应用(包括机器翻译、交叉语言信息获取等等)中占有 至关重要的地位。然而,不是任何两种语言的平行词汇信息的获取都是可行的,尤其是那些 使用范围非常有限的语言。另外,由于新名词的发展十分迅速,因而想要使所掌握的平行词 汇信息能够追赶上新名词的发展十分困难。因此,中间语(Pivot language)这一概念被引 入。通过中间语来补充更多的平行词汇信息。然而,对中间语的使用主要存在两个主要障 碍,第一是歧义性,第二是不匹配。 为解决源语言(Source language)、中间语与目标语(Target language)的歧义问 题,传统方法使用结构化双语词典、语义类别(semantic class)、多个中间语言、相关频率、 编辑距离等信息。传统方法始终相信源语言与中间语之间的翻译概率、中间语与目标语之 间的翻译概率可以反映歧义问题,并可以通过选择最高概率来解决歧义问题。 通过中间语获取双语信息的传统方法基本遵循如下过程。首先获取源语言与中间 语的信息、中间语与目标语的信息,例如,翻译概率、词汇化翻译概率、编辑距离,语义信息 等。通过这些信息选择出最可靠的成对的源语言词语与目标语词语。然而,如果中间语含 有多个语义,传统方法并不会对这种情况进行特殊处理,而是依旧选择翻译概率最高的词 语作为最终结果。这种做法忽略了源自非平行语料的源语言和目标语不具有相同涵义这一 特点,因此,在中间语的词语具有歧义的情况下,翻译概率并不能反映源语言的词语与目标 语的词语之间的语义关系。 因此,期望提出一种能够解决上述问题的技术。
技术实现思路
在下文中给出关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理 解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关 键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念, 以此作为稍后论述的更详细描述的前序。 本专利技术的一个主要目的在于,提供一种对中间语的词语进行评价的方法和对中间 语的词语进行评价的装置以及机器翻译方法和机器翻译设备。 根据本专利技术的一个方面,提供了一种对中间语的词语进行评价的方法。该方法包 括:确定中间语的词语相对于源语言的第一特定属性;确定中间语的词语相对于目标语的 第二特定属性;根据第一特定属性和第二特定属性来计算中间语的词语的可靠性分数;以 及根据可靠性分数来评价中间语的词语,其中,中间语的词语是将源语言的特定词语翻译 成目标语的词语的桥梁。 根据本专利技术的另一个方面,提供了一种机器翻译方法。该方法包括:通过上述的对 中间语的词语进行评价的方法获得中间语的词语的可靠性分数;根据中间语的词语的可靠 性分数、以及将源语言的特定词语通过中间语的词语翻译成目标语的候选词语的机器翻译 分数,计算目标语的候选词语的翻译分数;以及根据翻译分数从目标语的候选词语中选择 目标语的词语作为翻译结果。 根据本专利技术的又一个方面,提供了一种对中间语的词语进行评价的装置。该装置 包括:第一特定属性确定部,用于确定中间语的词语相对于源语言的第一特定属性;第二 特定属性确定部,用于确定中间语的词语相对于目标语的第二特定属性;可靠性分数计算 部,用于根据第一特定属性和第二特定属性来计算中间语的词语的可靠性分数;以及评价 部,用于根据可靠性分数来评价中间语的词语,其中,中间语的词语是将源语言的特定词语 翻译成目标语的词语的桥梁。 根据本专利技术的又一个方面,提供了一种机器翻译设备。该设备包括:上述的对中间 语的词语进行评价的装置,用于获得中间语的词语的可靠性分数;翻译分数计算部,用于根 据中间语的词语的可靠性分数、以及将源语言的特定词语通过中间语的词语翻译成目标语 的候选词语的机器翻译分数,计算目标语的候选词语的翻译分数;以及翻译结果选择部,用 于根据翻译分数从目标语的候选词语中选择目标语的词语作为翻译结果。 另外,根据本专利技术的又一个方面,提供了一种用于实现上述装置的计算机程序。 此外,根据本专利技术的又一个方面,提供了一种至少计算机可读介质形式的计算机 程序产品,其上记录有用于实现上述装置的计算机程序代码。 通过以下结合附图对本专利技术的最佳实施例的详细说明,本专利技术的这些以及其他优 点将更加明显。 【专利附图】【附图说明】 参照下面结合附图对本专利技术实施例的说明,会更加容易地理解本专利技术的以上和其 它目的、特点和优点。附图中的部件只是为了示出本专利技术的原理。在附图中,相同的或类似 的技术特征或部件将采用相同或类似的附图标记来表示。 图1A是示出根据本专利技术的一个实施例的对中间语的词语进行评价的方法的流程 图。 图1B是示出根据本专利技术的一个实施例的通过人工神经网络来计算可靠性分数的 示意图。 图2是示出根据本专利技术的另一个实施例的对中间语的词语进行评价的方法的流 程图。 图3是示出根据本专利技术的一个实施例的机器翻译方法的流程图。 图4是示出根据本专利技术的一个实施例的对中间语的词语进行评价的装置的配置 的框图。 图5是示出根据本专利技术的另一个实施例的对中间语的词语进行评价的装置的配 置的框图。 图6是示出根据本专利技术又一个实施例的对中间语的词语进行评价的装置的配置 的框图。 图7是示出根据本专利技术的一个实施例的机器翻译设备的配置的框图。 图8是示出可以用于实施本专利技术的对中间语的词语进行评价的方法和装置的计 算设备以及机器翻译方法和机器翻译设备的举例的结构图。 【具体实施方式】 下面参照附图来说明本专利技术的实施例。在本专利技术的一个附图或一种实施方式中描 述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应 当注意,为了清楚的目的,附图和说明中省略了与本专利技术无关的、本领域普通技术人员已知 的部件和处理的表示和描述。 在有些情况下,可能缺少将源语言A和目标语B直接关联起来的信息,而存在将中 间语E和源语言A直接关联起来的信息、以及将中间语E和目标语B直接关联起来的信息。 在这种情况下,可以考虑在中间语E中寻找一个或多个词语P作为桥梁,以将源语言A中的 特定词语S翻译成目标语B中的相应词语。换句话说,中间语E的词语P可作为将源语言 A的特定词语S翻译成目标语B中的相应词语T的桥梁。 图1A是示出根据本专利技术的一个实施例的对中间语E的词语P进行评价的方法100 的流程图。图1B是示出根据本专利技术的一个实本文档来自技高网
...
评价中间语的词语的方法和装置以及机器翻译方法和设备

【技术保护点】
一种对中间语的词语进行评价的方法,包括:确定所述中间语的词语相对于源语言的第一特定属性;确定所述中间语的词语相对于目标语的第二特定属性;根据所述第一特定属性和所述第二特定属性来计算所述中间语的词语的可靠性分数;以及根据所述可靠性分数来评价所述中间语的词语,其中,所述中间语的词语是将源语言的特定词语翻译成目标语的词语的桥梁。

【技术特征摘要】

【专利技术属性】
技术研发人员:付亦雯葛乃晟郑仲光孟遥于浩
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1