用于机器翻译的设备和方法技术

技术编号:3771440 阅读:212 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及用于机器翻译的设备和方法。在一种机器翻译设备中,在范例存储单元中存储目标语言形式的目标语言范例和源语言形式的源语言范例,同时彼此对应地保持目标语言范例和源语言范例。输入接收单元接收所述源语言形式的输入语句。搜索单元在所述范例存储单元中搜索所述目标语言范例中对应于所述源语言范例中匹配或类似所述输入语句的一个范例的一个范例。翻译单元通过将所述搜索中找到的所述目标语言范例之一翻译成所述源语言形式来产生反向翻译语句。检测单元检测所述反向翻译语句和所述输入语句之间的差异部分。输出单元输出所述差异部分。

【技术实现步骤摘要】

本专利技术涉及一种用于将已输入的源语言语句翻译成目标语言语句的机 器翻译设备和机器翻译方法。
技术介绍
随着自然语言处理技术的发展,机器翻译设备得到了发展,这种设备 接收以源语言表达的源语言语句的输入、将输入语句转换成期望目标语言 的语句并输出转换结果。例如,将日文表达的文本等翻译成诸如英文或中 文之类的另一种语言的机器翻译设备己经投入实际使用。为了以更高水平 的精确度更忠实地翻译源语言的输入语句,这种机器翻译设备需要包括能 够针对自然语言的多样性和歧义找到充分的解决方案的机构。例如,JP-A 2000-10974(特开)提出了一种技术,利用该技术,通过与 用户交互来补充源语言语句中缺少的格要素(case element)。该技术实现 了针对源语言语句翻译期间出现的歧义提供解决方案并实现了高水平的精 确度而不会造成分析错误的翻译设备。然而,有这样一些情形,其中,即使源语言语句没有分析歧义,该翻 译设备也不能够产生充分反映源语言语句暗含目的的翻译语句。例如,由 于文化背景、措辞或语用的原因,任何源语言都有通常省略的某些单词或 短语。情况常常是省略这样的单词或短语不会导致源语言中的文法问题。 于是,难以检测到这种情况在翻译涉及到省略这种单词或短语的源语言 语句时,翻译语句未适当反映出源语言语句的暗含目的。此外, 一般而言,机器翻译设备的用户通常对目标语言了解不够。于 是,用户极难检査该设备输出的翻译语句以判定翻译语句未恰当反映用户 目的并进一步再次输入带补充信息的源语言语句以获得更适当的翻译语 句。
技术实现思路
根据本专利技术的一个方面, 一种机器翻译设备,其包括范例存储单元, 其彼此对应地存储目标语言形式的多个目标语言范例和源语言形式的多个 源语言范例,所述多个目标语言范例中的每一个目标语言范例的含义等价于所述多个源语言范例中对应一个源语言范例的含义;输入接收单元,其 接收所述源语言形式的输入语句;搜索单元,其在所述范例存储单元中搜 索所述多个目标语言范例中与所述多个源语言范例中匹配于或类似于所述 输入语句的一个源语言范例相对应的一个目标语言范例;翻译单元,其通 过将所述输入语句翻译成所述目标语言的形式来产生目标语言语句,并通 过将所述搜索中找到的所述多个目标语言范例中的所述一个目标语言范例 翻译成所述源语言的形式来产生反向翻译语句;检测单元,其检测所述反 向翻译语句和所述输入语句之间的多个差异部分;以及输出单元,其输出 所述差异部分。根据本专利技术的另一个方面, 一种机器翻译设备,其包括范例存储单 元,其彼此对应地存储目标语言形式的多个目标语言范例和源语言形式的 多个源语言范例,所述多个目标语言范例中的每一个目标语言范例的含义 等价于所述多个源语言范例中对应一个源语言范例的含义;输入接收单元, 其接收所述源语言形式的输入语句;搜索单元,其在所述范例存储单元中 搜索所述多个目标语言范例中与所述多个源语言范例中匹配于或类似于所 述输入语句的一个源语言范例相对应的一个目标语言范例;第一翻译单元, 其通过将所述搜索中找到的所述多个目标语言范例中的一个目标语言范例 翻译成所述源语言的形式来产生第一反向翻译语句;第二翻译单元,其通 过将所述输入语句翻译成所述目标语言的形式来产生目标语言语句,并通 过将所产生的目标语言语句翻译成所述源语言的形式来产生第二反向翻译 语句;检测单元,其检测所述第一反向翻译语句和所述第二反向翻译语句 之间的差异部分;以及输出单元,其输出所述差异部分。根据本专利技术的又一方面, 一种机器翻译方法,其包括接收源语言形 式的输入语句;在范例存储单元中搜索所述多个目标语言范例中与所述多 个源语言范例中匹配于或类似于所述输入语句的一个源语言范例相对应的 一个目标语言范例,其中,所述范例存储单元彼此对应地存储目标语言形式的多个目标语言范例和所述源语言形式的多个源语言范例,所述多个目 标语言范例中的每一个目标语言范例的含义等价于所述多个源语言范例中 对应一个源语言范例的含义;通过将所述输入语句翻译成所述目标语言的 形式来产生目标语言语句;通过将所述搜索中找到的所述多个目标语言范 例中的所述一个目标语言范例翻译成所述源语言的形式来产生反向翻译语 句;检测所述反向翻译语句和所述输入语句之间的差异部分;以及输出所 述差异部分。根据本专利技术的又一方面, 一种机器翻译方法,其包括接收源语言形 式的输入语句;在范例存储单元中搜索所述多个目标语言范例中与所述多 个源语言范例中匹配于或类似于所述输入语句的一个源语言范例相对应的 一个目标语言范例,其中,所述范例存储单元彼此对应地存储目标语言形 式的多个目标语言范例和所述源语言形式的多个源语言范例,所述多个目 标语言范例中的每一个目标语言范例的含义等价于所述多个源语言范例中 对应一个源语言范例的含义;通过将所述搜索中找到的所述多个目标语言范例中的一个目标语言范例翻译成所述源语言的形式来产生第一反向翻译 语句;通过将所述输入语句翻译成所述目标语言的形式来产生目标语言语 句,并通过将所产生的目标语言语句翻译成所述源语言的形式来产生第二 反向翻译语句;检测所述第一反向翻译语句和所述第二反向翻译语句之间 的差异部分;以及输出所述差异部分。附图说明图l是根据本专利技术实施例的机器翻译设备的方框图; 图2为示出了范例存储单元中存储的平行翻译范例组的示范性数据结 构的图示;图3为示出了类似的平行翻译范例列表范例的图示;图4为解释用于检测源语言输入语句和经编辑的范例反向翻译语句之 间差异的过程的图示;图5为解释用于检测反向翻译输入语句和经编辑的范例反向翻译语句 之间差异的过程的图示;图6为示出了其中存储差异信息的差异信息列表范例的图示;9图7为示出了建议语句范例的图示;图8为示出了用户差异信息范例的图示;图9为示出了显示屏范例的图示;图10是根据该实施例的机器翻译过程的总体流程的流程图11是根据该实施例的差异检测过程的总体流程的流程图12是根据该实施例的建议语句产生过程的总体流程的流程图13是根据该实施例的结果输出过程的总体流程的流程图14是根据该实施例的假设施加过程的总体流程的流程图15是根据该实施例的更新过程的总体流程的流程图16为示出了翻译语句范例的图示;图17为示出了编辑范例翻译语句的范例的图示;图18为示出了显示屏范例的图示;图19为示出了类似的平行翻译范例列表范例的图示;图20为示出了翻译语句范例的图示;图21为示出了差异信息列表的范例的图示;图22为示出了显示屏范例的图示;图23为示出了显示屏另一范例的图示;以及图24为解释根据该实施例的机器翻译设备的硬件配置的图示。具体实施例方式将参考附图详细描述根据本专利技术的机器翻译设备和机器翻译方法的示 范性实施例。在接下来的部分中,将利用在日文和中文语言之间或日文和 英文语言之间翻译的范例来解释本专利技术。然而,在翻译过程中可用作目标 语言的语言不限于这些语言。使用任何其他语言都是可接受的。根据本专利技术实施例的机器翻译设备搜索包括类似于源语言输入语句的 范例的平行翻译范例组,通过将平行翻译范例组中的目标语言范例翻译成 源语言所获得的反向翻译语句与输入语句或与进一步将输入语句翻译成目 标语言的结果翻译成源语言所获得的另一个反向翻译语句进行比较来检测本文档来自技高网...

【技术保护点】
一种机器翻译设备,其包括: 范例存储单元,其彼此对应地存储目标语言形式的多个目标语言范例和源语言形式的多个源语言范例,所述多个目标语言范例中的每一个目标语言范例的含义等价于所述多个源语言范例中对应一个源语言范例的含义; 输入接收 单元,其接收所述源语言形式的输入语句; 搜索单元,其在所述范例存储单元中搜索所述多个目标语言范例中与所述多个源语言范例中匹配于或类似于所述输入语句的一个源语言范例相对应的一个目标语言范例; 翻译单元,其通过将所述输入语句翻译成所 述目标语言的形式来产生目标语言语句,并通过将所述搜索中找到的所述多个目标语言范例中的所述一个目标语言范例翻译成所述源语言的形式来产生反向翻译语句; 检测单元,其检测所述反向翻译语句和所述输入语句之间的差异部分;以及 输出单元,其 输出所述差异部分。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:釜谷聪史知野哲朗降幡建太郎
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1