机器翻译系统及方法技术方案

技术编号:2853530 阅读:273 留言:0更新日期:2012-04-11 18:40
机器翻译系统包括:存储单元,被配置为存储多个解释数据项,每个数据项包括代表第一语言的第一表示的第一表示元素、包括第一表示的词语集合元素、以及代表第二语言的第二表示的第二表示元素,第一表示将被翻译为第二表示,第一表示和第二表示属于一个类别;获取单元,被配置为获取第一语言的预定表示,预定表示包含于具有结构的待翻译文本中;检测单元,被配置为从解释数据项中检测包括代表预定表示的表示元素的解释数据项;选择单元,被配置为从检测到的解释数据项中选择包括对应于结构中的相同属性或等同的位置关系的词语集合元素的解释数据项;翻译单元,被配置为利用选中的解释数据项将预定表示翻译成第二语言。

【技术实现步骤摘要】

本专利技术涉及一种。
技术介绍
在一个使用计算机将用第一语言(源语言)书写的句子翻译成用第二语言(目标语言)书写的句子的机器翻译系统中,首先,输入句子通过语素分析或句子结构分析被划分为预定的翻译单元(例如词语和短语)。随后,在处理单元中对翻译词典进行搜索以确定要应用的翻译规则,从而确定相应的译文词语(短语)。被确定的词语(短语)按照一个预定的翻译规则被连接,从而获得与输入句子对应的译文。在一个具有诸如表格结构或其中词语或句子按顺序排列的列举结构等结构的文档中,如果对表格结构或列举结构进行翻译,则将表格的每个单元格中的词语或句子,或被列举的词语或句子提取出来,并输入到一个如上所述的机器翻译系统进行翻译。例如那些规则地排列为结构元素的表格的单元格中的句子或列举的句子,很可能不具有语法上正确的结构,也很可能非常短。因此,上述逐一从表格结构或列举结构提取句子并进行机器翻译的方法,不提供许多对于翻译的分析或从可能的句子中进行选择来讲非常关键的信息,这导致翻译准确性的降低。当翻译标准句子时,利用了在句子中和上下文中共同出现的信息(参见,例如日本专利申请特开平NO.3-175573)。但是,如本文档来自技高网...

【技术保护点】
一种机器翻译系统,包括:存储单元,被配置为存储多个解释数据项,每个解释数据项包括代表第一语言的第一表示的第一表示元素、包括所述第一表示的词语集合元素、以及代表第二语言的第二表示的第二表示元素,所述第一表示将被翻译为所述第二表示,所述第一表示和所述第二表示属于一个类别;获取单元,被配置为获取所述第一语言的预定表示,所述预定表示被包含在具有结构的待翻译的文本中;检测单元,被配置为从所述解释数据项中检测其中每一个都包括代表所述预定表示的表示元素的多个解释数据项;选择单元,被配置为从所述检测到的解释数据项选择包括对应于所述结构中的相同属性或等同的位置关系的词语集合元素的解释数据项;翻译单元,被配置为利...

【技术特征摘要】
JP 2004-11-2 319708/20041.一种机器翻译系统,包括存储单元,被配置为存储多个解释数据项,每个解释数据项包括代表第一语言的第一表示的第一表示元素、包括所述第一表示的词语集合元素、以及代表第二语言的第二表示的第二表示元素,所述第一表示将被翻译为所述第二表示,所述第一表示和所述第二表示属于一个类别;获取单元,被配置为获取所述第一语言的预定表示,所述预定表示被包含在具有结构的待翻译的文本中;检测单元,被配置为从所述解释数据项中检测其中每一个都包括代表所述预定表示的表示元素的多个解释数据项;选择单元,被配置为从所述检测到的解释数据项选择包括对应于所述结构中的相同属性或等同的位置关系的词语集合元素的解释数据项;翻译单元,被配置为利用所述选中的解释数据项将所述预定表示翻译成所述第二语言。2.如权利要求1所述的系统,其中所述存储单元象包含所述解释数据项的全部或其中一些一样,包含用于选择包含所述词语集合元素的所述解释数据项的条件,该词语集合元素对应于所述结构中的相同属性或等同的位置关系;以及如果所述检测到的解释数据项包含所述条件并且代表所述预定表示的所述表示元素满足所述条件,那么所述选择单元选择包含所述词语集合元素的解释数据项,该词语集合元素对应于所述结构中的相同属性或等同的位置关系。3,如权利要求1所述的系统,其中,所述词语集合元素具有表格结构,以及所述词语集合元素中的多个表示被按照行和列进行排列。4,如权利要求1所述的系统,其中,所述词语集合元素具有列举结构,以及所述词语集合元素中的多个表示是被列举的表示。5.如权利要求1所述的系统,其中,所述词语集合元素具有章/节结构,以及所述词语集合元素中的多个表示是章的标题与节的标题。6.如权利要求1所述的系统,其中,所述存储的解释数据项包含对应于所述第一语言的表示、及词性的所述第二语言的表示。7.如权利要求2所述的系统,其中,所述条件涉及下列条件中的至少一个,一个条件是用于确定在所述词语集合元素和包含在所述检测到的解释数据项中的每个词语集合元素之间,表示的数量是相同的条件,一个条件是用于确定在所述词语集合元素...

【专利技术属性】
技术研发人员:铃木博和熊野明
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1