【技术实现步骤摘要】
本专利技术涉及机器翻译。更具体地,本专利技术涉及基于范例的机器翻译。机器翻译是语言处理的一个分支。
技术介绍
在大多数机器翻译系统中,语言学家协助编写与源语言(要被翻译的语言)和目标语言(要翻译成的语言)的语法相关的一系列规则,以及用于将与源文本对应的数据转换成与目标文本对应的数据的转换规则。在传统的“转换”体系结构中,首先应用源语法规则来去除源语言的语法依赖性,并获得更接近于该文本的语义(含意)的一些数据,然后将其转换成目标语言,在此,应用目标语言的语法规则来生成语法上正确的目标语言文本。但是,为这些系统手工编写规则开支很大、费时并且容易出错。一种减少这些问题的方法是采用源语言文本以及将它们翻译到目标语言的多个范例,并且试图从它们中提取适当的规则。在一种方法中,手工对源语言和目标语言范例文本进行标记以指出对应关系。例如在以下文献中描述了本领域的现有技术Brown P F,Cocke J,della Pietra S A,della Pietra V J,Jelinek F,Lafferty J D,MercerR L和Roossin P S 1990,“A ...
【技术保护点】
一种计算机自然语言翻译系统,其包括:用于输入源语言文本的装置;用于输出目标语言文本的装置;转换装置,用于使用所存储的根据源语言文本和对应的目标语言文本的范例生成的翻译数据从所述源语言文本生成所述目标语言文本,该转换装置的特征在于所述存储的翻译数据包括多个翻译单元,每一个翻译单元包括:表示所述源语言和目标语言的语言单元的出现顺序的各自的表面数据;与所述源语言和目标语言的所述语言单元之间的语义关系相关的各自的依赖关系数据;所述源语言的语言单元的依赖关系数据与所述目标语言的语言单元的对应依赖关系数据对准;以及所述转换装置被设置为用来使用所述源语言的所述表面数据分析所述源语言文本, ...
【技术特征摘要】
EP 2001-10-29 01309156.61.一种计算机自然语言翻译系统,其包括用于输入源语言文本的装置;用于输出目标语言文本的装置;转换装置,用于使用所存储的根据源语言文本和对应的目标语言文本的范例生成的翻译数据从所述源语言文本生成所述目标语言文本,该转换装置的特征在于所述存储的翻译数据包括多个翻译单元,每一个翻译单元包括表示所述源语言和目标语言的语言单元的出现顺序的各自的表面数据;与所述源语言和目标语言的所述语言单元之间的语义关系相关的各自的依赖关系数据;所述源语言的语言单元的依赖关系数据与所述目标语言的语言单元的对应依赖关系数据对准;以及所述转换装置被设置为用来使用所述源语言的所述表面数据分析所述源语言文本,以及使用所述目标语言的所述表面数据生成所述目标语言文本,以及使用所述依赖关系数据将所述源文本的分析变换为所述目标语言的分析。2.根据权利要求1的系统,其中,对于某些所述翻译单元,所述表面语言单元的数量与对应的所述依赖关系语言单元的数量不同。3.根据权利要求1的系统,其中对于每一个所述翻译单元,所述表面数据和所述依赖关系数据对于每一种语言分别包括一头语言单元以及用于存储多个子语言单元的数据结构,这些子语言单元各链接到所述头语言单元。4.根据权利要求3的系统,其中所述语言单元包括用于定义单词的恒定数据。5.根据权利要求3或权利要求4的系统,其中所述语言单元包括位置标志符变量。6.根据前述权利要求中的任何一个的系统,其中所述翻译单元包括可以以图的方式表示的数据,根据该数据可以构造所述源语言分析。7.根据权利要求6的系统,其中所述转换装置被设置为用来尝试使用所述表面数据生成源表面分析图,以及使用所述依赖关系数据生成源依赖关系图。8.根据权利要求6或权利要求7的系统,其中所述转换装置被设置为用来尝试使用所述依赖关系数据生成目标依赖关系图,以及使用所述表面数据生成目标表面分析图。9.根据权利要求6到8中的任何一个的系统,其中所述表面数据是下述的数据所述表面图或每一个所述表面图被约束为具有树结构。10.根据权利要求9的系统,其中所述树是平面树。11.根据权利要求9或权利要求10的系统,其中所述依赖关系数据是下述的数据所述依赖关系图或每一个所述依赖关系图未被约束为具有平面树结构。12.根据权利要求1的系统,其中所述源语言的多个语言单元的所述依赖关系数据与所述目标语言的多个语言单元的对应依赖关系数据的对准关系包括在单个配对记录中把对应的所述多个源语言单元和目标语言单元进行配对。13.一种计算机语言翻译扩展系统,用于扩展在翻译中使用的数据,该系统包括用于使得对应的源范例...
【专利技术属性】
技术研发人员:斯蒂芬克利福德阿普尔比,
申请(专利权)人:英国电讯有限公司,
类型:发明
国别省市:GB[英国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。