【技术实现步骤摘要】
本专利技术涉及一种用于将第一格式的数据项输入序列翻译为第二格式的数据项输出序列的方法和设备。特别是但不唯一地,本专利技术涉及到将一个源语言中的句子翻译为目标语言中的句子。
技术介绍
在机器翻译或者机器辅助翻译领域内有多种技术为人所知,它们使用现有的翻译材料存储库来完成辅助翻译或自动翻译。一个翻译存储器(TM)系统具有一个源语言句子储存库,该储存库中的每个源语言句子都和与其相关的目标语言句子相配对,并通过在储存库中查找在结构和内容上与输入句相近的句子来操作被呈现给翻译者的与其相关的目标语言句子,以进行人工的事后编辑(post-editing)。一个基于实例的机器翻译(EBMT)系统试图完全自动翻译,并通过以下步骤来操作将输入的句子分解为片段,并在储存库中为每个片段查找一个译文,而后将这些断续的译文合并为目标句。翻译存储器系统非常准确,但是往往覆盖范围有限。在输入句子和检索得到的句子之间的区别通常局限于在词序、词法形式和拼写上的的微小变化。实例经常对实例配对的目标句不做任何改变;仅仅将其作为最佳匹配句子而呈现给翻译者。在更多改进的TM系统中,目标实例中的某些成分可 ...
【技术保护点】
一种使用一个存储器(17),其包括第一格式中的大量实例序列,每一个实例句子都与第二格式的其译文相配对,把第一格式的数据项输入序列(3)翻译为第二格式的数据项输出序列(15)的方法,该方法包括:(a)根据输入序列(15)和存储器(17 )中大量的实例序列中的每一个的比较,从存储器(17)中选择(S2)一个基础实例序列,并使用与其配对的译文作为翻译基础;(b)识别(S3)输入序列的不同于基础实例序列的相应部分(29-1到29-4)的那些部分(29-1到29-4),这 些部分分别被指定为输入和基础实例不匹配部分;(c)查找(S4)相应于基础实例不匹配部 ...
【技术特征摘要】
GB 2004-6-24 0414180.01.一种使用一个存储器(17),其包括第一格式中的大量实例序列,每一个实例句子都与第二格式的其译文相配对,把第一格式的数据项输入序列(3)翻译为第二格式的数据项输出序列(15)的方法,该方法包括(a)根据输入序列(15)和存储器(17)中大量的实例序列中的每一个的比较,从存储器(17)中选择(S2)一个基础实例序列,并使用与其配对的译文作为翻译基础;(b)识别(S3)输入序列的不同于基础实例序列的相应部分(29-1到29-4)的那些部分(29-1到29-4),这些部分分别被指定为输入和基础实例不匹配部分;(c)查找(S4)相应于基础实例不匹配部分(29-1到29-4)的翻译基础的部分(31-1到31-4);(d)使用(S5)输入不匹配部分来从存储器(17)中选择一组辅助实例序列;(e)从一组辅助实例序列确定(S6)相应于输入不匹配部分(29-1到29-4)的可能译文的备选项;(f)根据预先确定的选择算法从备选项中选择(S7)一个译文,并且使用(S9)所选择的译文来替换在步骤(c)中查找的部分;(g)使用(S10)步骤(f)的结果作为数据项输出序列(15)的基础。2.如权利要求1所述的方法,其中对于在输入序列中识别的大量的输入不匹配部分,重复(S8)步骤(b)到(f)。3.如权利要求2所述的方法,其中对于在输入序列中识别的每个不匹配部分,重复(S8)步骤(b)到(f)。4.如权利要求1、2或3所述的方法,其中在步骤(a)选择的基础实例序列是一个来自于存储器(17)的、根据预先确定的紧密度量最紧密匹配于输入序列(3)的实例序列。5.如前述任意权利要求所述的方法,其中在步骤(b)中识别的基础实例不匹配部分(29-1到29-4),以及在步骤(c)中查找的与其相应的译文基础部分(31-1到31-4),可以是位于两个相邻的数据项之间的空序列,以便在步骤(f)中的替换是一个在该位置上的有效的插入。6.如前述任意权利要求所述的方法,其中在步骤(f)中根据语境,所选择译文的词法变体被用来替换在步骤(c)查找的部分。7.如前述任意权利要求所述的方法,其中在用作数据项的输出序列(15)之前,对从步骤(f)产生的序列执行进一步的处理。8.如前述任意权利要求所述的方法,其中数据项是单词。9.如权利要求8所述的方法,其中第一和第二格式分别是第一和第二语言。10.如权利要求9所述的方法,其中数据项的输入序列形成一个语法上完整的短语。11.如权利要求10所述的方法,其中数据项的输入序列形成一个句子。12.如前述任意权利要求所述的方法,其中在步骤(c)中使用在基础实例序列的部分和与其配对的译文的各个部分之间的对准来查找部分(31-1到31-4)。13.如权利要求12所述的方法,其中对准是预先确定的。14.如前述任意权利要求所述的方法,其中步骤(d)包括,如果在实例序列中至少一个数据项匹配或者对应于输入不配对部分(29-1到29-4)中至少一个数据项,那么选择一个实例序列以包含在该组中。15.如前述任意权利要求所述的方法,其中步骤(e)包括,为该中的辅助实例,识别该辅助实例的相应于输入不匹配部分(29-1到29-4)的部分,并且使用与辅助实例配对的译文的相应部分来形成备选项中的可能译文之一。16.如前述任意权利要求所述的方法,其中预先确定的选择算法包括,为备选项中的至少一个译文的每一个分配给译文一个优选值,该优选值依赖于导出译文的至少一个辅助实例而确定。17.如权利要求16所述的方法,其中优选值依赖于输入序列和至少一个辅助实例中的每一个之间的比较而确定。18.如权利要17求所述的方法,其中优选值通过向这样的比较或每一个这样的比较分配权重并且将一个(或多个)所分配的权重以预先确定的方式合并而确定。19.如权利要求18所述的方法,其中权重依赖于所比较的输入序列和辅助实例之间共有的数据项或者变...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。