一种CAT系统中翻译记忆库和MT结合的方法及系统技术方案

技术编号:18913399 阅读:43 留言:0更新日期:2018-09-12 02:55
本发明专利技术公开了一种CAT系统中翻译记忆库和MT结合的方法,包括以下步骤:当用户在CAT中执行翻译原文任务时,将翻译原文发送至翻译记忆库;将翻译原文与翻译记忆库进行匹配;如果翻译原文与翻译记忆库匹配成功,则将翻译记忆库中与翻译原文对应的翻译译文发送至用户;如果翻译原文与翻译记忆库匹配失败,则将翻译原文进行机器翻译,并将机器翻译后的翻译译文发送至用户;公开了采用该方法的系统。本发明专利技术一种CAT系统中翻译记忆库和MT结合的方法及系统,应用于专业领域时,通过机器翻译出来的译文可以作为参考,并且产生大量的翻译样本,有利于专业领域中翻译记忆库的扩充,避免了在专业领域中过分依赖人工翻译的弊病,提高了翻译效率,降低了翻译成本。

A method and system for combining translation memory bank with MT in CAT system

The invention discloses a method for combining a translation memory library with a MT in a CAT system, which comprises the following steps: when a user performs a task of translating the original text in a CAT, sending the translated original text to the translation memory library; matching the translated original text with the translation memory library; and matching the translated original text with the translation memory library; and matching the translated original text with the translation memory library if the translation memory library is successfully matched, translating the translation memory library Translated translations corresponding to the translated original text in the repository are sent to the user; if the matching between the translated original text and the translated memory library fails, the translated original text is machine translated and the translated translation after machine translation is sent to the user; a system adopting the method is disclosed. The invention relates to a method and a system for combining the translation memory library with the MT in a CAT system. When applied to a professional field, the translated text can be used as a reference, and a large number of translation samples are produced, which is beneficial to the expansion of the translation memory library in the professional field and avoids the disadvantage of relying too much on manual translation in the professional field. It improves the efficiency of translation and reduces the cost of translation.

【技术实现步骤摘要】
一种CAT系统中翻译记忆库和MT结合的方法及系统
本专利技术涉及翻译梁宇,具体涉及一种CAT系统中翻译记忆库和MT结合的方法及系统。
技术介绍
随着经济全球化及国际互联网的飞速发展,自然语言的翻译在促进政治、经济、文化交流等方面起到越来越重要的作用。过去在国际交流领域,人们需要对语言文字进行翻译时,需要采用人工翻译,耗时耗力,而随着计算机软硬件技术的高速发展,计算机翻译及计算机辅助翻译得到了越来越广泛的应用。CAT系统,即为计算机辅助翻译系统,是目前进行在线或离线翻译的一种重要的系统;而MT,即机器翻译;现有技术中的翻译系统多采用语料比对或者机器翻译的单一方式,造成翻译效率和翻译结果都不理想。
技术实现思路
本专利技术所要解决的技术问题是现有技术中的翻译系统多采用语料比对或者机器翻译的单一方式,造成翻译效率和翻译结果都不理想,目的在于提供一种CAT系统中翻译记忆库和MT结合的方法及系统,解决上述问题。本专利技术通过下述技术方案实现:一种CAT系统中翻译记忆库和MT结合的方法,包括以下步骤:S1:当用户在CAT中执行翻译原文任务时,将翻译原文发送至翻译记忆库;S2:将翻译原文与翻译记忆库进行匹配;S3:如果翻译原文与翻译记忆库匹配成功,则将翻译记忆库中与翻译原文对应的翻译译文发送至用户;如果翻译原文与翻译记忆库匹配失败,则将翻译原文进行机器翻译,并将机器翻译后的翻译译文发送至用户。现有技术中,CAT系统,即为计算机辅助翻译系统,是目前进行在线或离线翻译的一种重要的系统;而MT,即机器翻译;现有技术中的翻译系统多采用语料比对或者机器翻译的单一方式,造成翻译效率和翻译结果都不理想。本专利技术应用时,当用户在CAT中执行翻译原文任务时,将翻译原文发送至翻译记忆库;翻译记忆库中有大量已经成型的译文,然后将翻译原文与翻译记忆库进行匹配,这种匹配方式,可以通过将翻译原文和翻译记忆库中的原文进行相似度比对,比对成功则认为是匹配成功,然后当如果翻译原文与翻译记忆库匹配成功,则将翻译记忆库中与翻译原文对应的翻译译文发送至用户;翻译记忆库中的译文往往都是相对精准的译文,通过匹配的方式选择出的译文往往更符合客户需求;如果翻译原文与翻译记忆库匹配失败,则将翻译原文进行机器翻译,并将机器翻译后的翻译译文发送至用户。如果匹配失败,则说明翻译记忆库中没有与翻译原文匹配的译文,此时通过机器翻译生成翻译译文并发送至用户,可以为用户提供一个译文参考,同时也可以为翻译记忆库的扩充提供非常丰富的样本。由于通过机器翻译和翻译记忆库相结合的方式进行翻译,这就使得在常规的通用领域中使用时,大量的通用语料可以从翻译记忆库提取译文,有效的提高了翻译效率和结果,而应用于专业领域时,通过机器翻译出来的译文可以作为参考,并且产生大量的翻译样本,非常有利于专业领域中翻译记忆库的扩充,同时避免了在专业领域中过分依赖人工翻译的弊病,提高了翻译效率,降低了翻译成本。进一步的,步骤S3还包括以下子步骤:如果用户采纳了机器翻译后的翻译译文,则进入译文添加流程。进一步的,所述译文添加流程包括:对机器翻译后的翻译译文进行译后编辑;对机器翻译后的翻译译文进行译文校核;如果机器翻译后的翻译译文在译后编辑和译文校核中没有被修改,则将该翻译译文添加入翻译记忆库。本专利技术应用时,为了将机器翻译后的语料添加入翻译记忆库中,通过三段方式对机器翻译后的语料进行认证,首先是用户采纳机器翻译的译文,用户一般来说是专业领域的人员,如果该译文通过了专业领域的人员的认证,可以认为译文是符合该专业的词汇构成;然后通过译后编辑和译文校核的方式,可以对译文的语法及用语习惯进行校正,如果这三段方式都没有进行修改,则认为该译文符合专业领域的词汇、语法和用语习惯要求,此时将该译文加入翻译记忆库,实现了翻译记忆库的扩充,随着用户使用次数的增加,翻译记忆库得到不断的扩充,使得该翻译记忆库可以越来越适用专业领域,并且是通过用户本体提供的样本,所以可以更加符合用户的需求。一种CAT系统中翻译记忆库和MT结合的系统,包括:用于储存翻译记忆的翻译记忆库单元;用于与用户交互的交互单元;用于进行机器翻译的MT单元;用于将翻译原文与翻译记忆库进行匹配的匹配单元;当用户通过交互单元在CAT中执行翻译原文任务时,交互单元将翻译原文发送至匹配单元;所述匹配单元将翻译原文与翻译记忆库进行匹配;如果翻译原文与翻译记忆库匹配成功,则将翻译记忆库中与翻译原文对应的翻译译文通过交互单元发送至用户;如果翻译原文与翻译记忆库匹配失败,则将翻译原文发送至MT单元,MT单元将翻译原文进行机器翻译,并通过交互单元将机器翻译后的翻译译文发送至用户。本专利技术应用时,当用户在CAT中执行翻译原文任务时,将翻译原文发送至翻译记忆库;翻译记忆库中有大量已经成型的译文,然后将翻译原文与翻译记忆库进行匹配,这种匹配方式,可以通过将翻译原文和翻译记忆库中的原文进行相似度比对,比对成功则认为是匹配成功,然后当如果翻译原文与翻译记忆库匹配成功,则将翻译记忆库中与翻译原文对应的翻译译文发送至用户;翻译记忆库中的译文往往都是相对精准的译文,通过匹配的方式选择出的译文往往更符合客户需求;如果翻译原文与翻译记忆库匹配失败,则将翻译原文进行机器翻译,并将机器翻译后的翻译译文发送至用户。如果匹配失败,则说明翻译记忆库中没有与翻译原文匹配的译文,此时通过机器翻译生成翻译译文并发送至用户,可以为用户提供一个译文参考,同时也可以为翻译记忆库的扩充提供非常丰富的样本。由于通过机器翻译和翻译记忆库相结合的方式进行翻译,这就使得在常规的通用领域中使用时,大量的通用语料可以从翻译记忆库提取译文,有效的提高了翻译效率和结果,而应用于专业领域时,通过机器翻译出来的译文可以作为参考,并且产生大量的翻译样本,非常有利于专业领域中翻译记忆库的扩充,同时避免了在专业领域中过分依赖人工翻译的弊病,提高了翻译效率,降低了翻译成本。进一步的,本专利技术还包括:用于进行译文添加的译文添加单元;所述译文添加单元在用户采纳了机器翻译后的翻译译文时接收该翻译译文。进一步的,所述译文添加单元包括:用于对机器翻译后的翻译译文进行译后编辑的编辑单元;用于对机器翻译后的翻译译文进行译文校核的校验单元;如果机器翻译后的翻译译文在编辑单元和校验单元中没有被修改,则将该翻译译文添加入翻译记忆库单元。本专利技术应用时,为了将机器翻译后的语料添加入翻译记忆库中,通过三段方式对机器翻译后的语料进行认证,首先是用户采纳机器翻译的译文,用户一般来说是专业领域的人员,如果该译文通过了专业领域的人员的认证,可以认为译文是符合该专业的词汇构成;然后通过译后编辑和译文校核的方式,可以对译文的语法及用语习惯进行校正,如果这三段方式都没有进行修改,则认为该译文符合专业领域的词汇、语法和用语习惯要求,此时将该译文加入翻译记忆库,实现了翻译记忆库的扩充,随着用户使用次数的增加,翻译记忆库得到不断的扩充,使得该翻译记忆库可以越来越适用专业领域,并且是通过用户本体提供的样本,所以可以更加符合用户的需求。本专利技术与现有技术相比,具有如下的优点和有益效果:1、本专利技术一种CAT系统中翻译记忆库和MT结合的方法,通过机器翻译和翻译记忆库相结合的方式进行翻译,这就使得在常规的通用领域中使用时,大量本文档来自技高网...

【技术保护点】
1.一种CAT系统中翻译记忆库和MT结合的方法,其特征在于,包括以下步骤:S1:当用户在CAT中执行翻译原文任务时,将翻译原文发送至翻译记忆库;S2:将翻译原文与翻译记忆库进行匹配;S3:如果翻译原文与翻译记忆库匹配成功,则将翻译记忆库中与翻译原文对应的翻译译文发送至用户;如果翻译原文与翻译记忆库匹配失败,则将翻译原文进行机器翻译,并将机器翻译后的翻译译文发送至用户。

【技术特征摘要】
1.一种CAT系统中翻译记忆库和MT结合的方法,其特征在于,包括以下步骤:S1:当用户在CAT中执行翻译原文任务时,将翻译原文发送至翻译记忆库;S2:将翻译原文与翻译记忆库进行匹配;S3:如果翻译原文与翻译记忆库匹配成功,则将翻译记忆库中与翻译原文对应的翻译译文发送至用户;如果翻译原文与翻译记忆库匹配失败,则将翻译原文进行机器翻译,并将机器翻译后的翻译译文发送至用户。2.根据权利要求1所述的一种CAT系统中翻译记忆库和MT结合的方法,其特征在于,步骤S3还包括以下子步骤:如果用户采纳了机器翻译后的翻译译文,则进入译文添加流程。3.根据权利要求2所述的一种CAT系统中翻译记忆库和MT结合的方法,其特征在于,所述译文添加流程包括:对机器翻译后的翻译译文进行译后编辑;对机器翻译后的翻译译文进行译文校核;如果机器翻译后的翻译译文在译后编辑和译文校核中没有被修改,则将该翻译译文添加入翻译记忆库。4.采用权利要求1~3中任意一项方法的系统,其特征在于,包括:用于储存翻译记忆的翻译记忆库单元;用于与用户交互的交互单元;用...

【专利技术属性】
技术研发人员:席斌张马成李明彭成超王兴强
申请(专利权)人:成都优译信息技术股份有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1