基于逆向差异识别的人机共译方法与系统技术方案

技术编号:25690927 阅读:30 留言:0更新日期:2020-09-18 21:02
本发明专利技术提出基于逆向差异识别的人机共译方法、用于识别机器翻译差异的人机共译系统以及实现该方法的计算机可读存储介质,所述人机共译系统包括语义段落识别引擎、语义上下文识别引擎以及组合机器翻译引擎以及选择的逆向翻译引擎。本发明专利技术的技术方案首次引入逆向翻译结果比对,并且在翻译过程中的多个阶段充分利用上下文概念以及机器翻译引擎的相互对比结果,从而提供人工翻译介入的准确时机,使得针对大规模语料翻译以及准确度要求较高的翻译场合既能保证翻译效率,同时确保翻译的准确性。

【技术实现步骤摘要】
基于逆向差异识别的人机共译方法与系统
本专利技术属于人机协同
,尤其涉及一种基于逆向差异识别的人机共译方法、用于识别机器翻译差异的人机共译系统以及实现该方法的计算机可读存储介质。
技术介绍
随着全球化和信息化的不断推进,海量的翻译需求给语言服务行业带来了前所未有的机遇和挑战。将计算机辅助翻译、机器翻译集成为译员打造新的翻译工作环境已经是目前主流发展趋势。计算机辅助翻译(Computeraidedtranslation,CAT)类似于CAD(计算机辅助设计),能够帮助翻译者优质、高效、轻松地完成翻译工作。它不同于以往的机器翻译软件,不依赖于计算机的自动翻译,而是在人的参与下完成整个翻译过程。与人工翻译相比,质量相同或更好,翻译效率可提高一倍以上。CAT使得繁重的手工翻译流程自动化,并大幅度提高了翻译效率和翻译质量。在翻译过程中,存在着大量重复或相似的句子和片段。采用人工笔译哪怕是最简单的句子,也需要书写一遍。CAT技术具有自动记忆和搜索机制,可以自动存储用户翻译的内容。当用户翻译某个句子时,系统自动搜索用户已经翻译过的句子,如果当前翻译的句子用户曾经翻译过,会自动给出以前的翻译结果;对于相似的句子,也会给出翻译参考和建议。实现高质量机器翻译的梦想已经存在了很多年,很多科学家都为这一梦想贡献了自己的时间和心力。从早期的基于规则的机器翻译到如今广泛应用的神经机器翻译,机器翻译的水平不断提升,已经能满足很多场景的基本应用需求。然而,机器翻译虽然快速,但是其准确度依然不能完全满足实际需要。尤其是对于一些重大的涉及敏感问题的待译文档,单纯的仅仅依靠机器翻译的结果是无法满足客户要求的。不管机器翻译或者计算机辅助翻译的方案如何改进,人工编辑校对甚至翻译都不可缺少。然而,如何平衡人工编辑翻译和机器翻译的工作时间、人工翻译何时接介入、以何种方式介入并且在保证准确度的同时能够满足大规模语义翻译的需要,现有技术并未给出有效的解决方案。
技术实现思路
为解决上述技术问题,本专利技术提出基于逆向差异识别的人机共译方法、用于识别机器翻译差异的人机共译系统以及实现该方法的计算机可读存储介质,所述人机共译系统包括语义段落识别引擎、语义上下文识别引擎以及组合机器翻译引擎以及选择的逆向翻译引擎。本专利技术的技术方案首次引入逆向翻译结果比对,并且在翻译过程中的多个阶段充分利用上下文概念以及机器翻译引擎的相互对比结果,从而提供人工翻译介入的准确时机,使得针对大规模语料翻译以及准确度要求较高的翻译场合既能保证翻译效率,同时确保翻译的准确性。具体来说,在本专利技术的第一个方面,提供一种基于逆向差异识别的人机共译方法,所述方法用于将待译源文通过机器翻译引擎翻译成目标译文后,基于逆向翻译识别出需要人工介入的差异部分。在此基础上,本专利技术的技术方案的核心技术手段包括:S100:对输入的待译源文E进行语义预处理,所述语义预处理包括分段识别和上下文识别,从而得到组成待译源文E的各个段落Gi以及Gi的上下文段落{Gi-1,Gi+1};S200:对于每一个段落Gi,执行如下计算机处理过程:G001:将段落Gi输入至第一机器翻译引擎,将段落Gi-1输入至第二机器翻译引擎,将段落Gi+1输入至第三机器翻译引擎,得出第一机器翻译结果Yi、第二机器翻译结果Yi-1以及第三机器翻译结果Yi+1;G002:将所述三个机器翻译结果组合成一个整体段落{Yi-1、Yi、Yi+1},作为第一机器翻译引擎的输入,将所述整体段落{Yi-1、Yi、Yi+1}进行逆向翻译,得到逆向翻译结果Ne;G003:识别出所述逆向翻译结果Ne与待译源文E的差异部分,将所述差异部分所在的句子作为输入,分别输入至所述第一至第三机器翻译引擎,并在人机交互界面上显示所述第一至第三机器翻译引擎对于所述差异部分的翻译结果;其中,所述逆向翻译是指将整体段落{Yi-1、Yi、Yi+1}翻译成待译源文E所属的语种。作为进一步的优选,所述第一机器翻译引擎为Lingoes;所述第二机器翻译引擎为ICAT;所述第一机器翻译引擎为TRADOS。作为体现人机交互的关键技术手段,在所述步骤G003之后,还包括:在人机交互界面上高亮显示所述待译源文E与所述逆向翻译结果Ne的差异部分;并且并排显示所述三个机器翻译引擎对于所述差异部分的翻译结果。并且,在所述人机交互界面上提供编辑工具,所述编辑工具用于对所述差异部分的翻译结果进行编辑。本专利技术的上述方法可以通过计算机指令形式的程序代码实现,因此,本专利技术还提供计算机可读存储介质,其上存储有计算机可执行指令,通过包含存储器和处理器的通信终端,执行所述可执行指令,用于实现前述所述的基于逆向差异识别的人机共译方法。在另一个方面,本专利技术还提供一种用于识别机器翻译差异的人机共译系统,所述系统包括人机交互界面,具体而言,作为体现技术方案创造性的关键技术手段,所述系统还包括语义段落识别引擎、语义上下文识别引擎以及组合机器翻译引擎;所述语义段落识别引擎用于对待译源文进行语义识别后,输出段落识别结果;所述语义上下文识别引擎用于对每一个当前识别出的段落,得出其上下文段落;将所述当前识别出的段落机器上下文段落输入至所述机器翻译引擎,得出多个机器翻译结果;进一步的,所述系统还包括逆向翻译引擎与差异识别引擎,所述逆向翻译引擎用于将所述多个机器翻译结果组合后,进行逆向翻译;所述差异识别引擎将所述逆向翻译的结果与所述待译源文进行比对后,识别出其中的差异部分,在所述人机交互界面上高亮显示作为实现本专利技术上述方法的关键组成部分,所述的人机共译系统,还包括评测组件,所述评测组件对所述多个机器翻译引擎的翻译结果进行评测。基于所述评测组件的评测得分,选择所述组合机器翻译引擎中多个机器翻译引擎之一作为所述逆向翻译引擎执行所述逆向翻译。本专利技术的进一步优点将结合说明书附图在具体实施例部分进一步详细体现。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一个实施例的人机共译方法的流程图图2是图1所述方法的进一步实现细节流程图图3是实现图1-2所述方法的系统架构图具体实施方式下面,结合附图以及具体实施方式,对专利技术做出进一步的描述。参照图1,本专利技术一个实施例的一种基于逆向差异识别的人机共译方法的整体流程图。所述方法主要包括步骤S100-S200两个阶段,各个阶段执行如下:S100:对输入的待译源文E进行语义预处理,所述语义预处理包括分段识别和上下文识别,从而得到组成待译源文E的各个段落Gi以及Gi的上下文段落{Gi-1,Gi+1};S200:对于每一个段落Gi,执行对应的计算本文档来自技高网
...

【技术保护点】
1.一种基于逆向差异识别的人机共译方法,所述方法用于将待译源文通过机器翻译引擎翻译成目标译文后,基于逆向翻译识别出需要人工介入的差异部分,/n其特征在于,所述方法包括如下步骤:/nS100:对输入的待译源文E进行语义预处理,所述语义预处理包括分段识别和上下文识别,从而得到组成待译源文E的各个段落Gi以及Gi的上下文段落{Gi-1,Gi+1};/nS200:对于每一个段落Gi,执行如下计算机处理过程:/nG001:将段落Gi输入至第一机器翻译引擎,将段落Gi-1输入至第二机器翻译引擎,将段落Gi+1输入至第三机器翻译引擎,得出第一机器翻译结果Yi、第二机器翻译结果Yi-1以及第三机器翻译结果Yi+1;/nG002:将所述三个机器翻译结果组合成一个整体段落{Yi-1、Yi、Yi+1},作为第一机器翻译引擎的输入,将所述整体段落{Yi-1、Yi、Yi+1}进行逆向翻译,得到逆向翻译结果Ne;/nG003:识别出所述逆向翻译结果Ne与待译源文E的差异部分,将所述差异部分所在的句子作为输入,分别输入至所述第一至第三机器翻译引擎,并在人机交互界面上显示所述第一至第三机器翻译引擎对于所述差异部分的翻译结果;/n其中,所述逆向翻译是指将整体段落{Yi-1、Yi、Yi+1}翻译成待译源文E所属的语种。/n...

【技术特征摘要】
1.一种基于逆向差异识别的人机共译方法,所述方法用于将待译源文通过机器翻译引擎翻译成目标译文后,基于逆向翻译识别出需要人工介入的差异部分,
其特征在于,所述方法包括如下步骤:
S100:对输入的待译源文E进行语义预处理,所述语义预处理包括分段识别和上下文识别,从而得到组成待译源文E的各个段落Gi以及Gi的上下文段落{Gi-1,Gi+1};
S200:对于每一个段落Gi,执行如下计算机处理过程:
G001:将段落Gi输入至第一机器翻译引擎,将段落Gi-1输入至第二机器翻译引擎,将段落Gi+1输入至第三机器翻译引擎,得出第一机器翻译结果Yi、第二机器翻译结果Yi-1以及第三机器翻译结果Yi+1;
G002:将所述三个机器翻译结果组合成一个整体段落{Yi-1、Yi、Yi+1},作为第一机器翻译引擎的输入,将所述整体段落{Yi-1、Yi、Yi+1}进行逆向翻译,得到逆向翻译结果Ne;
G003:识别出所述逆向翻译结果Ne与待译源文E的差异部分,将所述差异部分所在的句子作为输入,分别输入至所述第一至第三机器翻译引擎,并在人机交互界面上显示所述第一至第三机器翻译引擎对于所述差异部分的翻译结果;
其中,所述逆向翻译是指将整体段落{Yi-1、Yi、Yi+1}翻译成待译源文E所属的语种。


2.如权利要求1所述的人机共译方法,其特征在于:所述第一机器翻译引擎为Lingoes。


3.如权利要求1所述的人机共译方法,其特征在于:所述第二机器翻译引擎为ICAT。


4.如权利要求1所述的人机共译方法,其特征在于:所述第一机器翻译引擎为TRADOS。


5.如权利要求1所述的人机共译方法,其特征在于...

【专利技术属性】
技术研发人员:何征宇
申请(专利权)人:语联网武汉信息技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1