基于逆向翻译结果比对的人机交互翻译系统与方法技术方案

技术编号:25690929 阅读:33 留言:0更新日期:2020-09-18 21:02
本发明专利技术提出一种基于逆向翻译结果比对的人机交互翻译系统、利用该系统实现的基于集成化评测引擎进行翻译比对的人机共译方法以及实现该方法的计算机可读存储介质。所述人机交互翻译系统包括源译文输入接口、与所述源译文输入接口分别进行数据通信的三个机器翻译引擎、接收翻译结果并对其评测的评测引擎、逆向翻译引擎以及逆向比对模块;所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;通过在在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分;并排显示所述三个机器翻译引擎对于所述差异部分的翻译结果,从而利用实现人机共译。

【技术实现步骤摘要】
基于逆向翻译结果比对的人机交互翻译系统与方法
本专利技术属于翻译
,尤其涉及一种基于逆向翻译结果比对的人机交互翻译系统、利用该系统实现的基于集成化评测引擎进行翻译比对的人机共译方法以及实现该方法的计算机可读存储介质。
技术介绍
机器翻译其实是利用计算机把一种自然语言翻译成另一种自然语言的过程,基本流程大概分为三块:预处理、核心翻译、后处理。预处理是对语言文字进行规整,把过长的句子通过标点符号分成几个短句子,过滤一些语气词和与意思无关的文字,将一些数字和表达不规范的地方,归整成符合规范的句子。核心翻译模块是将输入的字符单元、序列翻译成目标语言序列的过程,这是机器翻译中最关键最核心的地方。后处理模块是将翻译结果进行大小写的转化、建模单元进行拼接,特殊符号进行处理,使得翻译结果更加符合人们的阅读习惯。在大规模的翻译工程时代,机器翻译工具的使用不可避免。然而,机器翻译的局限性导致其不可能完全替代人工翻译。尽管如此,如果选择了正确的翻译工具,翻译效率将大大提高,这是不可否认的。现有技术已经存在各种不同语言之间的翻译工具与机器翻译引擎,包括各种伴随人工智能、大数据、深度学习技术发展起来的优化的机器翻译方案。申请号为CN201810063565.2的中国专利技术专利申请提出一种基于深度学习的专业领域机器同步翻译装置及方法,推动同声传译从译员同传(HumanSI)向机辅同传(Computer-aidedSI),再向最终的机器口译(MachineSI)发展。基于深度学习来一方面解决译员在同声传译现场出现的听不懂、记不住、译不出的困难,提高术语和固有表达的双语转换正确率,另一方面译员可以根据机器翻译在线即时进行译后编辑,提高译语的信息量,而且在一些场景能够替代译员实现延时一秒以内的准实时的同声传译功能。申请号为CN201710203439.8的中国专利技术专利申请提出一种多语言智能预处理实时统计机器翻译系统,能够把一种语言的句子,篇章实时翻译成另一种语言,该系统能够翻译句子完整,表达正确,带有标点符号的文本语言,也能翻译没有段落分割,句子可能不完整,没有标点符号,句子里有噪音的语音;提高了对小概率词语、短语的翻译准确度,即将数字、日期、时间、URL等小概率词语分别标注并优先翻译;本专利技术的预处理模块能够对输入的句子进行规范化处理;本专利技术的后处理模块能够提高翻译结果的流畅度。虽然机器翻译对翻译行业带来的冲击是致命的,承担不要求准确度的简单翻译任务的普通翻译人员将被机器彻底取代。但是,对于专业领域的翻译工作,目前看来,机器还不能胜任。但不能翻译的原因并不是其内容上有多么艰涩。事实上,专业领域翻译的难度其实不高,每个领域除了业内惯用的专有词汇以外,句法上往往还是严谨规范的写法居多,但专业翻译要求极高的准确性,机器无法承担出现错误所导致的严重后果。很多时候,一些过于专门的文件的翻译工作往往是由其领域的专业人士亲自上阵翻译的,这也解释了为什么一些概念的翻译极端拗口,符合逻辑而缺乏美感。然而,在大规模翻译工程时代,仅仅依靠人工翻译显然不能满足效率需要,而一味的依靠机器翻译则无法满足准确度需要。不管机器翻译或者计算机辅助翻译的方案如何改进,人工编辑校对甚至翻译都不可缺少。此外,翻译人员通常根据经验、使用习惯结合翻译工具的特点来选择一种翻译工具,一旦选定,则基本不变。然而,实践发现,不同的翻译工具的内核不同,对于同一种待译文本通常给出不同的结果;此外,对于相同的一份待译资料,其中不同的子部分,同一翻译工具的结果准确度也不一样。现有翻译人员对此通常十分困惑,并在多种翻译工具中来回徘徊,疲于选择翻译工具以及校对翻译结果。此类种种,原本用于提高翻译效率的翻译工具反而成了拖慢翻译节奏的累赘。可见,如何平衡人工编辑翻译和机器翻译的工作时间、人工翻译何时接介入、以何种方式介入并且在保证准确度的同时能够满足大规模语义翻译的需要,现有技术并未给出有效的解决方案。
技术实现思路
为解决上述技术问题,本专利技术提出一种基于逆向翻译结果比对的人机交互翻译系统、利用该系统实现的基于集成化评测引擎进行翻译比对的人机共译方法以及实现该方法的计算机可读存储介质。所述人机交互翻译系统包括源译文输入接口、与所述源译文输入接口分别进行数据通信的三个机器翻译引擎、接收翻译结果并对其评测的评测引擎、逆向翻译引擎以及逆向比对模块;所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;通过在在人机交互界面上高亮显示所述源译文与所述逆向翻译结果的差异部分;并且并排显示所述三个机器翻译引擎对于所述差异部分的翻译结果,从而利用在所述人机交互界面上提供编辑工具对所述差异部分的翻译结果进行编辑。本专利技术的技术方案能够最大程度的利用机器翻译的结果,同时最大可能的针对可能错误的翻译结果进行人工校对,在保证效率的同时,提高了准确度。具体来说,在本专利技术的第一个方面,提供一种基于逆向翻译结果比对的人机交互翻译系统,所述人机交互翻译系统包括源译文输入接口。作为关键的改进,在本专利技术的技术方案中,存在至少三个机器翻译引擎与具备可拆卸的通信接口的集成化评测引擎;所述至少三个机器翻译引擎与所述源译文输入接口分别进行数据通信;所述三个机器翻译引擎分别输出第一目译文、第二目译文以及第三目译文;作为本专利技术的重要创造性之一,所述三个机器翻译引擎为ICAT、TRADOS、LINGOES;评测引擎接收所述第一目译文、第二目译文以及第三目译文并对其进行结果评测,输出所述第一目译文、第二目译文以及第三目译文的评测得分;作为体现本专利技术创造性的关键技术手段之一,在本专利技术中,基于所述评测得分,选择所述第一目译文、第二目译文、第三目译文其中之一,作为逆向翻译引擎的输入;具体而言,本专利技术是将最高评测得分对应的目译文,作为逆向翻译引擎的输入,这样能够最大程度的利用翻译结果最准确的机器引擎;所述逆向翻译引擎对输入的目译文进行逆向翻译,将逆向翻译结果作为逆向比对模块的输入;所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;其中,所述逆向翻译引擎为基于所述评测得分选择的所述三个机器翻译引擎之一,所述逆向翻译结果是将所述选择的目译文翻译成所述源译文对应的语种;作为体现本专利技术创造性的关键技术手段之一,在本专利技术中,所述逆向翻译引擎为基于所述评测得分选择的所述三个机器翻译引擎之一,具体包括:将评测得分最低的目译文对应的机器翻译引擎,作为所述逆向翻译引擎。这样,可以最大可能的识别并且避免机器翻译的错误部分,便于后期人工编辑介入。作为实现本专利技术技术效果的另一个关键技术手段,所述评测引擎包括基于句子级别的评测引擎和基于词语级别的评测引擎;所述评测引擎对外提供集成化的通信接口,通过所述通信接口与翻译引擎通信,并对所述翻译引擎的翻译结果进行评测。在所述基于句子级别的评测引擎上,包本文档来自技高网
...

【技术保护点】
1.一种基于逆向翻译结果比对的人机交互翻译系统,所述人机交互翻译系统包括源译文输入接口,其特征在于:/n至少三个机器翻译引擎与所述源译文输入接口分别进行数据通信;所述三个机器翻译引擎分别输出第一目译文、第二目译文以及第三目译文;/n评测引擎接收所述第一目译文、第二目译文以及第三目译文并对其进行结果评测,输出所述第一目译文、第二目译文以及第三目译文的评测得分;基于所述评测得分,选择所述第一目译文、第二目译文、第三目译文其中之一,作为逆向翻译引擎的输入;/n所述逆向翻译引擎对输入的目译文进行逆向翻译,将逆向翻译结果作为逆向比对模块的输入;/n所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;/n其中,所述逆向翻译引擎为基于所述评测得分选择的所述三个机器翻译引擎之一,所述逆向翻译结果是将所述选择的目译文翻译成所述源译文对应的语种;/n所述评测引擎包括基于句子级别的评测引擎和基于词语级别的评测引擎;/n在所述基于句子级别的评测引擎上,包括至少一个预测器,所述预测器采用双向LSTM进行建模,并且输出所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的相似度;/n在所述基于词语级别的评测引擎上,包括至少一个评估器,所述评估器用于评估所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的差异度。/n...

【技术特征摘要】
1.一种基于逆向翻译结果比对的人机交互翻译系统,所述人机交互翻译系统包括源译文输入接口,其特征在于:
至少三个机器翻译引擎与所述源译文输入接口分别进行数据通信;所述三个机器翻译引擎分别输出第一目译文、第二目译文以及第三目译文;
评测引擎接收所述第一目译文、第二目译文以及第三目译文并对其进行结果评测,输出所述第一目译文、第二目译文以及第三目译文的评测得分;基于所述评测得分,选择所述第一目译文、第二目译文、第三目译文其中之一,作为逆向翻译引擎的输入;
所述逆向翻译引擎对输入的目译文进行逆向翻译,将逆向翻译结果作为逆向比对模块的输入;
所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出;
其中,所述逆向翻译引擎为基于所述评测得分选择的所述三个机器翻译引擎之一,所述逆向翻译结果是将所述选择的目译文翻译成所述源译文对应的语种;
所述评测引擎包括基于句子级别的评测引擎和基于词语级别的评测引擎;
在所述基于句子级别的评测引擎上,包括至少一个预测器,所述预测器采用双向LSTM进行建模,并且输出所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的相似度;
在所述基于词语级别的评测引擎上,包括至少一个评估器,所述评估器用于评估所述基于句子级别的评测引擎和所述基于词语级别的评估引擎各自输出结果的差异度。


2.如权利要求1所述的人机交互翻译系统,其特征在于:所述至少三个机器翻译引擎包括ICAT、TRADOS、LINGOES。


3.如权利要求1所述的人机交互翻译系统,其特征在于:基于所述评测得分,选择所述第一目译文、第二目译文、第三目译文其中之一,作为逆向翻译引擎的输入,具体包括:
将最高评测得分对应的目译文,作为逆向翻译引擎的输入。


4.如权利要求1或3所述的人机交互翻译系统,其特征在于:所述逆向翻译引擎为基于所述评测得分选择的所述三个机器翻译引擎之一,具体包括:将评测得分最低的目译文对应的机器翻译引擎,作为所述逆向翻译引擎。


5.如权利要求2所述的人机交互翻译系统,其特征在于:所述逆向比对模块获取源译文输入接口储存的源译文,并将源译文与所述逆向翻译结果进行差异性以及相似度比对,并将比对结果输出,具体包括:
在人机交互界面上高亮显示所述源译文与...

【专利技术属性】
技术研发人员:郑丽华
申请(专利权)人:语联网武汉信息技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1