基于专属机翻引擎训练的人机共译系统与方法技术方案

技术编号：25690931 阅读：59 留言：0更新日期：2020-09-18 21:02

本发明专利技术提出一种基于专属机翻引擎训练的人机共译系统、基于反馈训练环信号的人机共译方法以及实现该方法的计算机可读存储介质。本发明专利技术的技术方案包括源文输入组件以及与所述源文输入组件连接的语义识别模块、专属机翻引擎训练环、人机共译窗口、差异比对界面以及反向比对翻译引擎。本发明专利技术的技术方案能够最大程度的利用机器翻译的结果，同时最大可能的针对可能错误的翻译结果进行人工校对，在保证效率的同时，提高了准确度，从而提供人工翻译介入的准确时机，使得针对大规模语料翻译以及准确度要求较高的翻译场合既能保证翻译效率，同时确保翻译的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于专属机翻引擎训练的人机共译系统与方法
本专利技术属于翻译
，尤其涉及一种基于专属机翻引擎训练的人机共译系统、基于反馈训练环信号的人机共译方法以及实现该方法的计算机可读存储介质。
技术介绍
实现高质量机器翻译的梦想已经存在了很多年，很多科学家都为这一梦想贡献了自己的时间和心力。从早期的基于规则的机器翻译到如今广泛应用的神经机器翻译，机器翻译的水平不断提升，已经能满足很多场景的基本应用需求。目前最重要的两种机器翻译方式：规则法和统计法。规则法(rulebasedmachinetranslation,RBMT)，依据语言规则对文本进行分析，再借助计算机程序进行翻译。多数商用机器翻译系统采用规则法。统计法(statisticalmachinetranslation,SMT)，通过对大量的平行语料进行统计分析，构建统计翻译模型(词汇、比对或是语言模式)，进而使用此模型进行翻译，一般会选取统计中出现概率最高的词条作为翻译，概率算法依据贝叶斯定理。假设要把一个英语句子A翻译成汉语，所有汉语句子B，都是A的可能或是非可能的潜在翻译。Pr(A)是类似A表达出现的概率，Pr(B|A)是A翻译成B出现的概率。找到两个参数的最大值，就能缩小句子及其对应翻译检索的范围，从而找出最合适的翻译。SMT根据文本分析程度级别的不同分为两种：基于词的SMT和基于短语的SMT，后一个是目前普遍使用的，Google用的就是这种。翻译文本被自动分为固定长度的词语序列，再对各词语序列在语料库里进行统计分析，以查找到出现对应概率最高的翻译。申请...

【技术保护点】
1.一种基于专属机翻引擎训练的人机共译系统，所述人机共译系统包括源文输入组件以及与所述源文输入组件连接的语义识别模块，/n其特征在于：/n所述人机共译系统还包括专属机翻引擎训练环，所述专属机翻引擎训练环接收来自人机共译窗口的反馈训练环信号；/n所述人机共译窗口分别连接差异比对界面与所述专属机翻引擎训练环，所述专属机翻引擎训练环输出对应于所述源译文的至少一个翻译结果并显示在所述人机共译窗口；/n所述差异比对界面通过反向比对翻译引擎连接至所述专属机翻引擎训练环，并接收所述语义识别模块的输出结果后，将反向比对翻译引擎的输出结果与所述语义识别模块的输出结果进行差异比对，并将差异比对结果显示在所述人机共译窗口；/n其中，所述专属机翻引擎训练环包括多个机器翻译引擎与差异训练核心组件，所述差异训练核心组件选择所述多个机器翻译引擎的其中之一作为所述反向比对翻译引擎，并接收所述反馈训练环信号。/n

【技术特征摘要】
1.一种基于专属机翻引擎训练的人机共译系统，所述人机共译系统包括源文输入组件以及与所述源文输入组件连接的语义识别模块，
其特征在于：
所述人机共译系统还包括专属机翻引擎训练环，所述专属机翻引擎训练环接收来自人机共译窗口的反馈训练环信号；
所述人机共译窗口分别连接差异比对界面与所述专属机翻引擎训练环，所述专属机翻引擎训练环输出对应于所述源译文的至少一个翻译结果并显示在所述人机共译窗口；
所述差异比对界面通过反向比对翻译引擎连接至所述专属机翻引擎训练环，并接收所述语义识别模块的输出结果后，将反向比对翻译引擎的输出结果与所述语义识别模块的输出结果进行差异比对，并将差异比对结果显示在所述人机共译窗口；
其中，所述专属机翻引擎训练环包括多个机器翻译引擎与差异训练核心组件，所述差异训练核心组件选择所述多个机器翻译引擎的其中之一作为所述反向比对翻译引擎，并接收所述反馈训练环信号。

2.如权利要求1所述的人机共译系统，其特征在于：所述专属机翻引擎训练环包括第一机翻引擎、第二机翻引擎与第三机翻引擎，所述专属机翻引擎接收经过所述语义识别模块分析处理的源文后，通过所述第一机翻引擎、第二机翻引擎与第三机翻引擎分别输出第一目标文、第二目标文以及第三目标文；所述差异训练核心组件计算所述第一目标文、第二目标文以及第三目标文两两之间的差异度与相似度。

3.如权利要求2所述的人机共译系统，其特征在于：所述专属机翻引擎训练环基于所述差异度与相似度，输出对应于所述源文的翻译结果至所述人机共译窗口。

4.如权利要求2所述的人机共译系统，其特征在于：所述差异训练核心组件基于所述差异度与相似度选择所述多个机器翻译引擎的其中之一作为所述反向比对翻译引擎。

5.如权利要求1所述的人机共译系统，其特征在于：基于所述人机共译窗口的编辑操作，自动生成所述反馈训练环信号。

6.如权利要求1所述的人机共译系统，其特征在于：所述语义识别模块接收所述源文输入组件输入的待译源文后，对其进行语义识别，将其拆分为以段落为单位的待译段落子集和/或以句子为单位的待译句子子集。

7.如权利要求3或4所述的人机共译系统，其特征在于：所述差异训练核心组件计算所述第一目标文、第二目标文以及第三目标文两两之间的差异度与相似度，得到相似度矩阵与...

【专利技术属性】
技术研发人员：王莲，
申请(专利权)人：语联网武汉信息技术有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人