一种提高多语言互译准确度的方法技术

技术编号:19634989 阅读:40 留言:0更新日期:2018-12-01 15:43
本发明专利技术公开了一种提高多语言互译准确度的方法,包括训练数据系统、多引擎翻译系统、评分系统和引擎调用规则;方法包括以下步骤:一:制定训练数据系统;该系统包括源语言模块、标准翻译模块和标准翻译导出模块;二:制定多引擎翻译系统;该系统由采集模块、存储模块、翻译模块、翻译结果导出模块组成;三:制定评分系统;该系统由翻译结果采集模块、标准翻译采集模块、评分模块和翻译结果导出模块组成;四:制定引擎调用规则;确定评分高的翻译引擎,从而制定引擎调用规则;本发明专利技术通过构建多引擎翻译系统,通过大量标准的双语翻译数据作为训练数据系统,通过评分系统,确定多引擎调用规则,从而提供多语言互译的准确度。

A Method to Improve the Accuracy of Multilingual Translation

The invention discloses a method for improving the accuracy of multi-language translation, including training data system, multi-engine translation system, scoring system and engine invocation rules. The method comprises the following steps: 1. developing training data system; the system includes source language module, standard translation module and standard translation export module; 2. The system is composed of acquisition module, storage module, translation module and translation result export module. The third part is the establishment of scoring system. The system consists of translation result acquisition module, standard translation acquisition module, scoring module and translation result export module. The fourth part is the establishment of engine call rules. The invention establishes a translation engine with high score, thereby formulating engine invocation rules; by constructing a multi-engine translation system, using a large number of standard bilingual translation data as training data system, and by scoring system, determines the multi-engine invocation rules, thereby providing the accuracy of multi-language translation.

【技术实现步骤摘要】
一种提高多语言互译准确度的方法
本专利技术涉及一种多语言互译的方法,尤其是涉及一种提高多语言互译准确度的方法,涉及语言翻译

技术介绍
双语是在一个国家或地区里用两种语言上课。这两种语言一种是学生的本族语/母语,另一种是学生所在地区的通用语言(第二语言)或学生所学习的目的语(外语)。双语教育是通过双语教学去实施的。我们发现翻译引擎因为数据量的质量和大小,导致它对不同语言的翻译效果是不一样的。在部分小语种的翻译上,某些翻译引擎的翻译质量比较好,有些则一般。
技术实现思路
本专利技术要解决的技术问题是克服现有多语言互译技术准确度不高的缺陷,提供一种提高多语言互译准确度的方法,从而解决上述问题。为实现上述目的,本专利技术提供如下技术方案:一种提高多语言互译准确度的方法,包括训练数据系统、多引擎翻译系统、评分系统和引擎调用规则;包括以下步骤:步骤一:制定训练数据系统;具体为,收集大量标准的双语数据导入训练数据系统,该系统包括源语言模块、标准翻译模块和标准翻译导出模块。步骤二:制定多引擎翻译系统;具体为,将多种翻译引擎导入该系统;多引擎翻译系统由采集模块、存储模块、翻译模块、翻译结果导出模块组成;其中存储模块汇集多种翻译引擎。步骤三:制定评分系统;具体为,评分系统由翻译结果采集模块、标准翻译采集模块、评分模块和翻译结果导出模块组成;其中翻译结果采集模块和步骤二中的翻译结果导出模块连接,标准翻译采集模块和步骤一中的标准翻译导出模块连接;采集到的多种翻译结果和标准翻译对比并评分,评分高的翻译结果通过翻译结果导出模块导出。步骤四:制定引擎调用规则;确定评分高的翻译结果对应的翻译引擎,从而制定引擎调用规则。作为本专利技术的一种优选技术方案,所述步骤一中的标准翻译导出模块为单通道导出。作为本专利技术的一种优选技术方案,所述步骤二中的翻译结果导出模块为多通道导出。作为本专利技术的一种优选技术方案,所述步骤三中的翻译结果采集模块为多通道采集,标准翻译采集模块为单通道采集。作为本专利技术的一种优选技术方案,所述步骤三中的评分模块为一个标注翻译模块对比多个翻译结果采集模块。与现有技术相比,本专利技术的有益效果是:本专利技术通过构建多引擎翻译系统,通过大量标准的双语翻译数据作为训练数据系统,然后通过评分系统,确定多引擎调用规则,从而提供多语言互译的准确度。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术系统结构图;图2为本专利技术方法原理图;具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1如图1-2所示,本专利技术提供一种提高多语言互译准确度的方法,包括训练数据系统、多引擎翻译系统、评分系统和引擎调用规则;包括以下步骤:步骤一:制定训练数据系统;具体为,收集大量标准的双语数据导入训练数据系统,该系统包括源语言模块、标准翻译模块和标准翻译导出模块。步骤二:制定多引擎翻译系统;具体为,将多种翻译引擎导入该系统;多引擎翻译系统由采集模块、存储模块、翻译模块、翻译结果导出模块组成;其中存储模块汇集多种翻译引擎。步骤三:制定评分系统;具体为,评分系统由翻译结果采集模块、标准翻译采集模块、评分模块和翻译结果导出模块组成;其中翻译结果采集模块和步骤二中的翻译结果导出模块连接,标准翻译采集模块和步骤一中的标准翻译导出模块连接;采集到的多种翻译结果和标准翻译对比并评分,评分高的翻译结果通过翻译结果导出模块导出。步骤四:制定引擎调用规则;确定评分高的翻译结果对应的翻译引擎,从而制定引擎调用规则。具体的,步骤一中的标准翻译导出模块为单通道导出,步骤二中的翻译结果导出模块为多通道导出,步骤三中的翻译结果采集模块为多通道采集,标准翻译采集模块为单通道采集,步骤三中的评分模块为一个标注翻译模块对比多个翻译结果采集模块。具体原理:本专利技术在工作时,步骤一:制定训练数据系统作为标准;步骤二:制定多引擎翻译系统;步骤三:制定评分系统,将训练数据系统中的标准翻译模块和多引擎翻译系统中的翻译结果导出模块中数据相比较并对比;步骤四:制定引擎调用规则;将较高得分的翻译引擎调出并制定引擎调用规则。本专利技术通过构建多引擎翻译系统,通过大量标准的双语翻译数据作为训练数据系统,然后通过评分系统,确定多引擎调用规则,从而提供多语言互译的准确度。最后应说明的是:以上所述仅为本专利技术的优选实施例而已,并不用于限制本专利技术,尽管参照前述实施例对本专利技术进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...

【技术保护点】
1.一种提高多语言互译准确度的方法,包括训练数据系统、多引擎翻译系统、评分系统和引擎调用规则;其特征在于,包括以下步骤:步骤一:制定训练数据系统;具体为,收集大量标准的双语数据导入训练数据系统,该系统包括源语言模块、标准翻译模块和标准翻译导出模块。步骤二:制定多引擎翻译系统;具体为,将多种翻译引擎导入该系统;多引擎翻译系统由采集模块、存储模块、翻译模块、翻译结果导出模块组成;其中存储模块汇集多种翻译引擎。步骤三:制定评分系统;具体为,评分系统由翻译结果采集模块、标准翻译采集模块、评分模块和翻译结果导出模块组成;其中翻译结果采集模块和步骤二中的翻译结果导出模块连接,标准翻译采集模块和步骤一中的标准翻译导出模块连接;采集到的多种翻译结果和标准翻译对比并评分,评分高的翻译结果通过翻译结果导出模块导出。步骤四:制定引擎调用规则;确定评分高的翻译结果对应的翻译引擎,从而制定引擎调用规则。

【技术特征摘要】
1.一种提高多语言互译准确度的方法,包括训练数据系统、多引擎翻译系统、评分系统和引擎调用规则;其特征在于,包括以下步骤:步骤一:制定训练数据系统;具体为,收集大量标准的双语数据导入训练数据系统,该系统包括源语言模块、标准翻译模块和标准翻译导出模块。步骤二:制定多引擎翻译系统;具体为,将多种翻译引擎导入该系统;多引擎翻译系统由采集模块、存储模块、翻译模块、翻译结果导出模块组成;其中存储模块汇集多种翻译引擎。步骤三:制定评分系统;具体为,评分系统由翻译结果采集模块、标准翻译采集模块、评分模块和翻译结果导出模块组成;其中翻译结果采集模块和步骤二中的翻译结果导出模块连接,标准翻译采集模块和步骤一中的标准翻译导出模块连接;采集到的多种翻译结果和标...

【专利技术属性】
技术研发人员:张岩林彦熊涛
申请(专利权)人:深圳市合言信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1