【技术实现步骤摘要】
一种面向细分领域的国防军工领域机器翻译方法及系统
本专利技术涉及机器翻译
,特别是涉及一种面向细分领域的国防军工领域机器翻译方法及系统。
技术介绍
机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。神经机器翻译(NeuralMachineTranslation,NMT)是当前常用的一种机器翻译方法,这种方法基于深度学习,通过带有注意力机制(attention-based)的编码器解码器(encoder-decoder)模型,将待翻译的语句(源语句)经过编码器(encoder)编码成为一个向量,然后通过解码器(decoder)对源语句的向量进行解码,形成对应的译文(目标语句)。由于国防军工领域存在着大量的细分领域翻译需求,采用目前通用的机器翻译模型难以针对国防军工领域的细分领域进行定向优化,难以达到预期的翻译效果,因此急需训练面向不同细分领域的机器翻译模型,提高对应细分领域的翻译质量。
技术实现思路
本专利技术的目的是提供一种面向细分领域的国防军工领域机器翻译方法及系 ...
【技术保护点】
1.一种面向细分领域的国防军工领域机器翻译方法,其特征在于,所述方法包括:/n获取语料库中的平行语料句对;所述平行语料句对包括原文和对应译文;/n获取训练好的SVM文本分类模型;/n采用所述训练好的SVM文本分类模型将所述平行语料句对分类到国防军工领域知识体系的各个细分领域中;/n采用各个所述细分领域的平行语料句对分别训练通用机器翻译模型,生成对应的细分领域机器翻译模型;/n获取待翻译文本;/n采用所述SVM文本分类模型确定所述待翻译文本的细分领域;/n调用与所述待翻译文本的细分领域对应的细分领域机器翻译模型对所述待翻译文本进行翻译,生成细分领域翻译结果。/n
【技术特征摘要】
1.一种面向细分领域的国防军工领域机器翻译方法,其特征在于,所述方法包括:
获取语料库中的平行语料句对;所述平行语料句对包括原文和对应译文;
获取训练好的SVM文本分类模型;
采用所述训练好的SVM文本分类模型将所述平行语料句对分类到国防军工领域知识体系的各个细分领域中;
采用各个所述细分领域的平行语料句对分别训练通用机器翻译模型,生成对应的细分领域机器翻译模型;
获取待翻译文本;
采用所述SVM文本分类模型确定所述待翻译文本的细分领域;
调用与所述待翻译文本的细分领域对应的细分领域机器翻译模型对所述待翻译文本进行翻译,生成细分领域翻译结果。
2.根据权利要求1所述的国防军工领域机器翻译方法,其特征在于,在所述获取语料库中的平行语料句对之前,还包括:
获取已有的国防科技领域翻译成果;所述翻译成果为已经翻译成功的文本的原文和译文;
采用句对齐工具将篇章级的所述翻译成果划分为句子级翻译成果,并按照原文和译文对所述句子级翻译成果进行句对齐操作,生成多条平行语料句对存储在所述语料库中。
3.根据权利要求2所述的国防军工领域机器翻译方法,其特征在于,在所述获取训练好的SVM文本分类模型之前,还包括:
选取所述语料库中已经标注细分领域的多条所述平行语料句对作为训练集;
采用支持向量机SVM方法对所述训练集中的每条平行语料句对和对应的细分领域进行训练,生成训练好的SVM文本分类模型。
4.根据权利要求3所述的国防军工领域机器翻译方法,其特征在于,在所述生成细分领域翻译结果之后,还包括:
获取所述细分领域翻译结果的人工校对结果;
采用句对齐工具将所述人工校对结果划分为多条平行语料句对并存储在所述语料库中。
5.根据权利要求4所述的国防军工领域机器翻译方法,其特征在于,在所述采用所述SVM文本分类模型确定所述待翻译文本的细分领域之后,还包括:
判断用户是否对所述待翻译文本的细分领域进行手动调整,获得第一判断结果;
若所述第一判断结果为用户未对所述待翻译文本的细分领域进行手动调整,则将所述待翻译文本及其对应的细分领域存储至所述语料库中;
若所述第一判断结果为用户对所述待翻译文本的细分领域进行了手动调整,则判断细分领域标注人员是否认可所述SVM文本分类模型确定的所述待翻译文本的细分领域,获得第二判断结果;
若所述第二判断结果为所述细分领域标注人员认可所述SVM文本分类模型确定的所述待翻译文本的细分领域,则将所述待翻译文本及其对应的细分领域存储至所述语料库中;
若所述第二判断结果为所述细分领域标注人员不认可所述SVM文本分类模型确定的所述待翻译文本的细分领域,则不对所述待翻译文本及其对应的细分领域进行存储。
6.一种面向细分领域的国防军工领域机器翻译系统,其特征在于,所述系统包括:
平行语料句对获取模块,用于获取语料库中的平行语料句对;所述...
【专利技术属性】
技术研发人员:雷贺功,李斌,姚晗,晏裕生,程洁丹,孙孟阳,董文轩,江洋,
申请(专利权)人:中国船舶工业综合技术经济研究院,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。