基于Transformer模型的定制机务智能翻译系统技术方案

技术编号:37266029 阅读:23 留言:0更新日期:2023-04-20 23:37
本发明专利技术公开了一种基于Transformer模型的定制机务智能翻译系统,属于机务机器翻译系统技术领域,包括输入模块、翻译主体以及输出模块,翻译主体还连接有机务定制翻译词汇库,机务定制翻译词汇库包括词汇输入模块、机务相关度评估模块以及排序模块。本发明专利技术能够从网页环境中筛选出机务资料中词义与日常词义相关度较差的词汇,构建机务翻译词汇库,结合自注意力网络对机务资料中词义与日常词义相关度较差的词汇进行定制化的翻译,提高机务翻译的准确度和专业性,解决现有机务翻译中关于机务专业用词翻译准确度差导致机务人员对机务相关技术资料理解不充分的不足。技术资料理解不充分的不足。技术资料理解不充分的不足。

【技术实现步骤摘要】
基于Transformer模型的定制机务智能翻译系统


[0001]本专利技术涉及一种翻译系统,特别是涉及一种基于Transformer模型的定制机务智能翻译系统,属于机务机器翻译系统


技术介绍

[0002]机务工作是一种从事飞机维护和修理事务的行业,在进行飞机维护和修理的时候,很多的设备资料、航空手册、维护保养手册或者维修说明书都是外文,需要机务翻译对这些资料进行高质量且高效的翻译,机务翻译中常用的方法是机器翻译,机器翻译利用计算机将一种自然语言转换成另一种自然语言,具有重要的使用价值,是架起机务工作者语言沟通桥梁的重要依托,机器翻译从早期的词典匹配,到词典结合语言学专家知识的规则进行翻译,再到基于语料库的统计机器翻译,近些年神经网络技术在机器翻译长夜的跨越式发展更是大幅提高了机器翻译的质量和效率,神经网络翻译器的依赖结构是编码器

解码器结构,编码器实现对输入语言的“理解”,形成特定维度的浮点数量,之后解码器根据此向量逐字生成目标语言的翻译结果,神经网络翻译器初期使用循环神经网络(RNN,Recurrent Neu本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于Transformer模型的定制机务智能翻译系统,包括输入模块、与所述输入模块相连的翻译主体以及所述翻译主体相连的输出模块,其特征在于,所述翻译主体还连接有机务定制翻译词汇库,所述机务定制翻译词汇库包括词汇输入模块,所述词汇输入模块连接有机务相关度评估模块,所述机务相关度评估模块连接有排序模块,所述机务相关度评估模块先判断输入词汇在机务资料中出现的频度排名是否在总排名数的前四分之三,若输入词汇出现频度在总排名数的前四分之三,输入词汇与机务的相关度与该词汇出现频度排名与总排名的比值正相关,与输入词汇翻译释义中出现在机务资料中总次数最多的释义出现的次数和所有释义出现在机务资料中总次数的比值正相关,还和输入词汇的释义差别度正相关,若输入词汇在机务资料中出现的频度排名不在总排名数的前四分之三,输入词汇与机务工作的相关度为0,输入词汇与机务的相关度公式为:当时,输入词汇与机务工作的相关度公式为:D
R
=γ*(α1*I
PD
+α2I
PM
);式中:N
A
记为机务资料中总词数,N
C
记为机务资料中出现词汇的次数,记为对进行排名后的排名数,D
R
记为输入词汇与机务工作的相关度,I
PD
记为输入词汇的频度指标,α1记为输入词汇频度指标的权重,将α1的值设为0.6,I
PM
记为输入词汇的排名指标,α2记为输入词汇排名指标的权重,将α2的值设为0.4,专家根据输入词汇的差异度对输入词汇进行打分,将输入词汇的词义差异度打分记为γ,其中γ的取值范围为[0,1],当输入词汇每个释义的差别度越大,γ的取值越大;其中,频度指标的公式为:式中:u记为输入词汇每个释义出现在机务资料中频度数量的集合,p
i
记为输入词汇第i个释义出现在机务资料中的频度数目,max
u
p
...

【专利技术属性】
技术研发人员:张钊马涛庄福振徐勇军
申请(专利权)人:中科厦门数据智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1