一种邮件翻译方法、存储介质及设备技术

技术编号:38003547 阅读:10 留言:0更新日期:2023-06-30 10:17
本发明专利技术实施例公开了一种邮件翻译方法、存储介质及设备,包括:在得到基础翻译模型后,将目标企业信息输入基础翻译模型训练得到目标翻译模型,并配置预设固定格式;在接收到第一次邮件原文时,将第一次邮件原文输入目标翻译模型得到第一翻译结果;在第一次邮件原文中查找到与预设固定格式中一样的内容时,对第一翻译结果进行修正得到第二翻译结果;在接收到第k次邮件原文时,将第k

【技术实现步骤摘要】
一种邮件翻译方法、存储介质及设备


[0001]本专利技术涉及翻译
,尤其涉及一种邮件翻译方法、存储介质及设备。

技术介绍

[0002]全球化时代,国际贸易成为不少企业的发展新趋势。邮件作为方便快捷的沟通方式,使得邮件的翻译也成为非常重要的辅助功能,能够帮助用户快捷地了解对方的表达意思,降低贸易成本和语言障碍。
[0003]目前,商务往来的邮件翻译主要是基于综合场景(例如:生活、通知、问候等)进行在线翻译,其翻译效果大致雷同,但基于综合场景进行在线翻译有时并不能让用户高效的了解对方表达的意思,即不能针对商务场景的特性专用词进行翻译,也不能兼顾邮件往来的上下文来进行翻译,使得翻译的邮件缺少兼顾性和协调性。

技术实现思路

[0004]基于此,有必要针对上述问题,提出了一种邮件翻译方法、存储介质及设备,使得可以针对商务场景的特性专用词进行翻译,兼顾了邮件往来的上下文来进行翻译,以让用户高效的了解邮件对方表达的意思。
[0005]为实现上述目的,本专利技术在第一方面提供一种邮件翻译方法,所述方法包括:
[0006]对第一平行语料库和第二平行语料库进行处理得到基础翻译模型;
[0007]将目标企业信息的原文和译文输入至所述基础翻译模型中进行训练得到目标翻译模型,并配置预设固定格式;
[0008]在接收到第一次邮件原文的情况下,将所述第一次邮件原文输入至所述目标翻译模型中得到第一翻译结果;
[0009]若在所述第一次邮件原文中查找到与所述预设固定格式中一样的内容,则根据所述预设固定格式的内容、所述第一次邮件原文和所述第一翻译结果,对所述第一翻译结果进行修正得到第二翻译结果;
[0010]在接收到第k次邮件原文的情况下,将第k

1次邮件原文和所述第k次邮件原文输入至所述目标翻译模型中得到第k+1翻译结果;
[0011]若在所述第k次邮件原文和所述第k

1次邮件原文中查找到与所述预设固定格式中一样的内容,则根据所述预设固定格式的内容、所述第k次邮件原文、所述第k

1次邮件原文和所述第k+1翻译结果,对所述第k+1翻译结果进行修正得到第k+2翻译结果;
[0012]其中,k依次取大于1的整数,直至没有接收到邮件原文。
[0013]可选地,所述对第一平行语料库和第二平行语料库进行处理得到基础翻译模型,包括:
[0014]获取所述第一平行语料库和所述第二平行语料库;
[0015]按预设比例将所述第一平行语料库分为第一训练集和第一验证集,以及将所述第二平行语料库分为第二训练集和第二验证集;
[0016]将所述第一训练集输入至深度学习模型中进行训练得到第一翻译模型,并将所述第一验证集输入至所述第一翻译模型中得到第一测试翻译结果;
[0017]基于BLEU评估,将所述第一测试翻译结果和所述第一验证集对应的原始翻译语料进行对比,得到第一模型评估分;
[0018]若所述第一模型评估分满足第一预设范围,则将所述第二训练集输入至所述第一翻译模型中进行训练得到第二翻译模型,并将所述第二验证集输入至所述第二翻译模型中得到第二测试翻译结果;
[0019]基于所述BLEU评估和ROUGE评估,将所述第二测试翻译结果和所述第二验证集对应的原始翻译语料进行对比,得到第二模型评估分;
[0020]若所述第二模型评估分满足第二预设范围,则将所述第二翻译模型作为基础翻译模型。
[0021]可选地,所述获取第一平行语料库和第二平行语料库,包括:
[0022]收集不同来源的原始语料和所述不同来源的原始语料的原始翻译语料得到所述第一平行语料库;
[0023]收集商业邮件的原始语料和所述商业邮件的原始语料的原始翻译语料得到所述第二平行语料库。
[0024]可选地,所述BLEU评估采用二阶文字组合的方式,所述ROUGE评估采用一阶文字组合的方式。
[0025]可选地,所述将所述第一测试翻译结果和所述第一验证集对应的原始翻译语料进行对比,得到第一模型评估分,包括:
[0026]利用公式得到所述第一模型评估分QA;
[0027]其中,M为所述第一验证集对应的原始翻译语料的总份数,i为所述第一验证集对应的第i份原始翻译语料,N为所述第一验证集对应的第i份原始翻译语料的语句的总句数,j为所述第一验证集对应的第i份原始翻译语料的第j句语句,bleu_A(j)为所述第一测试翻译结果的测试翻译语料的第j句语句与所述第一验证集对应的原始翻译语料的第j句语句的二阶对比值。
[0028]可选地,所述将所述第二测试翻译结果和所述第二验证集对应的原始翻译语料进行对比,得到第二模型评估分,包括:
[0029]利用公式得到所述第二模型评估分QB;
[0030]其中,J为所述第二验证集对应的原始翻译语料的总份数,x为所述第二验证集对应的第x份原始翻译语料,K为所述第二验证集对应的第x份原始翻译语料的语句的总句数,y为所述第二验证集对应的第x份原始翻译语料的第y句语句,bleu_B(y)为所述第二测试翻译结果的测试翻译语料的第y句语句与所述第二验证集对应的原始翻译语料的第y句语句
的二阶对比值,rouge(y)为所述第二测试翻译结果的测试翻译语料的第y句语句与所述第二验证集对应的原始翻译语料的第y句语句的一阶对比值。
[0031]可选地,所述方法还包括:
[0032]若所述第二模型评估分满足所述第二预设范围,则将所述第二测试翻译结果和所述第二验证集对应的原本翻译语料各抽取预设份数进行人工验证;
[0033]在所述人工验证通过的情况下,再将所述第二模型作为所述基础翻译模型。
[0034]可选地,所述方法还包括:
[0035]采用用户输入的对应的修正信息对对应的翻译结果进行修正得到修正后的翻译结果,将修正后的翻译结果、所述第k

1次邮件原文和第k

2次邮件原文输入至所述目标翻译模型中进行训练得到第k

1优化翻译模型,并将所述第k

1优化翻译模型更新为所述目标翻译模型。
[0036]为实现上述目的,本专利技术在第二方面提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如第一方面中任一项所述方法的步骤。
[0037]为实现上述目的,本专利技术在第一方面提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如第一方面中任一项所述方法的步骤。
[0038]采用本专利技术实施例,具有如下有益效果:在上述方法通过在对第一平行语料库和第二平行语料库进行处理得到基础翻译模型后,将目标企业信息(收发邮件双方的企业信息)的原文和译文输入至基础翻译模型中进行训练得到目标翻译模型,并配置预设固定格式(商务场景的特性专用词),在接收到第一次邮件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种邮件翻译方法,其特征在于,所述方法包括:对第一平行语料库和第二平行语料库进行处理得到基础翻译模型;将目标企业信息的原文和译文输入至所述基础翻译模型中进行训练得到目标翻译模型,并配置预设固定格式;在接收到第一次邮件原文的情况下,将所述第一次邮件原文输入至所述目标翻译模型中得到第一翻译结果;若在所述第一次邮件原文中查找到与所述预设固定格式中一样的内容,则根据所述预设固定格式的内容、所述第一次邮件原文和所述第一翻译结果,对所述第一翻译结果进行修正得到第二翻译结果;在接收到第k次邮件原文的情况下,将第k

1次邮件原文和所述第k次邮件原文输入至所述目标翻译模型中得到第k+1翻译结果;若在所述第k次邮件原文和所述第k

1次邮件原文中查找到与所述预设固定格式中一样的内容,则根据所述预设固定格式的内容、所述第k次邮件原文、所述第k

1次邮件原文和所述第k+1翻译结果,对所述第k+1翻译结果进行修正得到第k+2翻译结果;其中,k依次取大于1的整数,直至没有接收到邮件原文。2.根据权利要求1所述的方法,其特征在于,所述对第一平行语料库和第二平行语料库进行处理得到基础翻译模型,包括:获取所述第一平行语料库和所述第二平行语料库;按预设比例将所述第一平行语料库分为第一训练集和第一验证集,以及将所述第二平行语料库分为第二训练集和第二验证集;将所述第一训练集输入至深度学习模型中进行训练得到第一翻译模型,并将所述第一验证集输入至所述第一翻译模型中得到第一测试翻译结果;基于BLEU评估,将所述第一测试翻译结果和所述第一验证集对应的原始翻译语料进行对比,得到第一模型评估分;若所述第一模型评估分满足第一预设范围,则将所述第二训练集输入至所述第一翻译模型中进行训练得到第二翻译模型,并将所述第二验证集输入至所述第二翻译模型中得到第二测试翻译结果;基于所述BLEU评估和ROUGE评估,将所述第二测试翻译结果和所述第二验证集对应的原始翻译语料进行对比,得到第二模型评估分;若所述第二模型评估分满足第二预设范围,则将所述第二翻译模型作为基础翻译模型。3.根据权利要求2所述的方法,其特征在于,所述获取第一平行语料库和第二平行语料库,包括:收集不同来源的原始语料和所述不同来源的原始语料的原始翻译语料得到所述第一平行语料库;收集商业邮件的原始语料和所述商业邮件的原始语料的原始翻译语料得到所述第二平行语料库。4.根据权利要求2所述的方法,其特征在于,所述BLEU评估采用二阶文字组合的方式,所述ROUGE评估采用一...

【专利技术属性】
技术研发人员:张玉君
申请(专利权)人:深圳市小满科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1