翻译模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:31486261 阅读:11 留言:0更新日期:2021-12-18 12:21
本公开提供了一种翻译模型的训练方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及深度学习、自然语言处理等人工智能技术领域。具体实现方案为:接收调整信息,所述调整信息,用于对已有翻译结果进行调整,所述已有翻译结果,是对待翻译信息翻译得到的,并根据所述调整信息和所述已有翻译结果,确定目标翻译结果,以及根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型。由此,实现参考已有翻译结果的调整信息对初始翻译模型进行自动化地迭代训练,能够有效降低翻译模型的训练成本,并且能够较大程度地提升翻译模型的训练效率,辅助提升目标翻译模型的翻译效率和翻译质量。型的翻译效率和翻译质量。型的翻译效率和翻译质量。

【技术实现步骤摘要】
翻译模型的训练方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,尤其涉及深度学习、自然语言处理等人工智能
,具体涉及一种翻译模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术,以及机器学习、深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]相关技术中,在翻译模型的训练过程中,通常是采用海量训练语料,对通用的机器翻译模型进行训练,需要耗费较高的训练成本,且翻译模型的训练效率较低。

技术实现思路

[0004]本公开提供了一种翻译模型的训练方法、装置、电子设备、存储介质以及计算机程序产品。
[0005]根据本公开的第一方面,提供了一种翻译模型的训练方法,包括:接收调整信息,所述调整信息,用于对已有翻译结果进行调整,所述已有翻译结果,是对待翻译信息翻译得到的;根据所述调整信息和所述已有翻译结果,确定目标翻译结果;以及根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型。
[0006]根据本公开的第二方面,提供了一种翻译模型的训练方法,包括:接收模块,用于接收调整信息,所述调整信息,用于对已有翻译结果进行调整,所述已有翻译结果,是对待翻译信息翻译得到的;确定模块,用于根据所述调整信息和所述已有翻译结果,确定目标翻译结果;以及训练模块,用于根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型。
[0007]根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面的翻译模型的训练方法。
[0008]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面的翻译模型的训练方法。
[0009]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面的翻译模型的训练方法。
[0010]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其他特征将通过以下的说明书而变得容易理解。
附图说明
[0011]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0012]图1是根据本公开第一实施例的示意图;
[0013]图2是根据本公开实施例的翻译模型训练的方法的流程示意图;
[0014]图3是根据本公开实施例的翻译模型解码的框架示意图;
[0015]图4是根据本公开实施例的翻译结果修改界面示意图
[0016]图5是根据本公开实施例的翻译模型自动训练模块的示意图;
[0017]图6是根据本公开第二实施例的示意图;
[0018]图7是根据本公开第三实施例的示意图;
[0019]图8是根据本公开第四实施例的示意图;
[0020]图9是根据本公开第五实施例的示意图;
[0021]图10示出了可以用来实施本公开实施例的翻译模型的训练方法的示例电子设备的示意性框图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]图1是根据本公开第一实施例的示意图。
[0024]其中,需要说明的是,本实施例的翻译模型的训练方法的执行主体为翻译模型的训练装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。
[0025]本公开实施例涉及深度学习、自然语言处理等人工智能

[0026]其中,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
[0027]深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
[0028]自然语言处理(Natural Language Processing,NLP),能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
[0029]如图1所示,该翻译模型训练方法,包括:
[0030]S101:接收调整信息,调整信息,用于对已有翻译结果进行调整,已有翻译结果,是对待翻译信息翻译得到的。
[0031]其中,待对其进行翻译的信息,即可以被称为待翻译信息,而信息可以具体例如为短语、句子、单词等,对此不做限制。
[0032]其中,对待翻译信息进行翻译得到的结果,可以被称为已有翻译结果。以待翻译信息是汉语“我喜欢吃苹果”为例,翻译结果可以是英语“I like eating apples”,当然翻译结果也可以是法语、韩语,德语等其他语言,对此不做限制。
[0033]本实施例中,如图2所示,图2是根据本公开实施例的翻译模型的训练的方法的流程示意图,包括:翻译记忆库、翻译模型,对待翻译信息进行翻译,以得到已有翻译结果,可以是响应于用户的翻译请求,将用户提供的待翻译信息提供给翻译记忆库,翻译记忆库可以根据待翻译信息通过检索的方式,查找已翻译过的相似的多个翻译信息及与翻译信息对应的翻译结果,并把该多个翻译信息和对应的翻译结果提供给翻译模型,翻译模型再根据前述提供的多个翻译信息和对应的翻译结果,做出与待翻译信息对应的翻译结果,该翻译结果即可以被称为已有翻译结果。
[0034]其中,翻译模型可以是人工智能模型,具体例如为神经网络模型或者是机器学习模型,当然也可以是其他任意可能的能够执行翻译任务的模型,对此不做限制。
[0035]其中,检索方式可以具体例如为词频

逆文本指数(Term Frequency

Inverse Document Frequency,TF

IDF)、文本编辑距离等,对此不做限制。
[0036]例如,如果用户提供的待翻译信息是“我想吃苹果”,则可以翻译记忆库中检索到相似的翻译信息“我喜欢吃苹果”,“我想吃梨”,以及与前述翻译信息对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种翻译模型的训练方法,包括:接收调整信息,所述调整信息,用于对已有翻译结果进行调整,所述已有翻译结果,是对待翻译信息翻译得到的;根据所述调整信息和所述已有翻译结果,确定目标翻译结果;以及根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型。2.根据权利要求1所述的方法,在所述根据所述调整信息和所述已有翻译结果,确定目标翻译结果之后,还包括:获取初始翻译关系,所述初始翻译关系包括:多个候选翻译信息,和与所述多个候选翻译信息分别对应的多个候选翻译结果;根据所述目标翻译结果更新所述初始翻译关系,以得到目标翻译关系。3.根据权利要求2所述的方法,其中,所述根据所述目标翻译结果更新所述初始翻译关系,以得到目标翻译关系,包括:从所述多个候选翻译信息之中,确定与所述待翻译信息对应的候选翻译信息,并确定与所述对应的候选翻译信息所对应候选翻译结果;将所述对应候选翻译结果调整为所述目标翻译结果,以得到所述目标翻译关系。4.根据权利要求1所述的方法,其中,所述根据所述调整信息和所述已有翻译结果,确定目标翻译结果,包括:根据所述调整信息对所述已有翻译结果进行调整,并将调整得到的翻译结果作为所述目标翻译结果;和/或将所述调整信息和所述已有翻译结果共同作为所述目标翻译结果。5.根据权利要求4所述的方法,其中,所述根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型,包括:在所述根据所述调整信息对所述已有翻译结果进行调整时,根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型。6.根据权利要求1所述的方法,其中,所述根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型,包括:检测当前时间点;如果所述当前时间点达到设定时间点,则根据所述待翻译信息和所述目标翻译结果训练初始翻译模型,以得到目标翻译模型。7.一种翻译模型的训练装置,包括:接收模块,用于接收调整信息,所述调整信息,用于对已有翻译结果进行调整,所述已有翻译结果,是对待翻译信息翻译得到的;确定模块,用于根据所述调整信息和所述已有翻译结果,确定目标翻译结果;以及训练模块,用于...

【专利技术属性】
技术研发人员:万星赵静璇王梦雪何中军吴华李芝徐梓翔刘继强高鹏至孙萌李朝锡姚伟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1