任务处理方法、翻译方法、任务处理模型训练方法、计算设备、计算机可读存储介质及计算机程序产品技术

技术编号:42123669 阅读:18 留言:0更新日期:2024-07-25 00:41
本说明书实施例提供任务处理方法、翻译方法、任务处理模型训练方法、计算设备、计算机可读存储介质及计算机程序产品,其中所述任务处理方法包括:获取待处理的任务数据;将任务数据输入任务处理模型,在第一指示信息的指示下,基于任务数据所属目标领域的领域知识,生成目标领域的领域提示信息,并在第二指示信息的指示下,基于领域提示信息,对任务数据执行目标任务,获得任务处理结果。对目标任务进行了执行逻辑拆分,在生成了目标领域的领域提示信息的情况下,基于领域提示信息执行目标任务,有效缓解了模型的过拟合问题和灾难性遗忘问题,提升了模型与领域的适应性的同时,保留有较高的泛化能力,提升了任务处理的准确度。

【技术实现步骤摘要】

本说明书实施例涉及深度学习,特别涉及一种任务处理方法、翻译方法、任务处理模型训练方法、计算设备、计算机可读存储介质及计算机程序产品


技术介绍

1、随着深度学习技术的发展,以大模型为代表的任务处理模型在多种任务上都得到广泛应用,例如,用于执行翻译任务的翻译模型,又例如,用于执行图像生成任务的图像生成模型,还例如,用于执行语音合成任务的语音合成模型。

2、目前,针对任务中不同领域的任务数据,利用相应领域的样本任务数据来对任务处理模型进行针对训练,使得初始的任务处理模型这一通用模型拥有了适应于特定领域的任务处理能力,可以较为准确地对属于特定领域的任务数据执行任务。

3、然而,由于样本任务数据所属领域过于限定,容易产生过拟合问题和灾难性遗忘问题,使得任务处理模型在领域内进行任务处理时准确度较高,在领域外进行任务处理时准确度不足,进而在面对多领域任务的任务处理准确度不足,任务处理的通用性不足。因此,亟需一种高准确度和高通用性的任务处理方法。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种本文档来自技高网...

【技术保护点】

1.一种任务处理方法,包括:

2.根据权利要求1所述的方法,所述将所述任务数据输入任务处理模型,在第一指示信息的指示下,基于所述任务数据所属目标领域的领域知识,生成所述目标领域的领域提示信息,包括:

3.根据权利要求1或2所述的方法,所述在第二指示信息的指示下,基于所述领域提示信息,对所述任务数据执行目标任务,获得任务处理结果,包括

4.根据权利要求3所述的方法,在所述基于第二指示信息、所述领域提示信息和所述任务数据,构建第二任务信息之前,还包括:

5.根据权利要求1所述的方法,在所述将所述任务数据输入任务处理模型之前,还包括:

...

【技术特征摘要】

1.一种任务处理方法,包括:

2.根据权利要求1所述的方法,所述将所述任务数据输入任务处理模型,在第一指示信息的指示下,基于所述任务数据所属目标领域的领域知识,生成所述目标领域的领域提示信息,包括:

3.根据权利要求1或2所述的方法,所述在第二指示信息的指示下,基于所述领域提示信息,对所述任务数据执行目标任务,获得任务处理结果,包括

4.根据权利要求3所述的方法,在所述基于第二指示信息、所述领域提示信息和所述任务数据,构建第二任务信息之前,还包括:

5.根据权利要求1所述的方法,在所述将所述任务数据输入任务处理模型之前,还包括:

6.根据权利要求5所述的方法,所述基于所述预测领域提示信息和所述预测任务处理结果,对所述初始的任务处理模型进行训练,获得任务处理模型,包括:

7.根据权利要求6所述的方法,所述初始的任务处理模型为预训练的任务处理模型;

8.根据权利要求7所述的方法,在所述将所述样本任务数据输入所述预训练的任务处理模型之前,还包括:

9.根据权利要求5所述的方法,所述将所述样本任务数据输入初始的任务处理模型,在第一指示信息...

【专利技术属性】
技术研发人员:胡天祥张珮杨宝嵩谢军王瑞
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1