System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型处理方法、装置、电子设备及可读存储介质制造方法及图纸_技高网

模型处理方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:40062817 阅读:7 留言:0更新日期:2024-01-16 22:57
本申请公开了一种模型处理方法、装置、电子设备及可读存储介质,属于人工智能技术领域。本申请实施例中的模型处理方法包括:获取训练数据;根据所述训练数据以及预先建立的prompt模板,生成第一prompt数据和第二prompt数据;所述第一prompt数据与第一任务相关,所述第一任务至少包括目标原子任务;所述第二prompt数据与第二任务相关,所述第二任务包括所述目标原子任务,且所述第二任务包括的原子任务的个数比第一任务包括的原子任务的个数多;利用所述第一prompt数据对预训练模型进行训练,获得初始任务执行模型;利用所述第二prompt数据对所述初始任务执行模型进行调整,获得目标任务执行模型。由此,可以有效提升模型的任务执行能力。

【技术实现步骤摘要】

本申请属于人工智能,具体涉及一种模型处理方法、装置、电子设备及可读存储介质


技术介绍

1、相关技术中,为了提升任务执行模型在面对复杂任务、新任务等时的执行能力时,通常采用提高模型规模和/或增加训练数据量的方式,来训练任务执行模型。然而,由于训练成本等原因,模型规模的提高量和训练数据的增加量通常有限,将会造成无法有效提升模型的任务执行能力。


技术实现思路

1、本申请实施例的目的是提供一种模型处理方法、装置、电子设备及可读存储介质,以解决目前无法有效提升模型的任务执行能力的问题。

2、为了解决上述技术问题,本申请是这样实现的:

3、第一方面,提供了一种模型处理方法,包括:

4、获取训练数据;

5、根据所述训练数据以及预先建立的prompt模板,生成第一prompt数据和第二prompt数据;其中,所述第一prompt数据与第一任务相关,所述第一任务至少包括目标原子任务;所述第二prompt数据与第二任务相关,所述第二任务包括所述目标原子任务,且所述第二任务包括的原子任务的个数比所述第一任务包括的原子任务的个数多;

6、利用所述第一prompt数据对预训练模型进行训练,获得初始任务执行模型;

7、利用所述第二prompt数据对所述初始任务执行模型进行调整,获得目标任务执行模型。

8、第二方面,提供了一种模型处理装置,包括:

9、获取模块,用于训练数据;

10、生成模块,用于根据所述训练数据以及预先建立的prompt模板,生成第一prompt数据和第二prompt数据;其中,所述第一prompt数据与第一任务相关,所述第一任务至少包括目标原子任务;所述第二prompt数据与第二任务相关,所述第二任务包括所述目标原子任务,且所述第二任务包括的原子任务的个数比所述第一任务包括的原子任务的个数多;

11、训练模块,用于利用所述第一prompt数据对预训练模型进行训练,获得初始任务执行模型;

12、调整模块,用于利用所述第二prompt数据对所述初始任务执行模型进行调整,获得目标任务执行模型。

13、第三方面,提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

14、第四方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

15、在本申请实施例中,在获取训练数据之后,可以根据所述训练数据以及预先建立的prompt模板,生成第一prompt数据和第二prompt数据;所述第一prompt数据与第一任务相关,所述第一任务至少包括目标原子任务;所述第二prompt数据与第二任务相关,所述第二任务包括所述目标原子任务,且所述第二任务包括的原子任务的个数比所述第一任务包括的原子任务的个数多;利用所述第一prompt数据对预训练模型进行训练,获得初始任务执行模型;并利用所述第二prompt数据对所述初始任务执行模型进行调整,获得目标任务执行模型。由此,可以按照任务的复杂度逐步调整/优化任务执行模型,从而使得该模型在学习复杂任务的求解过程中,在建立对细粒度任务/原子任务的理解和认知能力的同时,能够理解细粒度任务/原子任务之间的逻辑关系的作用力,从而使得该模型在本质上理解复杂任务的求解过程和逻辑,构建执行复杂任务的能力,进而在执行复杂任务时可以出现能力陡增的现象,从而有效提升模型的任务执行能力。

本文档来自技高网...

【技术保护点】

1.一种模型处理方法,应用于电子设备,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第二prompt数据与多种第二任务相关,所述多种第二任务被划分为n个等级,第i级第二任务包括的原子任务的个数小于第j级第二任务包括的原子任务的个数,1≤i<j≤n;

3.根据权利要求1所述的方法,其特征在于,所述prompt模板包括任务部分、输入数据部分和输出结果部分;

4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述训练数据以及预先建立的prompt模板,生成第一prompt数据和第二prompt数据之前,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述第一任务仅包括所述目标原子任务。

6.根据权利要求1所述的方法,其特征在于,所述原子任务为以下任一项:

7.一种模型处理装置,其特征在于,包括:

8.根据权利要求7所述的装置,其特征在于,所述第二prompt数据与多种第二任务相关,所述多种第二任务被划分为n个等级,第i级第二任务包括的原子任务的个数小于第j级第二任务包括的原子任务的个数,1≤i<j≤n;

9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至6任一项所述的模型处理方法的步骤。

10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至6任一项所述的模型处理方法的步骤。

...

【技术特征摘要】

1.一种模型处理方法,应用于电子设备,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述第二prompt数据与多种第二任务相关,所述多种第二任务被划分为n个等级,第i级第二任务包括的原子任务的个数小于第j级第二任务包括的原子任务的个数,1≤i<j≤n;

3.根据权利要求1所述的方法,其特征在于,所述prompt模板包括任务部分、输入数据部分和输出结果部分;

4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述训练数据以及预先建立的prompt模板,生成第一prompt数据和第二prompt数据之前,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述第一任务仅包括所述目标原子任务。

6.根据权利...

【专利技术属性】
技术研发人员:于皓张杰
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1