System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 任务处理、代码补全、代码问答及任务处理模型训练方法技术_技高网

任务处理、代码补全、代码问答及任务处理模型训练方法技术

技术编号:40582729 阅读:6 留言:0更新日期:2024-03-06 17:26
本说明书实施例提供任务处理、代码补全、代码问答及任务处理模型训练方法,其中所述任务处理方法包括:获取目标任务的待处理代码数据;将待处理代码数据输入任务处理模型中,获得目标任务的任务处理结果,其中,任务处理模型基于多个样本代码块数据和样本代码块数据对应的样本代码标签训练得到,样本代码块数据基于代码块类型从样本代码文本中提取得到。由于任务处理模型是基于多个样本代码块数据训练得到的,使得任务处理模型可以理解代码语言结构化信息,提升了任务处理模型的训练效率以及任务处理结果的准确率。

【技术实现步骤摘要】

本说明书实施例涉及计算机,特别涉及任务处理、代码补全、代码问答及任务处理模型训练方法


技术介绍

1、随着计算机技术的发展,大模型开始大放异彩,在语言理解、生成、交互和推理方面表现出的非凡能力,广泛应用于对话、翻译、代码处理等的自然语言处理领域。以代码处理领域为例,利用大模型可以为开发者提供代码补全和代码问答的智能化能力,因此逐渐成为研究重点。

2、目前,通常直接利用大模型对代码文本进行处理,获得代码处理结果。然而,上述方法中,大模型会将代码文本当作普通的自然语言去学习理解,损失了代码数据的特性,导致代码处理结果准确性较差,因此,亟需一种准确性高的任务处理方案。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种任务处理方法。本说明书一个或者多个实施例同时涉及一种代码补全方法,一种代码问答方法,一种任务处理模型训练方法,一种任务处理装置,一种代码补全装置,一种代码问答装置,一种任务处理模型训练装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序产品,以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面,提供了一种任务处理方法,包括:获取目标任务的待处理代码数据;将待处理代码数据输入任务处理模型中,获得目标任务的任务处理结果,其中,任务处理模型基于多个样本代码块数据和样本代码块数据对应的样本代码标签训练得到,样本代码块数据基于代码块类型从样本代码文本中提取得到。

3、根据本说明书实施例的第二方面,提供了一种代码补全方法,包括:获取代码补全任务的待补全代码数据;将待补全代码数据输入任务处理模型中,获得待补全代码数据的代码补全结果,其中,任务处理模型基于多个样本代码块数据和样本代码块数据对应的样本代码标签训练得到,样本代码块数据基于代码块类型从样本代码文本中提取得到。

4、根据本说明书实施例的第三方面,提供了一种代码问答方法,包括:获取代码问答任务的待回答代码数据;将待回答代码数据输入任务处理模型中,获得待回答代码数据的代码答复结果,其中,任务处理模型基于多个样本代码块数据和样本代码块数据对应的样本代码标签训练得到,样本代码块数据基于代码块类型从样本代码文本中提取得到。

5、根据本说明书实施例的第四方面,提供了一种任务处理模型训练方法,包括:获取样本集,其中,样本集包括多个样本代码块数据和样本代码块数据对应的样本代码标签,样本代码块数据基于代码块类型从样本代码文本中提取得到;将多个样本代码块数据输入初始任务处理模型,获得多个样本代码块数据分别对应的代码预测结果;根据代码预测结果和样本代码标签,调整初始任务处理模型的模型参数,获得训练完成的任务处理模型。

6、根据本说明书实施例的第五方面,提供了一种任务处理装置,包括:第一获取模块,被配置为获取目标任务的待处理代码数据;第一输入模块,被配置为将待处理代码数据输入任务处理模型中,获得目标任务的任务处理结果,其中,任务处理模型基于多个样本代码块数据和样本代码块数据对应的样本代码标签训练得到,样本代码块数据基于代码块类型从样本代码文本中提取得到。

7、根据本说明书实施例的第六方面,提供了一种代码补全装置,包括:第二获取模块,被配置为获取代码补全任务的待补全代码数据;第二输入模块,被配置为将待补全代码数据输入任务处理模型中,获得待补全代码数据的代码补全结果,其中,任务处理模型基于多个样本代码块数据和样本代码块数据对应的样本代码标签训练得到,样本代码块数据基于代码块类型从样本代码文本中提取得到。

8、根据本说明书实施例的第七方面,提供了一种代码问答装置,包括:第三获取模块,被配置为获取代码问答任务的待回答代码数据;第三输入模块,被配置为将待回答代码数据输入任务处理模型中,获得待回答代码数据的代码答复结果,其中,任务处理模型基于多个样本代码块数据和样本代码块数据对应的样本代码标签训练得到,样本代码块数据基于代码块类型从样本代码文本中提取得到。

9、根据本说明书实施例的第八方面,提供了一种任务处理模型训练装置,包括:第四获取模块,被配置为获取样本集,其中,样本集包括多个样本代码块数据和样本代码块数据对应的样本代码标签,样本代码块数据基于代码块类型从样本代码文本中提取得到;第四输入模块,被配置为将多个样本代码块数据输入初始任务处理模型,获得多个样本代码块数据分别对应的代码预测结果;第一调整模块,被配置为根据代码预测结果和样本代码标签,调整初始任务处理模型的模型参数,获得训练完成的任务处理模型。

10、根据本说明书实施例的第九方面,提供了一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述第一方面或者第二方面或者第三方面或者第四方面所提供方法的步骤。

11、根据本说明书实施例的第十方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述第一方面或者第二方面或者第三方面或者第四方面所提供方法的步骤。

12、根据本说明书实施例的第十一方面,提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述第一方面或者第二方面或者第三方面或者第四方面所提供方法的步骤。

13、本说明书一个实施例提供的任务处理方法,获取目标任务的待处理代码数据;将待处理代码数据输入任务处理模型中,获得目标任务的任务处理结果,其中,任务处理模型基于多个样本代码块数据和样本代码块数据对应的样本代码标签训练得到,样本代码块数据基于代码块类型从样本代码文本中提取得到。由于任务处理模型是基于多个样本代码块数据训练得到的,使得任务处理模型可以理解代码语言结构化信息,提升了任务处理模型的训练效率以及任务处理结果的准确率。

本文档来自技高网...

【技术保护点】

1.一种任务处理方法,包括:

2.根据权利要求1所述的方法,所述将所述待处理代码数据输入任务处理模型中,获得所述目标任务的任务处理结果之前,还包括:

3.根据权利要求1所述的方法,所述将所述待处理代码数据输入任务处理模型中,获得所述目标任务的任务处理结果之后,还包括:

4.根据权利要求1所述的方法,所述将所述待处理代码数据输入任务处理模型中,获得所述目标任务的任务处理结果之前,还包括:

5.根据权利要求4所述的方法,所述获取样本集,包括:

6.根据权利要求5所述的方法,所述根据预设代码块数据结构,从所述第一样本结构化数据中提取第一样本代码块数据之后,还包括:

7.根据权利要求6所述的方法,所述获取所述第一样本代码定义文件之前,还包括:

8.根据权利要求5所述的方法,所述解析所述第一样本代码文本,获得所述第一样本代码文本的第一样本结构化数据之前,还包括:

9.根据权利要求5所述的方法,所述解析所述第一样本代码文本,获得所述第一样本代码文本的第一样本结构化数据之前,还包括:

10.一种代码补全方法,包括:

11.一种代码问答方法,包括:

12.一种任务处理模型训练方法,包括:

13.根据权利要求12所述的方法,所述根据所述代码预测结果和所述样本代码标签,调整所述初始任务处理模型的模型参数,获得训练完成的任务处理模型之后,还包括:

14.一种计算设备,包括:

15.一种计算机可读存储介质,其存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现权利要求1至9任意一项或者权利要求10或者权利要求11或者权利要求12至13任意一项所述方法的步骤。

16.一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现权利要求1至9任意一项或者权利要求10或者权利要求11或者权利要求12至13任意一项所述方法的步骤。

...

【技术特征摘要】

1.一种任务处理方法,包括:

2.根据权利要求1所述的方法,所述将所述待处理代码数据输入任务处理模型中,获得所述目标任务的任务处理结果之前,还包括:

3.根据权利要求1所述的方法,所述将所述待处理代码数据输入任务处理模型中,获得所述目标任务的任务处理结果之后,还包括:

4.根据权利要求1所述的方法,所述将所述待处理代码数据输入任务处理模型中,获得所述目标任务的任务处理结果之前,还包括:

5.根据权利要求4所述的方法,所述获取样本集,包括:

6.根据权利要求5所述的方法,所述根据预设代码块数据结构,从所述第一样本结构化数据中提取第一样本代码块数据之后,还包括:

7.根据权利要求6所述的方法,所述获取所述第一样本代码定义文件之前,还包括:

8.根据权利要求5所述的方法,所述解析所述第一样本代码文本,获得所述第一样本代码文本的第一样本结构化数据之前,还包括:

9.根...

【专利技术属性】
技术研发人员:张昕东刘力华
申请(专利权)人:浙江阿里巴巴机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1