System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 代码构建方法、模型微调方法、设备及存储介质技术_技高网

代码构建方法、模型微调方法、设备及存储介质技术

技术编号:40017910 阅读:4 留言:0更新日期:2024-01-16 16:17
本申请提供一种代码构建方法、模型微调方法、设备及存储介质,其中方法包括:获取需求信息以及基于原始编程语言实现的、与所述需求信息对应的原始代码文本;根据所述需求信息,通过生成模型得到对应的至少一个候选代码文本,所述至少一个候选代码文本基于目标编程语言实现;根据所述原始代码文本对所述至少一个候选代码文本进行校验,得到基于目标编程语言实现的、与所述需求信息对应的目标代码文本。本申请能够有效扩充目标编程语言对应的代码文本,提高构建代码文本的效率和准确性,进而可以基于构建的代码文本对模型进行微调训练,提高模型针对目标编程语言的处理能力,提升模型的训练效果。

【技术实现步骤摘要】

本申请涉及人工智能技术,尤其涉及一种代码构建方法、模型微调方法、设备及存储介质


技术介绍

1、随着计算机技术的不断发展,软件开发的需求也日益增加,为了辅助实现软件开发,可以利用大模型进行代码生成,从而提高开发的整体效率。

2、在通过大模型生成代码之前,可以先基于训练数据对大模型进行训练。现有技术中,存在多种编程语言,例如,c语言、c++、java、python等。在训练某种编程语言对应的大模型时,往往需要先获取该编程语言对应的代码示例,才能完成对大模型的训练。

3、但是,目前某些编程语言存在训练数据不足的问题,导致模型训练的效果较差。


技术实现思路

1、本申请提供一种代码构建方法、模型微调方法、设备及存储介质,用以提升构建代码的效率和准确性,进而提升模型训练的整体效果。

2、第一方面,本申请实施例提供一种代码构建方法,包括:

3、获取需求信息以及基于原始编程语言实现的、与所述需求信息对应的原始代码文本;

4、根据所述需求信息,通过生成模型得到对应的至少一个候选代码文本,所述至少一个候选代码文本基于目标编程语言实现;

5、根据所述原始代码文本对所述至少一个候选代码文本进行校验,得到基于目标编程语言实现的、与所述需求信息对应的目标代码文本。

6、第二方面,本申请实施例提供一种模型微调方法,用于对目标模型进行至少一个轮次的微调,其中,任意一轮微调的过程包括:

7、获取需求信息和对应的目标代码文本,其中,所述目标代码文本是基于第一方面所述的方法得到的;

8、根据所述需求信息和对应的目标代码文本,对目标模型进行训练。

9、第三方面,本申请实施例提供一种代码生成方法,包括:

10、获取待处理的需求信息;

11、将所述需求信息输入到目标模型,得到所述需求信息对应的代码文本;

12、输出所述代码文本;

13、其中,所述目标模型为通过第二方面所述的方法训练得到的。

14、第四方面,本申请实施例提供一种电子设备,包括:

15、至少一个处理器;以及

16、与所述至少一个处理器通信连接的存储器;

17、其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述电子设备执行上述任一方面所述的方法。

18、第五方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上述任一方面所述的方法。

19、第六方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上述任一方面所述的方法。

20、本申请实施例提供的代码构建方法、模型微调方法、设备及存储介质,可以获取需求信息以及基于原始编程语言实现的、与所述需求信息对应的原始代码文本,根据所述需求信息,通过生成模型得到对应的至少一个候选代码文本,所述至少一个候选代码文本基于目标编程语言实现,并根据所述原始代码文本对所述至少一个候选代码文本进行校验,得到基于目标编程语言实现的、与所述需求信息对应的目标代码文本。本申请实施例能够利用生成模型自动生成候选代码文本,提高构建代码文本的效率,并且结合原始编程语言对目标编程语言进行校验,提高得到的代码文本的准确性,从而有效扩充目标编程语言对应的代码文本,进而可以基于构建的代码文本对生成模型或其他模型进行微调,提高模型针对目标编程语言的处理能力,提升模型的训练效果。

本文档来自技高网...

【技术保护点】

1.一种代码构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述生成模型为经过预训练的模型,预训练使用的训练数据包括原始编程语言对应的训练数据和目标编程语言对应的训练数据;

3.根据权利要求1所述的方法,其特征在于,所述生成模型为经过预训练的模型,预训练使用的训练数据不包括目标编程语言对应的训练数据;

4.根据权利要求3所述的方法,其特征在于,在将所述需求信息和提示信息输入到生成模型,得到对应的至少一个候选代码文本之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,根据所述需求信息对应的至少一个功能和/或所述原始代码文本包含的至少一个原始语句,确定所述语法规则,包括:

6.根据权利要求1-5任一项所述的方法,其特征在于,根据所述原始代码文本对所述至少一个候选代码文本进行校验,得到基于目标编程语言实现的、与所述需求信息对应的目标代码文本,包括:

7.根据权利要求6所述的方法,其特征在于,所述测试用例的数量为多个;根据所述候选代码文本对应的测试结果和原始代码文本对应的测试结果,确定所述候选代码文本是否校验通过,包括:

8.根据权利要求7所述的方法,其特征在于,若所述通过率满足要求,则确定所述候选代码文本校验通过,包括:

9.根据权利要求1-5任一项所述的方法,其特征在于,根据所述原始代码文本对所述至少一个候选代码文本进行校验,包括:

10.根据权利要求2-5任一项所述的方法,其特征在于,获取需求信息以及基于原始编程语言实现的、与所述需求信息对应的原始代码文本,包括:

11.根据权利要求6所述的方法,其特征在于,还包括下述至少一项:

12.一种模型微调方法,其特征在于,用于对目标模型进行至少一个轮次的微调,其中,任意一轮微调的过程包括:

13.根据权利要求12所述的方法,其特征在于,所述目标模型包括所述生成模型;所述方法还包括:

14.根据权利要求12或13所述的方法,其特征在于,获取到的目标代码文本有多个,一个轮次的微调包括多个批次的训练过程;

15.一种代码生成方法,其特征在于,包括:

16.根据权利要求15所述的方法,其特征在于,将所述需求信息输入到目标模型,得到所述需求信息对应的代码文本,包括:

17.一种电子设备,其特征在于,包括:

18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-16任一项所述的方法。

19.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-16任一项所述的方法。

...

【技术特征摘要】

1.一种代码构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述生成模型为经过预训练的模型,预训练使用的训练数据包括原始编程语言对应的训练数据和目标编程语言对应的训练数据;

3.根据权利要求1所述的方法,其特征在于,所述生成模型为经过预训练的模型,预训练使用的训练数据不包括目标编程语言对应的训练数据;

4.根据权利要求3所述的方法,其特征在于,在将所述需求信息和提示信息输入到生成模型,得到对应的至少一个候选代码文本之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,根据所述需求信息对应的至少一个功能和/或所述原始代码文本包含的至少一个原始语句,确定所述语法规则,包括:

6.根据权利要求1-5任一项所述的方法,其特征在于,根据所述原始代码文本对所述至少一个候选代码文本进行校验,得到基于目标编程语言实现的、与所述需求信息对应的目标代码文本,包括:

7.根据权利要求6所述的方法,其特征在于,所述测试用例的数量为多个;根据所述候选代码文本对应的测试结果和原始代码文本对应的测试结果,确定所述候选代码文本是否校验通过,包括:

8.根据权利要求7所述的方法,其特征在于,若所述通过率满足要求,则确定所述候选代码文本校验通过,包括:

9.根据权利要求1-5任一项所述的方法...

【专利技术属性】
技术研发人员:廖敏鹏
申请(专利权)人:杭州阿里云飞天信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1