训练代码生成方法、装置、终端和计算机可读存储介质制造方法及图纸

技术编号:43960600 阅读:15 留言:0更新日期:2025-01-07 21:44
本申请涉及计算机技术领域,本申请公开了一种训练代码生成方法、装置、终端和计算机可读存储介质,该方法包括:对目标代码数据库进行代码筛选处理得到目标完整代码,确定目标完整代码对应的关键代码片段;之后针对关键代码片段进行任务预测处理得到至少一个目标任务,基于关键代码片段和目标任务构造训练代码生成提示词;最后,通过目标代码补全模型生成针对训练代码生成提示词的至少两个参考训练代码,针对目标任务运行参考训练代码以从参考训练代码中确定目标训练代码。从而解决代码生成大模型的训练需要大量质量较高的代码数据,常规的代码数据往往质量参差不齐,限制了代码生成大模型的代码生成效果的技术问题。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种训练代码生成方法、装置、终端和计算机可读存储介质


技术介绍

1、随着人工智能的快速发展,代码生成大模型逐步成为代码生成的重要工具。代码生成大模型能够根据输入的提示自动生成相应的代码,从而帮助开发者提高开发效率和代码质量。然而,代码生成大模型的训练需要大量质量较高的代码数据,常规的代码数据往往质量参差不齐,限制了代码生成大模型的代码生成效果。


技术实现思路

1、本申请实施例提供一种训练代码生成方法、装置、终端和计算机可读存储介质,可以解决代码生成大模型的训练需要大量质量较高的代码数据,常规的代码数据往往质量参差不齐,限制了代码生成大模型的代码生成效果的技术问题。

2、第一方面,本申请实施例提供一种训练代码生成方法,所述方法包括:

3、对目标代码数据库进行代码筛选处理得到目标完整代码,确定所述目标完整代码对应的关键代码片段;

4、针对所述关键代码片段进行任务预测处理得到至少一个目标任务,基于所述关键代码片段和所述目标任务构造训练代码生成提示词;<本文档来自技高网...

【技术保护点】

1.一种训练代码生成方法,其中,所述方法包括:

2.根据权利要求1所述的方法,其中,所述对目标代码数据库进行代码筛选处理得到目标完整代码,包括:

3.根据权利要求1或2所述的方法,其中,所述关键代码片段具有可复用性;所述确定所述目标完整代码对应的关键代码片段,包括:

4.根据权利要求1所述的方法,其中,所述针对所述关键代码片段进行任务预测处理得到至少一个目标任务,包括:

5.根据权利要求1所述的方法,其中,所述基于所述关键代码片段和所述目标任务构造训练代码生成提示词,包括:

6.根据权利要求1所述的方法,其中,所述针对所述目标任...

【技术特征摘要】

1.一种训练代码生成方法,其中,所述方法包括:

2.根据权利要求1所述的方法,其中,所述对目标代码数据库进行代码筛选处理得到目标完整代码,包括:

3.根据权利要求1或2所述的方法,其中,所述关键代码片段具有可复用性;所述确定所述目标完整代码对应的关键代码片段,包括:

4.根据权利要求1所述的方法,其中,所述针对所述关键代码片段进行任务预测处理得到至少一个目标任务,包括:

5.根据权利要求1所述的方法,其中,所述基于所述关键代码片段和所述目标任务构造...

【专利技术属性】
技术研发人员:梁博杨亦威周航宇
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1