当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于代码大模型的自动代码审查方法及系统技术方案

技术编号:43496320 阅读:45 留言:0更新日期:2024-11-29 17:03
本发明专利技术涉及一种基于代码大模型的自动代码审查方法及系统,该方法包括历史代码库;根据下游任务的需要对收集到的数据进行预处理;将预处理后的代码数据集进行embedding入库;采用预处理后的代码数据集对代码大模型进行指令微调和参数高效微调获得能够进行代码审查的训练后模型;获取开发者提交到代码仓库的代码,与对应的上个版本的代码进行比较得到code diff,再与上下文结合得到待审代码;将待审代码输入到训练后模型中得到输出审查评论;将待审代码和审查评论再次输入到训练后模型中,最后输出修订后的代码。修订后的代码合并到仓库的主分支。本发明专利技术方法可以显著减少代码审查过程中人力资源的消耗,提高代码质量和开发效率。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种基于代码大模型的自动代码审查方法及系统


技术介绍

1、现代代码审查是现代软件开发中必不可少的做法,这不仅是因为它有助于保证质量,还因为它有助于改进设计、知识共享和代码所有权。鉴于其益处,代码审查已被广泛应用于开源和工业项目中。随着深度学习的发展,越来越多的研究人员开始使用深度学习来实现代码审查自动化。基于深度学习的自动化代码审查技术利用复杂的神经网络模型来分析和审查代码,这种技术在近年来获得了显著的发展。它不仅可以识别复杂的代码模式和异常,还能够自动生成审查评论或代码修复建议,减轻人工审查者的负担。同时还可以通过不断学习新的代码样本自我优化,从而适应新的编程模式和趋势。

2、代码大模型是专门为理解和生成代码而训练的人工智能模型。这类模型通常基于大规模的语言模型,经过适应性修改,以适应编程语境。这使得它们能够理解代码的语法、语义乃至编程意图,从而在自动代码审查、代码补全、bug修复等方面发挥作用。例如,openai的codex和github copilot就是基于大型语言模型gpt-3的代码生成工具。参数高效本文档来自技高网...

【技术保护点】

1.一种基于代码大模型的自动代码审查方法,其特征在于,包括如下步骤:

2.如权利要求1所述的一种基于代码大模型的自动代码审查方法,其特征在于:所述S2包含审查评论生成和代码优化两个下游任务,根据下游任务的需要对收集到的数据进行预处理的步骤如下:

3.如权利要求2所述的一种基于代码大模型的自动代码审查方法,其特征在于:所述S4中,对代码大模型进行指令微调和参数高效微调的过程为:

4.一种基于代码大模型的自动代码审查系统,其特征在于,用于实施权利要求3所述的基于代码大模型的自动代码审查方法,自动代码审查系统包括:数据预处理模块,检索增强生成模块,代码合并模...

【技术特征摘要】

1.一种基于代码大模型的自动代码审查方法,其特征在于,包括如下步骤:

2.如权利要求1所述的一种基于代码大模型的自动代码审查方法,其特征在于:所述s2包含审查评论生成和代码优化两个下游任务,根据下游任务的需要对收集到的数据进行预处理的步骤如下:

3.如权利要求2所述的一种基于代码大...

【专利技术属性】
技术研发人员:张小洪汪昱君鄢萌刘超
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1