一种基于生成式预训练的代码标准化方法技术

技术编号:37607551 阅读:31 留言:0更新日期:2023-05-18 11:59
本发明专利技术提供的一种基于生成式预训练的代码标准化方法,采取生成式预训练文本处理模型,通过开源代码和自有代码进行模型预训练,并基于符合编程规范的代码进行模型微调,使模型可以对输入的代码进行代码规范性检查并给出修改建议,提升应用代码对于编程规范和开发标准的符合度,并解决静态代码扫描方式存在的事后性、被动性的不足。被动性的不足。被动性的不足。

【技术实现步骤摘要】
一种基于生成式预训练的代码标准化方法


[0001]本专利技术涉及代码审核领域,尤其涉及一种基于生成式预训练的代码标准化方法。

技术介绍

[0002]应用系统和软件产品研发过程中,通常会制定编程规范来约束开发人员的编程风格、实现方式来统一程序风格,便于维护和扩展,提升项目交付质量。在公开的《阿里巴巴Java开发手册》中,分为编程规约、异常日志、MySQL规约、工程规约、安全规约五部分,来约束Java程序语言的开发规范,帮助开发团队在开发上更高效、容错、有协作性,提高代码质量,降低项目维护成本。
[0003]此外,在软件研发与实际业务领域结合时,通常还会基于统一数据字典、统一报文格式、统一日志格式、统一字节码等规范来提升系统的标准化和一致性。因此,编程开发规范与标准的遵守和高效检验必不可少。
[0004]除人工代码审核方式之外,现有方案主要使用Checkstyle、PMD等静态扫描工具进行代码规范性检查。静态扫描工具是在不运行代码的方式下,通过词法分析、语法分析、控制流、数据分析等技术对程序代码进行扫描,验证代码是否满足规范性、安全本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于生成式预训练的代码标准化方法,其特征在于,所述代码标准化方法包括:预训练代码;规范代码微调;代码规范检查与修改建议。2.根据权利要求1所述的一种基于生成式预训练的代码标准化方法,其特征在于,所述预训练代码具体包括:部署GPT模型引擎,以开源代码和自有代码对GPT模型进行预训练。3.根据权利要求1所述的一种基于生成式预训练的代码标准化方法,其特征在于,所述规范代码微调具体包括:GPT模型预训练完成...

【专利技术属性】
技术研发人员:刘梦雯
申请(专利权)人:北银金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1