中文语言驱动的程序代码自动生成方法、装置及介质制造方法及图纸

技术编号:41228310 阅读:29 留言:0更新日期:2024-05-09 23:45
本发明专利技术公开了一种中文语言驱动的程序代码自动生成方法、装置及介质,涉及计算机软件工程的代码生成技术。其中方法包括:设计编程语言无关的抽象语法规则集;对输入的中文伪代码做基于抽象语法规则集的序列生成,得到抽象语法规则序列;针对抽象语法规则序列,根据序列中节点类别展开树状结构、划定子树范围,将规则序列抽象为抽象语法树;针对抽象语法树,进行词元合法性分析、子树结构合法性分析和抽象语法树整体合法性分析,生成基于抽象语法规则集的质量评估结果;根据质量评估结果,结合人机对话技术完成信息补全;当检测到质量评估结果为合格,生成最终的高质量代码。本发明专利技术在小规模资源下即可实现高质量的中文语言驱动的程序代码自动生成。

【技术实现步骤摘要】

本专利技术涉及计算机软件工程的代码生成技术,尤其涉及一种中文语言驱动的程序代码自动生成方法、装置及介质


技术介绍

1、随着计算机技术的高速发展、软硬件技术的迭代更新,编写计算机可理解并执行的程序的方式与语言不断改变并简化,但是代码编写任务仍然是开发人员必要工作之一,伪代码生成代码任务通常作为程序开发工作的最后一步出现,由开发者根据伪代码人工编写对应代码,其中存在着大量简单代码与功能相同代码的重复撰写工作,以及由此带来的重复调试解决所编写代码缺陷的工作,这些工作大大降低了开发效率并提高了代码后期的维护成本。伪代码自动生成代码方法有效解决了重复代码编写与维护问题,并有效降低了从掌握计算思维提升到实现具体程序代码编写之间的学习门槛。随着深度学习模型尤其是大规模预训练模型在伪代码自动生成代码任务上的大规模应用,伪代码自动生成代码任务得到了快速发展。

2、目前针对中文语言驱动的程序代码自动生成任务,前人工作设计了许多大规模预训练模型来学习代码语言内在的语法结构信息以及逻辑结构信息,这些大规模预训练模型极度依赖大规模的训练数据量和模型参数量,训练成本极高本文档来自技高网...

【技术保护点】

1.一种中文语言驱动的程序代码自动生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种中文语言驱动的程序代码自动生成方法,其特征在于,步骤S1中,所述设计编程语言无关的抽象语法规则集,包括:

3.根据权利要求1所述的一种中文语言驱动的程序代码自动生成方法,其特征在于,步骤S1中,所述对输入的中文伪代码做基于抽象语法规则集的序列生成,得到中文伪代码样本对应的抽象语法规则序列,包括:

4.根据权利要求1所述的一种中文语言驱动的程序代码自动生成方法,其特征在于,所述步骤S2,包括:

5.根据权利要求1所述的一种中文语言驱动的程序代码...

【技术特征摘要】

1.一种中文语言驱动的程序代码自动生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种中文语言驱动的程序代码自动生成方法,其特征在于,步骤s1中,所述设计编程语言无关的抽象语法规则集,包括:

3.根据权利要求1所述的一种中文语言驱动的程序代码自动生成方法,其特征在于,步骤s1中,所述对输入的中文伪代码做基于抽象语法规则集的序列生成,得到中文伪代码样本对应的抽象语法规则序列,包括:

4.根据权利要求1所述的一种中文语言驱动的程序代码自动生成方法,其特征在于,所述步骤s2,包括:

5.根据权利要求1所述的一种中文语言驱动的程序代码自动生成方法,其特征在于,所述步骤s3,包括:

6.根据权利要求1所述的一种中文语言...

【专利技术属性】
技术研发人员:黄翰李梓锋周灿苗
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1