深度学习驱动的语义语法交互代码注释生成方法及装置制造方法及图纸

技术编号:41113421 阅读:24 留言:0更新日期:2024-04-25 14:05
本发明专利技术公开了一种深度学习驱动的语义语法交互代码注释生成方法及装置,方法包括:首先获得待注释源代码向量,将待注释源代码向量作为Siamese神经网络模型的输入,以输出多个语义相似的初始代码摘要对,分别将待注释源代码转化为第一图结构、将多个语义相似的初始代码摘要对转化为第二图结构,利用图核函数计算第一图结构、第二图结构的语法相似度,以确定目标代码摘要对,最后将待注释源代码向量以及目标代码摘要对输入GAT模型,以获得生成的语义增强表示和语法增强表示,将语义增强表示和语法增强表示输入交互式多头注意力模型中进行信息捕获,以生成待注释源代码的摘要。它能够提高源代码的可读性和可维护性。

【技术实现步骤摘要】

本专利技术属于人工智能,特别是一种深度学习驱动的语义语法交互代码注释生成方法及装置


技术介绍

1、在代码摘要领域,结合检索和深度学习的模型已经取得了显著的进展,例如现有模型通过检索阶段和生成阶段的双阶段方法,提升了代码注释的生成质量。在检索阶段,现有模型通过语义和语法检索出与源代码最相似的代码片段;在生成阶段,通过融合层将检索到的代码与源代码向量结合,以生成最终的代码摘要。

2、尽管现有模型在新颖性和效果上均表现出色,但仍存在一些不足之处。例如,现有模型在语义检索阶段仅通过欧氏距离进行相似度计算,这种方法无法充分捕捉代码之间复杂的语义关系。此外,现有模型在考虑代码与摘要之间的语义关联时也显得不足。在语法检索方面,现有模型采用的是简单的文本编辑距离计算,这虽然能够捕获词汇层面的相似性,但却不能准确地反映代码的结构相似性,从而影响了检索的准确性。在生成阶段,现有模型将检索到的代码与源代码通过融合层进行简单拼接,这种方法未能充分利用源代码与相似代码之间的关系,也未能准确捕获它们之间的深层关联,这成为急需解决的技术问题。

<br/>

本文档来自技高网...

【技术保护点】

1.一种深度学习驱动的语义语法交互代码注释生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获得待注释源代码向量,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述待注释源代码向量作为Siamese神经网络模型的输入,以输出多个语义相似的初始代码摘要对,包括:

4.根据权利要求3所述的方法,其特征在于,所述利用预设余弦相似度计算方法确定多个相似的摘要向量对应的初始代码摘要对,包括:

5.根据权利要求4所述的方法,其特征在于,所述分别将所述待注释源代码转化为第一图结构、将所述多个语义相似的初始代码摘...

【技术特征摘要】

1.一种深度学习驱动的语义语法交互代码注释生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获得待注释源代码向量,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述待注释源代码向量作为siamese神经网络模型的输入,以输出多个语义相似的初始代码摘要对,包括:

4.根据权利要求3所述的方法,其特征在于,所述利用预设余弦相似度计算方法确定多个相似的摘要向量对应的初始代码摘要对,包括:

5.根据权利要求4所述的方法,其特征在于,所述分别将所述待注释源代码转化为第一图结构、将所述多个语义相似的初始代码摘要对转化为第二图结构,包括:

【专利技术属性】
技术研发人员:黄宁馨丁宇新
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1