当前位置: 首页 > 专利查询>重庆大学专利>正文

基于单词替换策略的用于代码汇总的多模态摘要生成方法技术

技术编号:40422383 阅读:20 留言:0更新日期:2024-02-20 22:41
本发明专利技术涉及一种基于单词替换策略的用于代码汇总的多模态摘要生成方法,包括三个基本阶段:特征表示、特征学习和复合解码器。在初始阶段,将方法名、令牌、AST、CFG和DFG等代码特征与其各自的位置信息合并,然后嵌入以派生代码表示向量。在第二阶段,将方法名和标记向量输入到交叉注意机制中。同时,从结构组合图SCG中得到的结构侧特征向量通过图‑注意机制进行处理。通过特征学习可以得到两个精炼的特征向量。最后,将两个增强的特征向量与代码摘要相结合,提供给复合解码器进行训练,得到所需的最终代码摘要。

【技术实现步骤摘要】

本专利技术涉及代码摘要生成,特别涉及一种基于单词替换策略的用于代码汇总的多模态摘要生成方法


技术介绍

1、代码摘要任务的目的是用自然语言简明地描述源代码的意图。在此任务中,模型需要自动生成代码的核心逻辑、功能和操作的简明且信息丰富的代码摘要。代码摘要需要准确、清晰和简洁,使开发人员能够迅速理解代码和实现的目的。

2、近年来,利用深度学习进行神经机器翻译引起了关注自动代码摘要的研究人员的兴趣。他们正在探索一种序列到序列的体系结构,该体系结构包括用于代码表示的编码器和用于生成摘要的解码器。现有的用于代码摘要的深度学习模型经常使用这种编码器-解码器框架,修改这些组件的特定结构。编码器将代码片段转换为底层表示,解码器使用此输出来描述代码片段效果的自然语言摘要。

3、由于源代码是高度结构化的,并且具有层次结构,因此只关注序列信息而不考虑代码的结构来生成代码摘要可能会导致代码的不完整表示。最近的研究成果利用代码中的结构信息,如抽象语法树(ast)、数据流图(dfg)和控制流图(cfg),来增强代码表示。例如,hu等人提出了一种遍历ast的sb本文档来自技高网...

【技术保护点】

1.一种基于单词替换策略的用于代码汇总的多模态摘要生成方法,其特征在于:包括如下步骤:

2.如权利要求1一种基于单词替换策略的用于代码汇总的多模态摘要生成方法,其特征在于:所述S2-1中获得方法名特征表示M'、令牌特征表示S'和SCG的步骤如下:

3.如权利要求2一种基于单词替换策略的用于代码汇总的多模态摘要生成方法,其特征在于:所述S1中所述获得源代码中方法名、令牌、AST、CFG和DFG的位置嵌入的步骤如下:

4.如权利要求3一种基于单词替换策略的用于代码汇总的多模态摘要生成方法,其特征在于:所述S2-2中使用交叉注意机制融合S和M得到最终输出E的...

【技术特征摘要】

1.一种基于单词替换策略的用于代码汇总的多模态摘要生成方法,其特征在于:包括如下步骤:

2.如权利要求1一种基于单词替换策略的用于代码汇总的多模态摘要生成方法,其特征在于:所述s2-1中获得方法名特征表示m'、令牌特征表示s'和scg的步骤如下:

3.如权利要求2一种基于单词替换策略的用于代码汇总的多模态摘要生成方法,其特征在于:所述s1中所述获得源代码中方法名、令牌、ast、cfg和dfg的位置嵌入的步骤如下:

4.如权利要求3一种基于单词替换策略的用于代码汇总的多模态摘要生...

【专利技术属性】
技术研发人员:徐玲程皓罡刘超鄢萌雷晏刘长鑫秦瑞
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1