一种基于对象类型的API补全方法技术

技术编号：29155864 阅读：27 留言：0更新日期：2021-07-06 22:54

本发明专利技术公开了一种基于对象类型的API补全方法，包括以下步骤：基于Github代码托管平台生成Java代码数据集；基于Java代码数据集，使用eclipseAST的API解析抽象语法树，再遍历抽象语法树，生成GROUM，构建一个Java JDK的API调用序列数据集；基于LSTM和注意力机制搭建深度学习训练模型；开发一个基于本发明专利技术模型的IDEA插件；借助插件客户端对当前代码分析后获取API序列和空缺位置，传给服务器，服务器中模型解析结果并返回API补全推荐列表。本发明专利技术旨在为程序开发者在实际编程过程中，提供切实可用的API补全方案，实现了一个基于对象类型的深度学习模型以及IDEA插件用于API补全推荐，提高了API补全的准确性与易用性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于对象类型的API补全方法
本专利技术涉及一种API补全方法，具体涉及一种基于对象类型的API补全方法，属于软件工程和深度学习领域。
技术介绍
在软件开发过程中，为了避免重复工作，提高软件开发效率，软件开发者通常会使用一些第三方的API，即应用编程接口，来协助完成软件的功能。这些第三方库的API通过提供对象、方法以及变量来让软件开发者调用，借以实现一系列特定需求或功能。通过调用这些API，软件开发者可以实现某种功能而无需关注其内部的复杂细节；减少代码出错的概率；提高软件开发效率以及更加便捷地复用代码。然而，学会正确地使用这些API需要耗费软件开发者大量地时间。由于这些第三方库也在不断地迭代更新，其中相当一部分缺少API说明文档。有些即使提供API说明文档的，也有可能存在一些错误。在这种情况下，软件开发者不得不去技术论坛、博客或者Github上寻求帮助，有时甚至需要阅读源代码来寻找这些API的正确使用方法。由于第三方库的庞大数量，即使是使用过的API，比如JDK，最新版本中类已经达到3000多个，一段时间后，软件开发者也很难清晰记住对应API的名称和用法。微软的一项研究表明，67.6％的受访者提到在学习API的过程中受到了资源不足的困扰。软件开发者往往需要多次重复学习过程，极大地影响软件开发的效率。为了帮助软件开发者正确且快捷地使用这些第三方API，一系列API方法补全工具应运而生。API方法补全是指当程序员已经拼写出一个对象名之后，通过查询这个对象所属类别列出所有的方法供程序员选择。一个在IDE...

【技术保护点】
1.一种基于对象类型的API补全方法，其特征在于包含以下步骤：/n步骤1：基于Github代码托管平台生成Java代码数据集。/n步骤2：基于Java代码数据集构建一个Java JDK的API调用序列数据集。/n步骤3：构建一个基于对象类型的API补全模型。/n步骤4：基于API补全模型与数据集得到一个可供用户使用的模型。/n步骤5：输出推荐的API补全。/n

【技术特征摘要】
1.一种基于对象类型的API补全方法，其特征在于包含以下步骤：
步骤1：基于Github代码托管平台生成Java代码数据集。
步骤2：基于Java代码数据集构建一个JavaJDK的API调用序列数据集。
步骤3：构建一个基于对象类型的API补全模型。
步骤4：基于API补全模型与数据集得到一个可供用户使用的模型。
步骤5：输出推荐的API补全。

2.根据权利要求1所述的一种基于对象类型的API补全方法，其特征在于步骤1：中基于Github代码托管平台生成Java代码数据集，具体子步骤包括：
步骤1.1：调用Github提供的接口，搜索按star数排序的前15000个使用Java项目地址。
步骤1.2：使用生产者消费者模型下载代码数据集。

3.根据权利要求1所述的一种基于对象类型的API补全方法，其特征在于步骤2：中基于Java代码数据集构建一个JavaJDK的API调用序列数据集，具体子步骤包括：
步骤2.1：利用eclipseAST的API将每个源代码文件解析成抽象语法树。
步骤2.2：遍历抽象语法树，生成Groum有向无环图。
步骤2.3：基于源代码对应的控制流图，设计一个算法获取API调用序列。首先初始化一个栈，遍历一遍控制流图，将入度为0的节点存入栈中。然后依次取出栈中的节点，将节点放入输出列表中。接着判断该节点的所有子节点入度在减去1之后是否为0，如果为0，将子节点放入栈。循环该过程，直到栈为空为止。接着对输出列表中的节点依次判断是否是方法调用节点，如果是，判断是否是属于JDK包中的API调用。对输出列表中的节点过滤出同时满足这两个条件的节点，最后输出得到API调用序列。

4.根据权利要求1所述的一种基于对象类型的API补全方法，其特征在于步骤3：中构建一个基于对象类型的API补全模型，具体子步骤包括：
步骤3.1：对每个API调用进行编码。使用了两个词嵌入矩阵和用来分别对应对象类型和API的嵌入层，分别对对象类型和API进行编码，然后将这两个词向量表示拼接在一起，得到时间t的输入，显式地告知模型同一个对象内API调用的联系，若两个API调用属于同一个对象，那这两个API调用对应的编码前一半是一样的。
步骤3.2：设计了一个层次型的网络来对API序列进行编码。根据空缺位置将API调用序列划分为三部分：空缺位置之前的API调用，空缺位以及空缺位置之后的...

【专利技术属性】
技术研发人员：葛季栋，李传艺，唐泽，陈恒，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人