一种基于全文语义挖掘结合对抗训练的API推荐方法技术

技术编号：37362853 阅读：34 留言：0更新日期：2023-04-27 07:10

本发明专利技术属于API推荐领域，具体涉及一种基于全文语义挖掘结合对抗训练的API推荐方法，包括：对原始数据进行预处理；利用自然语言处理技术提取需求文档、mashup描述和API描述的全文语义，并计算文本相似度；根据文本相似度计算mashup调用API的概率，根据概率获取mashup和API的特征向量的梯度，并更新特征向量；对更新后的mashup和API的特征向量引入抗性训练，得到数据稀疏性缓解后的特征向量；对数据稀疏性缓解后的mashup和API的特征向量采用贝叶斯概率矩阵分解，得到API推荐列表。本发明专利技术有助于API平台有效挖掘开发人员的个性化开发需求，减轻开发人员的工作量，同时提高了推荐精度。荐精度。荐精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于全文语义挖掘结合对抗训练的API推荐方法

[0001]本专利技术属于API推荐领域，具体涉及一种基于全文语义挖掘结合对抗训练的API推荐方法。

技术介绍

[0002]近年来，随着面向服务的计算领域的不断扩大，Web API的数量不断增加。当前业务场景的复杂性不像以前那么简单，因此，现有的单一API不再满足我们的要求。在这样的环境中，mashup通常服务于特定的上下文的(短暂的)需求，由最新的、易使用的API组成，已成为集成多种服务以满足复杂需求的重要技术。由于它的这些优点，近年来，mashup和API也被广泛开发并应用于web和移动应用。鉴于大量的API及其惊人的增长速度，mashup开发人员很难在短时间内找到满足所有需求的API，这无疑增加了mashup开发的难度。API推荐基于mashup开发人员的功能需求，以便从大量的API中选择相关的API进行推荐。开发人员希望开发一个mashup，并在执行需求分析后编写一个需求文档，然后将需求分为几个功能。为了找到实现这些功能的合适API，开发人员需要在在线的mashup<br/>‑
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于全文语义挖掘结合对抗训练的API推荐方法，其特征在于，包括：S1：从ProgrammableWeb数据集获取原始数据，并对原始数据进行预处理，得到新数据集；所述原始数据包括：API功能描述文本、mashup功能描述文本、mashup对API的历史调用记录、mashup开发人员的需求文本；S2：根据新数据集利用Doc2Vec技术提取mashup开发人员的需求文本、mashup功能描述文本和API功能描述文本的全文语义，得到mashup和API的特征向量，并根据mashup和API的特征向量计算文本相似度；S3：根据文本相似度计算mashup调用API的概率，根据调用概率获取mashup和API的特征向量的梯度，并更新特征向量；S4：对更新后的mashup和API的特征向量引入抗性训练，得到数据稀疏性缓解后的特征向量；S5：对数据稀疏性缓解后的mashup和API的特征向量采用贝叶斯概率矩阵分解，得到API推荐列表。2.根据权利要求1所述的一种基于全文语义挖掘结合对抗训练的API推荐方法，其特征在于，对原始数据进行预处理，得到新数据集，包括：将原始数据的调用数据作为评级代理，删除空白数据和重复数据，屏蔽一部分原始数据的交互数据后，生成新数据集。3.根据权利要求1所述的一种基于全文语义挖掘结合对抗训练的API推荐方法，其特征在于，所述S2，具体包括：S21：使用Doc2Vec技术对mashup和API的功能描述文本进行文本训练，得到矢量化后的mashup和API的功能描述文本；S22：使用Doc2Vec模型分别提取矢量化后的mashup和API描述文本的特征向量M
i
和A
j
；S23：计算特征向量M
i
和A
j
之间的文本相似度S
ij
。4.根据权利要求3所述的一种基于全文语义挖掘结合对抗训练的API推荐方法，其特征在于，计算特征向量M
i
和A
j
之间的文本相似度，包括：其中，S
ij
表示特征向量M
i
和A
j
之间的文本相似度，M
i
表示mashup需求文本的特征向量，A
j
表示API需求文本的特征向量，
·
表示点积操作，表示计算向量长度操作。5.根据权利要求1所述的一种基于全文语义挖掘结合对抗训练的API推荐方法，其特征在于，所述S3，具体包括：S31：将文本相似度S
ij
作为正则化项计算mashup调用API的概率；S32：根据mashup调用API的概率使用概率矩阵分解的思想获取mashup需求文本的特征向量M
i
和API需求文本的特征向量A
j
的梯度和通过梯度和更新M
i
和A
j
。6.根据权利要求5所述的一种基于全文语义挖掘结合对抗训练的API推荐方法，其特征在于，...

【专利技术属性】
技术研发人员：桑春艳，邓欣燕，廖世根，易星宇，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人