【技术实现步骤摘要】
一种基于全文语义挖掘结合对抗训练的API推荐方法
[0001]本专利技术属于API推荐领域,具体涉及一种基于全文语义挖掘结合对抗训练的API推荐方法。
技术介绍
[0002]近年来,随着面向服务的计算领域的不断扩大,Web API的数量不断增加。当前业务场景的复杂性不像以前那么简单,因此,现有的单一API不再满足我们的要求。在这样的环境中,mashup通常服务于特定的上下文的(短暂的)需求,由最新的、易使用的API组成,已成为集成多种服务以满足复杂需求的重要技术。由于它的这些优点,近年来,mashup和API也被广泛开发并应用于web和移动应用。鉴于大量的API及其惊人的增长速度,mashup开发人员很难在短时间内找到满足所有需求的API,这无疑增加了mashup开发的难度。API推荐基于mashup开发人员的功能需求,以便从大量的API中选择相关的API进行推荐。开发人员希望开发一个mashup,并在执行需求分析后编写一个需求文档,然后将需求分为几个功能。为了找到实现这些功能的合适API,开发人员需要在在线的mashup
‑
API存储平台(如ProgrammableWeb)中搜索具有所需功能的合适的API。然后从这些候选API中选择与需求功能对应的API,以组合mashup所需的功能。近年来,由于开发者在应用程序开发中有效地找到合适的API至关重要,企业和学术界都对API推荐十分关注。
[0003]现实世界中几乎没有相关的标签可以用来有效地集成API;因此,仅用几个关键字描述复杂的开发需求 ...
【技术保护点】
【技术特征摘要】
1.一种基于全文语义挖掘结合对抗训练的API推荐方法,其特征在于,包括:S1:从ProgrammableWeb数据集获取原始数据,并对原始数据进行预处理,得到新数据集;所述原始数据包括:API功能描述文本、mashup功能描述文本、mashup对API的历史调用记录、mashup开发人员的需求文本;S2:根据新数据集利用Doc2Vec技术提取mashup开发人员的需求文本、mashup功能描述文本和API功能描述文本的全文语义,得到mashup和API的特征向量,并根据mashup和API的特征向量计算文本相似度;S3:根据文本相似度计算mashup调用API的概率,根据调用概率获取mashup和API的特征向量的梯度,并更新特征向量;S4:对更新后的mashup和API的特征向量引入抗性训练,得到数据稀疏性缓解后的特征向量;S5:对数据稀疏性缓解后的mashup和API的特征向量采用贝叶斯概率矩阵分解,得到API推荐列表。2.根据权利要求1所述的一种基于全文语义挖掘结合对抗训练的API推荐方法,其特征在于,对原始数据进行预处理,得到新数据集,包括:将原始数据的调用数据作为评级代理,删除空白数据和重复数据,屏蔽一部分原始数据的交互数据后,生成新数据集。3.根据权利要求1所述的一种基于全文语义挖掘结合对抗训练的API推荐方法,其特征在于,所述S2,具体包括:S21:使用Doc2Vec技术对mashup和API的功能描述文本进行文本训练,得到矢量化后的mashup和API的功能描述文本;S22:使用Doc2Vec模型分别提取矢量化后的mashup和API描述文本的特征向量M
i
和A
j
;S23:计算特征向量M
i
和A
j
之间的文本相似度S
ij
。4.根据权利要求3所述的一种基于全文语义挖掘结合对抗训练的API推荐方法,其特征在于,计算特征向量M
i
和A
j
之间的文本相似度,包括:其中,S
ij
表示特征向量M
i
和A
j
之间的文本相似度,M
i
表示mashup需求文本的特征向量,A
j
表示API需求文本的特征向量,
·
表示点积操作,表示计算向量长度操作。5.根据权利要求1所述的一种基于全文语义挖掘结合对抗训练的API推荐方法,其特征在于,所述S3,具体包括:S31:将文本相似度S
ij
作为正则化项计算mashup调用API的概率;S32:根据mashup调用API的概率使用概率矩阵分解的思想获取mashup需求文本的特征向量M
i
和API需求文本的特征向量A
j
的梯度和通过梯度和更新M
i
和A
j
。6.根据权利要求5所述的一种基于全文语义挖掘结合对抗训练的API推荐方法,其特征在于,...
【专利技术属性】
技术研发人员:桑春艳,邓欣燕,廖世根,易星宇,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。