一种基于图卷积神经网络的Web服务分类方法技术

技术编号:23161732 阅读:29 留言:0更新日期:2020-01-21 21:59
本发明专利技术提供一种基于图卷积神经网络的Web服务分类方法,所述方法包括:首先,以WEB服务数据集作为基础语料库,将其中的单词和Web服务描述文档作为单个的节点,构建一个基于单词共现和Web服务描述文档词关系的异构图网络;其次,利用图卷积神经网络对异构图网络进行卷积计算,通过卷积预测结果实现对Web服务的分类。本方法只需少量标注Web服务文档就可以获得较强的分类性能,并且可以自主学习到单词和Web服务描述文档之间的嵌入信息,实验证明,本方法的查准率、查全率、F‑measure、纯度和熵等指标相比于传统Web服务分类方法都有显著提升。

【技术实现步骤摘要】
一种基于图卷积神经网络的Web服务分类方法
本专利技术主要涉及Web服务分类相关
,具体是一种基于图卷积神经网络的Web服务分类方法。
技术介绍
随着Web2.0时代的到来以及Web服务技术的发展,Internet上Web服务数量和种类快速增长,如何找到满足用户需求的Web服务变得越来越困难。为了提高Web服务发现和组合的性能,研究人员提出了许多Web服务分类方法,其中有不少研究工作聚焦于基于功能属性的Web服务分类和推荐。已有的研究表明:Web服务功能描述文本通常具有篇幅短、特征稀疏、信息量少等特点,与短文本十分相似。因此,如何将短文本构造成计算机能够理解的形式则成为了短文本分类的主要问题。针对上述问题,一些研究人员利用从WSDL文档中挖掘出的关键特性来实现Web服务的功能分类。该工作,首先从WSDL文档中提取每个Web服务的特征向量;然后,计算提取出的Web服务特征向量之间的相似度;最后,根据计算出的Web服务特征向量相似度,将Web服务分类为功能相似的组。此外,很多研究人员利用LDA(LatentDirichletAlloc本文档来自技高网...

【技术保护点】
1.一种基于图卷积神经网络的Web服务分类方法,其特征在于,所述方法包括:首先,以WEB服务数据集作为基础语料库,将其中的单词和Web服务描述文档作为单个的节点,构建一个基于单词共现和Web服务描述文档词关系的异构图网络,并计算各路径权重;其次,利用图卷积神经网络对异构图网络进行卷积计算,通过卷积预测结果实现对Web服务的分类。/n

【技术特征摘要】
1.一种基于图卷积神经网络的Web服务分类方法,其特征在于,所述方法包括:首先,以WEB服务数据集作为基础语料库,将其中的单词和Web服务描述文档作为单个的节点,构建一个基于单词共现和Web服务描述文档词关系的异构图网络,并计算各路径权重;其次,利用图卷积神经网络对异构图网络进行卷积计算,通过卷积预测结果实现对Web服务的分类。


2.如权利要求1所述的一种基于图卷积神经网络的Web服务分类方法,其特征在于,在构建异构图网络前,首先对Web服务描述文档进行预处理,预处理过程包括:
(1)、使用python中的自然语言处理工具包pandas从所选的Web服务中分别提取WebAPI的相关信息;
(2)、使用python中的自然语言工具包NLTK将单词按照空格进行分词,并且将标点符号和单词分开;
(3)、使用python中的自然语言工具包NLTK中的停用词表去除停用词;
(4)、对于实质相同的单词进行词干化处理;
(5)、提取处理后Web服务描述文档中出现的单词并进行字典化处理;
(6)、将处理后的Web服务描述文档和字典中的每一个单词都表示为One-Hot向量,然后将One-Hot向量构建成特征矩阵。


3.如权利要求1所述的一种基于图卷积神经网络的Web服务分类方法,其特征在于,在构建的异构图网络中,基于Web服务描述文档-单词和单词-单词共同构建节点间的边。


4.如权利要求3所述的一种基于图卷积神经网络的Web服务分类方法,其特征在于,在构建的异构图网络中,采用词频—逆文本频率计算Web服务描述文档节点和单词节点之间边的权重,基于单词在Web服务描述文档中出现的频率判断其分类能力,采用点互信息计算两个单词节点之间边的权重,以衡量两个单词之间的关联度;其中,针对语料库中所有的Web服务描述文档,使用一个固定大小的滑动窗口来收集单词的共现统计信息。


5.如权利要求4所述的一种基于图卷积神经网络的Web服务分类方法,其特征在于,权重的计...

【专利技术属性】
技术研发人员:曹步清叶洪帆
申请(专利权)人:湖南科技大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1