一种面向全局社交服务网的Web服务聚类方法技术

技术编号:16156117 阅读:42 留言:0更新日期:2017-09-06 20:27
一种面向全局社交服务网的Web服务聚类方法,包括如下步骤:第一步:建立一个面向全局社交服务网的Web服务聚类框架,框架分为服务注册模块、服务运行信息采集模块、服务聚类模块和服务可视化模块;第二步:基于所述聚类框架,Web服务聚类方法的步骤如下:步骤2.1:Web服务集成;步骤2.2:Web服务相似度计算;步骤2.3:GSSN聚类;步骤2.4:GSSN可视化;对聚类后的结果进行可视化,辅助用户更为直观的挖掘服务背后的隐藏信息。本发明专利技术提高Web服务聚类精度,具有较好的通用性。

【技术实现步骤摘要】
一种面向全局社交服务网的Web服务聚类方法
本专利技术属于服务计算领域,特别涉及一种面向全局社交服务网的Web服务聚类方法。
技术介绍
Web服务作为一种潜在的分布式服务架构解决方案,在互联网上具有重大影响。随着云计算的兴起,各类Web服务层出不穷,极大地促进了服务计算领域的发展。然而,目前Web服务并没有发挥其应有的价值,截止到2016年11月30日,Web服务编程网站PWeb(ProgrammableWeb)上发布的Web服务已经超过16000个,但是发布在服务组合系统中的Web服务不超过4000个。许多已经发布的Web服务使用效率低下,未能被用户更好的发现、组合及调用,这也为软件开发者有效发现和重用服务资源带来了极大的挑战。造成以上现象原因总结如下:现有的服务描述语言,如WSDL(WebServicesDescriptionLanguage)、WebAPIs(WebApplicationProgrammingInterface)、OWL-S(OntologyWebLanguageforService),只将服务作为一个单独的服务孤岛去研究,并没有考虑服务之间的社交关系,这导致服务的发现和组合变得十分困难。UDDI(UniversalDescription,Discovery,andIntegration)提供了一些服务分类法系统,但这些分类标准并不统一而且较为简单,无法保证所采用的分类方法能够正确反映服务的功能。对于发布在PWeb中的服务,服务消费者只看到该服务相关的文本描述信息,无法直接调用,也未能了解其关联服务的组合情况。Web服务聚类是一种有效促进Web服务发现的技术。然而,现有的服务聚类方法主要关注服务功能属性或QoS(QualityofService)属性,并没有考虑服务在网络中的社交属性,随着服务数量的急速增长,面临着服务发现效率低下等问题。社交属性存在于全局社交服务网GSSN(GlobalSocialServiceNetwork)之中,可用来支持服务发现、服务推荐,即若在全局社交服务网中,服务之间的依赖关系相似,共同依赖着大部分相同的其他服务,则这些服务同属于一类的可能性比较大。目前,学术界分别就聚类和服务社交关系方面已经有所研究:服务聚类研究方面,李征,王健等人提出了一种面向主题的领域服务聚类方法,该方法在对服务进行领域分类的基础上,结合概率、融合领域特性的领域服务聚类模型DSCM,然后基于该模型提出了一种面向主题的聚类方法。田刚,何克清等人提出了面向领域标签辅助的服务聚类方法,该方法建立DTWSC服务聚类模型基础上提高聚类效果。Liu和Wong从WSDL文档中提取了内容,上下文,主机名和服务名称四个特征,以便使用树遍历算法对Web服务进行聚类,通过归一化Google距离(NGD)来测量内容和上下文的相似性。服务社交关系研究方面,W.Chen,I.Paik等人提出了通过构建全局社交服务网来实现更高QoS的服务发现,根据所提出已连接的特定服务原则来构建全局社交服务网。C.Cherifi,V.Labatut等人结合复杂网络来分析服务依赖网络的拓扑性质,如小世界和无标度以及社区结构等特性。郭峰,魏光等人提出一种面向服务Petri网模型及其结构化语义操作,针对服务的各种组合方式,根据所提出的组合算子来构建面向服务Petri网模型-扩展开放网。上述研究中,聚类方面的研究只停留在服务的功能属性、QoS属性、或者领域标签属性上,并没有考虑服务的社交属性,而服务社交关系的研究多侧重于基于图论的理论研究。
技术实现思路
为了克服现有的Web服务聚类方法的精度较低、通用性较差的不足,本专利技术主要用于提高Web服务聚类精度,提供了一种可以对通过WSDL、自然语言等方式描述的Web服务进行聚类,具有较好的通用性的面向全局社交服务网的Web服务聚类方法。本专利技术再有一目的是提供了一种Web服务聚类结果既可以用于Web服务发现、Web服务组合,还可以用于Web服务推荐,具有广泛的适用性的面向全局社交服务网的Web服务聚类方法。本专利技术所采用的技术方案是:一种面向全局社交服务网的Web服务聚类方法,所述方法包括如下步骤:第一步:建立一个面向全局社交服务网的Web服务聚类框架,框架分为服务注册模块、服务运行信息采集模块、服务聚类模块和服务可视化模块;1.1、服务注册模块:用于实现REST服务及SOAP服务信息的注册,将原子服务注册到服务库中,为服务运行QoS采集、服务组合、服务聚类提供相关的服务资源;1.2、服务运行信息采集模块:用于采集原子服务的组合日志以及原子服务的运行QoS信息,并分别记录到服务组合日志库、服务运行QoS信息库中;1.3、服务聚类模块:用于结合原子服务库中的AS、服务组合日志库、服务运行QoS信息库,采用GSSN聚类算法进行聚类,为服务可视化做好准备;1.4、服务可视化模块:用于通过可视化操作界面,基于GSSN,提供结合聚类的可视分析功能,辅助服务消费者更为直观的挖掘服务背后的隐藏信息;第二步:基于所述聚类框架,Web服务聚类方法的步骤如下:步骤2.1:Web服务集成;针对采用WSDL描述的SOAPWeb服务和采用自然语言描述的RESTWeb服务进行集成,所述Web服务描述文档来源于能够被访问的Web服务注册中心或Web服务门户网站;步骤2.2:Web服务相似度计算;根据集成后的Web服务信息,结合服务运行日志中的QoS信息分别进行Web服务相似性计算;相似性计算包括以下4个过程:功能相似度计算、领域标签相似度、QoS相似度、最后综合前三步得到的结果,计算生成综合相似度;步骤2.3:GSSN聚类;服务组合日志库中的信息代表着多个不同的局部社交服务网,记录着每个局部社交服务网中服务节点之间的连接关系,先通过将各个不同的局部社交服务网关联到一起生成一个初始GSSN,之后再结合GSSN聚类算法对GSSN进行进一步优化;GSSN聚类算法分为三阶段:第一阶段,根据服务组合日志建立服务间的局部社交服务网,通过局部社交服务网的互相关联推导出PGSSN,初始PGSSN建立的依据为历史数据,仅能展现已有的服务关系;第二阶段,对在PGSSN中的AS,统计AS的SRHSA,计算社交相似度,根据社交相似度进行聚类不断扩大服务簇;第三阶段,对原子服务库中的AS,采用K-means算法,基于综合相似度进行聚类后,根据服务簇间相似度阀值划分至PGSSN中相似的服务簇中,融合后的新服务簇即为优化后的GSSN;步骤2.4:GSSN可视化;对聚类后的结果进行可视化,辅助用户更为直观的挖掘服务背后的隐藏信息。进一步,所述步骤2.1的过程如下:步骤2.1.1、SOAP服务集成针对SOAP服务,爬取WSDL描述信息后,由于WSDL为一种XML,可采用dom4J等JAVA库对WSDL文档进行解析;由于一个WSDL中可能包含多个AS信息,提取出所有AS的服务名称、Tag标记信息、服务的描述文本、输入输出参数;其中,SOAP服务的WSDL解析过程如下:首先,获得WSDL的根节点,解析出所有的Service节点,获得每个AS的服务名称,根据WSDL中的服务描述信息,提取词语,移除停用词,计算词频得到Tag标记信息,然后解析出每个AS的方法本文档来自技高网
...
一种面向全局社交服务网的Web服务聚类方法

【技术保护点】
一种面向全局社交服务网的Web服务聚类方法,其特征在于:所述方法包括如下步骤:第一步:建立一个面向全局社交服务网的Web服务聚类框架,框架分为服务注册模块、服务运行信息采集模块、服务聚类模块和服务可视化模块;1.1、服务注册模块:用于实现REST服务及SOAP服务信息的注册,将原子服务注册到服务库中,为服务运行QoS采集、服务组合、服务聚类提供相关的服务资源;1.2、服务运行信息采集模块:用于采集原子服务的组合日志以及原子服务的运行QoS信息,并分别记录到服务组合日志库、服务运行QoS信息库中;1.3、服务聚类模块:用于结合原子服务库中的AS、服务组合日志库、服务运行QoS信息库,采用GSSN聚类算法进行聚类,为服务可视化做好准备;1.4、服务可视化模块:用于通过可视化操作界面,基于GSSN,提供结合聚类的可视分析功能,辅助服务消费者更为直观的挖掘服务背后的隐藏信息;第二步:基于所述聚类框架,Web服务聚类方法的步骤如下:步骤2.1:Web服务集成;针对采用WSDL描述的SOAP Web服务和采用自然语言描述的REST Web服务进行集成,所述Web服务描述文档来源于能够被访问的Web服务注册中心或Web服务门户网站;步骤2.2:Web服务相似度计算;根据集成后的Web服务信息,结合服务运行日志中的QoS信息分别进行Web服务相似性计算;相似性计算包括以下4个过程:功能相似度计算、领域标签相似度、QoS相似度、最后综合前三步得到的结果,计算生成综合相似度;步骤2.3:GSSN聚类;服务组合日志库中的信息代表着多个不同的局部社交服务网,记录着每个局部社交服务网中服务节点之间的连接关系,先通过将各个不同的局部社交服务网关联到一起生成一个初始GSSN,之后再结合GSSN聚类算法对GSSN进行进一步优化;GSSN聚类算法分为三阶段:第一阶段,根据服务组合日志建立服务间的局部社交服务网,通过局部社交服务网的互相关联推导出PGSSN,初始PGSSN建立的依据为历史数据,仅能展现已有的服务关系;第二阶段,对在PGSSN中的AS,统计AS的SRHSA,计算社交相似度,根据社交相似度进行聚类不断扩大服务簇;第三阶段,对原子服务库中的AS,采用K‑means算法,基于综合相似度进行聚类后,根据服务簇间相似度阀值划分至PGSSN中相似的服务簇中,融合后的新服务簇即为优化后的GSSN;步骤2.4:GSSN可视化;对聚类后的结果进行可视化,辅助用户更为直观的挖掘服务背后的隐藏信息。...

【技术特征摘要】
1.一种面向全局社交服务网的Web服务聚类方法,其特征在于:所述方法包括如下步骤:第一步:建立一个面向全局社交服务网的Web服务聚类框架,框架分为服务注册模块、服务运行信息采集模块、服务聚类模块和服务可视化模块;1.1、服务注册模块:用于实现REST服务及SOAP服务信息的注册,将原子服务注册到服务库中,为服务运行QoS采集、服务组合、服务聚类提供相关的服务资源;1.2、服务运行信息采集模块:用于采集原子服务的组合日志以及原子服务的运行QoS信息,并分别记录到服务组合日志库、服务运行QoS信息库中;1.3、服务聚类模块:用于结合原子服务库中的AS、服务组合日志库、服务运行QoS信息库,采用GSSN聚类算法进行聚类,为服务可视化做好准备;1.4、服务可视化模块:用于通过可视化操作界面,基于GSSN,提供结合聚类的可视分析功能,辅助服务消费者更为直观的挖掘服务背后的隐藏信息;第二步:基于所述聚类框架,Web服务聚类方法的步骤如下:步骤2.1:Web服务集成;针对采用WSDL描述的SOAPWeb服务和采用自然语言描述的RESTWeb服务进行集成,所述Web服务描述文档来源于能够被访问的Web服务注册中心或Web服务门户网站;步骤2.2:Web服务相似度计算;根据集成后的Web服务信息,结合服务运行日志中的QoS信息分别进行Web服务相似性计算;相似性计算包括以下4个过程:功能相似度计算、领域标签相似度、QoS相似度、最后综合前三步得到的结果,计算生成综合相似度;步骤2.3:GSSN聚类;服务组合日志库中的信息代表着多个不同的局部社交服务网,记录着每个局部社交服务网中服务节点之间的连接关系,先通过将各个不同的局部社交服务网关联到一起生成一个初始GSSN,之后再结合GSSN聚类算法对GSSN进行进一步优化;GSSN聚类算法分为三阶段:第一阶段,根据服务组合日志建立服务间的局部社交服务网,通过局部社交服务网的互相关联推导出PGSSN,初始PGSSN建立的依据为历史数据,仅能展现已有的服务关系;第二阶段,对在PGSSN中的AS,统计AS的SRHSA,计算社交相似度,根据社交相似度进行聚类不断扩大服务簇;第三阶段,对原子服务库中的AS,采用K-means算法,基于综合相似度进行聚类后,根据服务簇间相似度阀值划分至PGSSN中相似的服务簇中,融合后的新服务簇即为优化后的GSSN;步骤2.4:GSSN可视化;对聚类后的结果进行可视化,辅助用户更为直观的挖掘服务背后的隐藏信息。2.如权利要求1所述的一种面向全局社交服务网的Web服务聚类方法,其特征在于:所述步骤2.1的过程如下:步骤2.1.1、SOAP服务集成针对SOAP服务,爬取WSDL描述信息后,由于WSDL为一种XML,可采用dom4J等JAVA库对WSDL文档进行解析;由于一个WSDL中可能包含多个AS信息,提取出所有AS的服务名称、Tag标记信息、服务的描述文本、输入输出参数;其中,SOAP服务的WSDL解析过程如下:首先,获得WSDL的根节点,解析出所有的Service节点,获得每个AS的服务名称,根据WSDL中的服务描述信息,提取词语,移除停用词,计算词频得到Tag标记信息,然后解析出每个AS的方法名及其对应的输入输出参数;最终得到SOAP服务的名称、功能描述、输入输出参数、领域标签信息;步骤2.1.2、REST服务集成REST服务采用基于自然语言描述的HTML文档,HTML文档详细描述了REST服务的名称、功能、输入输出参数、领域标签信息;利用网络爬虫可对HTML文档进行爬取,网页去噪,分词,去停用词,再建立对应网页的数据词典进行服务特征提取,最后得到REST服务的详细信息;如PWeb上的服务详情页满足特定的编码规则,服务名称使用“h1”、“header”语义化HTML5标签表示,tag标签使用CSS样式类“tags”指明,利用这些规则,建立爬取规则库,爬取REST服务相关描述信息进行特征提取,其中,特征提取过程如下:首先,遍历REST服务相关网页,将句子划分为词语,移除无意义的词语如“a”、“the”词汇;其次,建立表示输入、输出、标签、服务描述等规则的数据词典;进一步,在遍历文本过程中,遇到如“output”、“input”数据词典中表征输入输出信息的词语,对其后面的句子进行输入输出特征提取;遇到如“provide”、“allow”数据词典中表征服务功能描述信息词语,对其后面的句子进行描述信息提取;遇到如“category”、“tags”数据词典中表征标签信息的词语,对其后面的句子进行Tag特征提取,最后返回REST服务特征信息。3.如权利要求1所述的一种面向全局社交服务网的Web服务聚类方法,其特征在于:所述步骤2.2中,所述相似性计算过程如下:步骤2.2.1、功能相似度计算服务的聚类首先是功能聚类,即功能相同的服务聚为一簇,而功能大多采用自然语言描述;语义We...

【专利技术属性】
技术研发人员:陆佳炜马俊陈烘肖刚张元鸣徐俊李杰卢成炳
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1