一种面向全局社交服务网的Web服务聚类方法技术

技术编号：16156117 阅读：55 留言：0更新日期：2017-09-06 20:27

一种面向全局社交服务网的Web服务聚类方法，包括如下步骤：第一步：建立一个面向全局社交服务网的Web服务聚类框架，框架分为服务注册模块、服务运行信息采集模块、服务聚类模块和服务可视化模块；第二步：基于所述聚类框架，Web服务聚类方法的步骤如下：步骤2.1：Web服务集成；步骤2.2：Web服务相似度计算；步骤2.3：GSSN聚类；步骤2.4：GSSN可视化；对聚类后的结果进行可视化，辅助用户更为直观的挖掘服务背后的隐藏信息。本发明专利技术提高Web服务聚类精度，具有较好的通用性。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向全局社交服务网的Web服务聚类方法
本专利技术属于服务计算领域，特别涉及一种面向全局社交服务网的Web服务聚类方法。
技术介绍
Web服务作为一种潜在的分布式服务架构解决方案，在互联网上具有重大影响。随着云计算的兴起，各类Web服务层出不穷，极大地促进了服务计算领域的发展。然而，目前Web服务并没有发挥其应有的价值，截止到2016年11月30日，Web服务编程网站PWeb(ProgrammableWeb)上发布的Web服务已经超过16000个，但是发布在服务组合系统中的Web服务不超过4000个。许多已经发布的Web服务使用效率低下，未能被用户更好的发现、组合及调用，这也为软件开发者有效发现和重用服务资源带来了极大的挑战。造成以上现象原因总结如下：现有的服务描述语言，如WSDL(WebServicesDescriptionLanguage)、WebAPIs(WebApplicationProgrammingInterface)、OWL-S(OntologyWebLanguageforService)，只将服务作为一个单独的服务孤岛去研究，并没有考虑服务之间...
一种面向全局社交服务网的Web服务聚类方法

【技术保护点】
一种面向全局社交服务网的Web服务聚类方法，其特征在于：所述方法包括如下步骤：第一步：建立一个面向全局社交服务网的Web服务聚类框架，框架分为服务注册模块、服务运行信息采集模块、服务聚类模块和服务可视化模块；1.1、服务注册模块：用于实现REST服务及SOAP服务信息的注册，将原子服务注册到服务库中，为服务运行QoS采集、服务组合、服务聚类提供相关的服务资源；1.2、服务运行信息采集模块：用于采集原子服务的组合日志以及原子服务的运行QoS信息，并分别记录到服务组合日志库、服务运行QoS信息库中；1.3、服务聚类模块：用于结合原子服务库中的AS、服务组合日志库、服务运行QoS信息库，采用GSSN...

【技术特征摘要】
1.一种面向全局社交服务网的Web服务聚类方法，其特征在于：所述方法包括如下步骤：第一步：建立一个面向全局社交服务网的Web服务聚类框架，框架分为服务注册模块、服务运行信息采集模块、服务聚类模块和服务可视化模块；1.1、服务注册模块：用于实现REST服务及SOAP服务信息的注册，将原子服务注册到服务库中，为服务运行QoS采集、服务组合、服务聚类提供相关的服务资源；1.2、服务运行信息采集模块：用于采集原子服务的组合日志以及原子服务的运行QoS信息，并分别记录到服务组合日志库、服务运行QoS信息库中；1.3、服务聚类模块：用于结合原子服务库中的AS、服务组合日志库、服务运行QoS信息库，采用GSSN聚类算法进行聚类，为服务可视化做好准备；1.4、服务可视化模块：用于通过可视化操作界面，基于GSSN，提供结合聚类的可视分析功能，辅助服务消费者更为直观的挖掘服务背后的隐藏信息；第二步：基于所述聚类框架，Web服务聚类方法的步骤如下：步骤2.1：Web服务集成；针对采用WSDL描述的SOAPWeb服务和采用自然语言描述的RESTWeb服务进行集成，所述Web服务描述文档来源于能够被访问的Web服务注册中心或Web服务门户网站；步骤2.2：Web服务相似度计算；根据集成后的Web服务信息，结合服务运行日志中的QoS信息分别进行Web服务相似性计算；相似性计算包括以下4个过程：功能相似度计算、领域标签相似度、QoS相似度、最后综合前三步得到的结果，计算生成综合相似度；步骤2.3：GSSN聚类；服务组合日志库中的信息代表着多个不同的局部社交服务网，记录着每个局部社交服务网中服务节点之间的连接关系，先通过将各个不同的局部社交服务网关联到一起生成一个初始GSSN，之后再结合GSSN聚类算法对GSSN进行进一步优化；GSSN聚类算法分为三阶段：第一阶段，根据服务组合日志建立服务间的局部社交服务网，通过局部社交服务网的互相关联推导出PGSSN，初始PGSSN建立的依据为历史数据，仅能展现已有的服务关系；第二阶段，对在PGSSN中的AS，统计AS的SRHSA，计算社交相似度，根据社交相似度进行聚类不断扩大服务簇；第三阶段，对原子服务库中的AS，采用K-means算法，基于综合相似度进行聚类后，根据服务簇间相似度阀值划分至PGSSN中相似的服务簇中，融合后的新服务簇即为优化后的GSSN；步骤2.4：GSSN可视化；对聚类后的结果进行可视化，辅助用户更为直观的挖掘服务背后的隐藏信息。2.如权利要求1所述的一种面向全局社交服务网的Web服务聚类方法，其特征在于：所述步骤2.1的过程如下：步骤2.1.1、SOAP服务集成针对SOAP服务，爬取WSDL描述信息后，由于WSDL为一种XML，可采用dom4J等JAVA库对WSDL文档进行解析；由于一个WSDL中可能包含多个AS信息，提取出所有AS的服务名称、Tag标记信息、服务的描述文本、输入输出参数；其中，SOAP服务的WSDL解析过程如下：首先，获得WSDL的根节点，解析出所有的Service节点，获得每个AS的服务名称，根据WSDL中的服务描述信息，提取词语，移除停用词，计算词频得到Tag标记信息，然后解析出每个AS的方法名及其对应的输入输出参数；最终得到SOAP服务的名称、功能描述、输入输出参数、领域标签信息；步骤2.1.2、REST服务集成REST服务采用基于自然语言描述的HTML文档，HTML文档详细描述了REST服务的名称、功能、输入输出参数、领域标签信息；利用网络爬虫可对HTML文档进行爬取，网页去噪，分词，去停用词，再建立对应网页的数据词典进行服务特征提取，最后得到REST服务的详细信息；如PWeb上的服务详情页满足特定的编码规则，服务名称使用“h1”、“header”语义化HTML5标签表示，tag标签使用CSS样式类“tags”指明，利用这些规则，建立爬取规则库，爬取REST服务相关描述信息进行特征提取，其中，特征提取过程如下：首先，遍历REST服务相关网页，将句子划分为词语，移除无意义的词语如“a”、“the”词汇；其次，建立表示输入、输出、标签、服务描述等规则的数据词典；进一步，在遍历文本过程中，遇到如“output”、“input”数据词典中表征输入输出信息的词语，对其后面的句子进行输入输出特征提取；遇到如“provide”、“allow”数据词典中表征服务功能描述信息词语，对其后面的句子进行描述信息提取；遇到如“category”、“tags”数据词典中表征标签信息的词语，对其后面的句子进行Tag特征提取，最后返回REST服务特征信息。3.如权利要求1所述的一种面向全局社交服务网的Web服务聚类方法，其特征在于：所述步骤2.2中，所述相似性计算过程如下：步骤2.2.1、功能相似度计算服务的聚类首先是功能聚类，即功能相同的服务聚为一簇，而功能大多采用自然语言描述；语义We...

【专利技术属性】
技术研发人员：陆佳炜，马俊，陈烘，肖刚，张元鸣，徐俊，李杰，卢成炳，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人