一种基于相似度的语义Web服务聚类标注方法技术

技术编号:13012179 阅读:96 留言:0更新日期:2016-03-16 08:59
本发明专利技术公开一种基于相似度的语义Web服务聚类标注方法,其特征在于包括语义Web服务相似度计算的实现和语义Web服务聚类标注算法的实现两个部分;所述语义Web服务相似度的计算,结合了输入/输出即I/O参数混合相似度计算与服务描述关键字相似度计算的结果,综合得出语义Web服务相似度的计算结果,反映服务功能之间的差异与相似程度;所述的I/O参数能够直接的描述对应服务模块的功能,I/O参数作为从功能角度计算语义Web服务相似度的衡量标准。本发明专利技术能提高相似度计算的准确度,并进一步提升服务发现系统的性能。

【技术实现步骤摘要】

本专利技术属于智能语义网中语义Web服务计算领域,具体涉及基于相似度的语义 Web服务聚类标注方法。
技术介绍
随着物联网的快速崛起,能够通过网络进行操控和数据交换的设备和资源类型日 益增多。思科预测,到2020年,互联网设备的数量将达到500亿左右。随着各种各样物联 网实体设备和应用平台的出现,物联网开始面临异构化实体之间信息交换和协同工作的问 题。 目前有研究尝试把面向服务的跨平台思想引入到物联网中。通过把物理世界中各 个实体的功能用服务化的形式进行描述,从而使得实体的功能能够以统一的服务接口来被 访问和调用,并进一步向外界提供其自身的功能。如此,异构的实体之间就能通过服务接口 进行信息的交互和功能的协同。并且,可以通过服务发现技术,发现满足用户请求的服务 或是服务链,进而查找到相应执行服务功能的实体,最终驱动异质的实体共同协作,完成请 求。由此,服务发现技术为有效地解决异构设备实体之间的协同工作问题提供了解决方案。 除此之外,语义Web的加入能够提高服务发现技术的智能化程度,明确的语义有利于让实 体之间更好的理解彼此的信息含义。语义技术在物联网中的引入能增强物联网平台的数据 融合处理和资源查询能力,来满足复杂多变的应用需求。 然而,在对海量实体功能进行服务化的形式进行描述,突破资源间异质性障碍的 同时,将导致语义Web服务的数量繁多,功能类型冗杂。其中将存在许多相似功能的服务。 所以,需要对存放这些服务的服务库进行聚类,并对每一类的服务标注中心服务,从而提高 服务发现效率。 基于相似度的语义Web服务聚类标注方法指的是基于语义Web服务之间相似度的 计算值,对语义Web服务进行类别划分,从而起到对实体功能进行归类和标注的作用,最终 达到在物联网实体的服务化描述不断增加的同时,提高服务发现的效率。 在服务相似度计算方面,现有的研究成果中,已成型的API有Woogle和0WLS-MX。 Woogle所支持的Web服务结构是非语义的,不能直接应用到语义Web服务相似度的计算中。 相比之下,0WLS-MX包含语义推理模块,支持语义相似度的计算。然而,0WLS-MX采用的是匹 配过滤的方法,用EXACT,PLUGIN,SUBSUMES,SUBSUMED-BY和NEAREEST-NEIGHBOR这五种过 滤器来确定两个服务之间的相似度关系。由此,所得到的相似度为五个固定的关系值,相似 度数值不够细化和准确。目前已有的DoM计算方法,它是运用服务的I/O本体参数计算服 务间相似度的方法。虽然,语义Web服务的1/0本体参数能够很直接的描述对应服务模块 的功能,但是,在计算相似度时,仅有服务的1/0参数,并不能很清晰的描述服务功能的领 域和特征。 在服务聚类算法方面,Christian等人运用AL(AverageLinkage)层次聚类算法 的变种,用中值代替平均值来计算类中心点与其他类之间的距离。然而,分层聚类的方式很 可能导致最终聚类得到的是少数的大类,容易导致服务搜索效率偏低。m!等人提出了多维 度的相似度计算方法,运用Κ-MEANS算法计算服务之间的相似度。Κ-MEANS算法需指定聚类 个数,且初始点的选择对结果的影响很大。Aliz等人提出了基于粒子群算法的语义Web服 务聚类方法。然而该算法需要指定聚类个数以及算法迭代的次数,且该算法容易陷入局部 最优解的困境中。Pop等人提出了基于蚁群算法的服务聚类方法。然而该方法的收敛速度 慢,有可能陷入局部最优的困境之中。
技术实现思路
本专利技术的目的在于克服现有语义Web服务相似度计算技术以及服务聚类标注技 术的不足,提出了一种基于I/O混合及关键字的语义Web服务相似度计算方法,并进一步提 供了一种基于相似度的语义Web服务聚类标注的方法。 本专利技术的目的通过以下技术方案得以实现: -种基于相似度的语义Web服务聚类标注方法,包括如下两个步骤: 1)语义Web服务相似度计算; 2)基于相似度计算结果,运用算法对语义Web服务进行聚类和中心服务标注; 上述步骤1)所述计算方法,包括两个部分:1/0混合参数相似度计算,以及关键字 相似度计算。 所述语义Web服务相似度的计算,结合了输入/输出即I/O参数混合相似度计算 与服务描述关键字相似度计算的结果,综合得出语义Web服务相似度的计算结果,使之更 能准确反映服务功能之间的差异与相似程度; 所述的I/O参数能够很直接的描述对应服务模块的功能。I/O参数通常作为从功 能角度计算语义Web服务相似度的衡量标准。 上述步骤1)所述计算方法,计算公式 其中,Sim(Sl,S2)表示语义Web服务S1与S2之间的相似度数值,Sim_ Func(Sl,S2)表示语义Web服务S1与S2之间的I/O混合参数相似度,Sim_Key(Sl,S2)表 示语义Web服务S1与S2之间的关键字相似度。 上述步骤1)所述的I/O混合参数相似度,其所表示的含义如图1所示。计算公式 为: 其中,SimInputs(Sl,S2)是语义Web服务S1和S2的输入参数相似度, Sinwputs(Sl,S2)为输出参数相似度。其中, SimIn(Sl,S2)表示语义Web服务S1的输入参数对于语义Web服务S2的输入参数之 间的相似度。SimIn (S2,S1)反之,表示语义Web服务S2的输入本体参数对于语义Web服务S1的输入本体参数之间的相似度。其中, 如上式所示,Sin^JCLC2J表示语义Web服务S1的单个输入参数Ch与语义Web 服务S2的单个输入或输出参数C2#间的相似度。将概念Ch与语义Web服务S2的每一个输入和输出本体概念进行匹配,得到匹配度最大的 一对概念的相似度数值。而概念之间的匹配度计算公式为: sim(X,Y)的含义是Y对于X的相似程度。α是一个调节权重的参数,ae。 D= {x}表示对象空间,而X、Y是D中的模糊集,sim:UXU- 是积空间UXU上的模 糊相似关系。应用该公式计算能够得到两个概念之间的相似度。 上述步骤1)所述关键字相似度中的关键字,指的是用于描述语义Web服务的owls 服务描述文件文本标题内容以及profile:textDescription中文本词汇的交集。 上述步骤1)所述的语义Web服务的关键字相似度,计算公式为 其中,SimWOTd(Sl,S2)为对于语义Web服务S1,它与语义Web服务S2之间的关键 字相似度;SimWOTd(Sl,S2)为对于语义Web服务S2,它与语义Web服务S1之间的关键字相 似度。 TGdJ表示的是关键字klj^TF-IDF加权值。TF-IDF是一种对字词在一段文本 中的重要程度进行统计和计算的方法。其中, 10?;表不关键字i的逆向文件频率(inversedocumentfrequency,IDF)。IDF表 示一个词语在所有文件中的重要程度。在这里,由于只考虑关键字在相应服务描述文件中 的重要性,而不考虑关键字的普遍性,所以IDF1= 1。:表示关键字i在文档d中的TF词频(TermFrequency),即出现的频率。在 本文中,文档d指的是语义Web服务描述文件,而关键字i指的是通过textdescription和 语义Web服务名本文档来自技高网
...

【技术保护点】
一种基于相似度的语义Web服务聚类标注方法,其特征在于包括语义Web服务相似度计算的实现和语义Web服务聚类标注算法的实现两个部分;所述语义Web服务相似度的计算,结合了输入/输出即I/O参数混合相似度计算与服务描述关键字相似度计算的结果,综合得出语义Web服务相似度的计算结果,反映服务功能之间的差异与相似程度;所述的I/O参数能够直接的描述对应服务模块的功能,I/O参数作为从功能角度计算语义Web服务相似度的衡量标准。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘发贵邓达成彭晨漪李平
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1