基于QoS属性预测和纠错的有监督Web服务发现方法及系统技术方案

技术编号:8685729 阅读:227 留言:0更新日期:2013-05-09 05:17
本发明专利技术公开了一种基于QoS属性预测和纠错的有监督Web服务发现方法及系统,主要用于解决开放网络环境下准确、高效地发现满足用户需求的可信Web服务,从而为高可信服务应用系统的构建提供重要的技术支撑。本发明专利技术一方面采用矩阵补全技术对缺失或失真的服务QoS属性进行预测或纠错,使得基于QoS属性的可信服务发现得以有效地实施;另一方面将服务的先验类别信息引入服务表示的特征提取阶段,增强了服务表示的区分性和查询匹配的准确性。真实Web服务数据集上的评测结果表明,本发明专利技术不仅具有较高的服务发现效率和精度,而且实现简单,系统灵活,代价低,易推广。

【技术实现步骤摘要】

本专利技术属于Web服务领域,主要实现一种基于QoS属性预测和纠错的有监督Web服务发现方法以及由此方法架构出的系统。
技术介绍
随着互联网技术的应用日益广泛和逐渐深入,人们已不再满足于仅仅简单使用网络资源,如浏览网页、收发邮件等,而是一方面希望能够简捷、快速的将自己开发的软件资源发布在互联网上供他人复用,另一方面也希望能方便地复用现有的软件资源以满足自己个性化的需求。软件服务化是实现这种软件资源复用的有效途径,而面向服务的体系架构(Service Oriented Architecture, S0A)为软件服务化提供了理论支持,很大程度上推动了软件资源的复用、集成、以及网络资源的多样化。Web服务作为SOA架构的一种具体实现方式,具有良好的封装性和广泛的适用性,已经成为企业信息规划、动态电子商务和应用集成的重要支撑技术。近年来,互联网上出现了大量的Web服务,这些服务正在构成云计算平台的基础。但是,由于网络环境的开放、服务资源的快速演变以及用户需求的变更和使用模式的偏好等,导致服务具有很大的不确定性和不可控性,这些不确定性和不可控性的程度往往通过服务质量(Quality of Service, QoS)属性来表征。常用的QoS属性包括响应时间、用户满意度、服务价格、可用性、可扩展性、并发处理能力、准确性、安全性、可靠性、吞吐Jl-寸寸O由于Web服务由分布于网络上的众多组织和个人独立开发,其数量众多且增长迅速,因此存在很多提供相似或相同功能的服务。当服务使用者进行服务选择时,不仅应考虑服务所能满足的功能性需求,而且应考虑服务所能满足的非功能性需求,即服务QoS属性。近年来,有很多关于QoS感知的Web服务发现方法的研究,但是这些研究基于一个共同的假设前提,那就是假定用户拥有候选服务的全部QoS信息。但是,在真实的服务消费环境中这种假设并不成立。这是因为用户获取服务QoS信息的一个重要途径是基于历史调用信息,但由于网络上存在海量的服务资源,如果服务使用者试图通过穷尽调用所有的候选服务获取服务QoS信息,不仅需要耗费大量的时间,而且要占用大量的网络资源。因此,在实际的应用场景中,服务用户所能获取的QoS信息往往是不全面的,QoS属性的缺失或者失真严重影响了基于QoS的Web服务发现的准确性和可信性。由此可见,提供精确的QoS属性预测是准确发现和选取可信Web服务的重要前提和保障。现有的服务QoS属性预测方法主要有两类:一类是基于协同过滤的QoS属性预测方法,该方法以收集到的用户-服务QoS采样矩阵为基础,通过采用Pearson相关系数分别计算用户之间和Web服务之间的相似程度对目标用户进行个性化的QoS属性预测。然而,Pearson相关系数一般用于度量数据之间的线性相关关系,并不能很好地解释客观QoS数据之间的相似性;另一类是基于矩阵分解的QoS属性预测方法,该方法同样以收集到的QoS采样信息为基础,通过采用矩阵分解技术将QoS采样矩阵分解为服务特征向量和用户特征向量。然而,由于QoS数据的稀疏性,从服务特征向量和用户特征向量中获得的信息还不足以提供精确的QoS属性预测。更为重要的是,现有的服务QoS属性预测方法都假设已知的QoS采样信息是真实可信的。但实际上采样到的QoS信息不可避免地会受到少量的结构化噪声污染。例如:少数服务调用者为了自身的利益恶意反馈一些失真的QoS采样信息,在QoS采样矩阵中体现为该服务调用者对应的行存在结构化噪声。因此,在进行QoS属性预测时,研究如何减少由结构化噪声污染带来的负面影响是非常有必要的。另一方面,虽然已有一些聚类优化的服务发现方法被提出来,但这些方法的共同点是仅仅利用分类信息来缩小服务查询的搜索空间,从而提高服务发现的速度。这些服务发现方法鲜有利用服务的先验类别信息来改进服务表示的区分性,它们均无一例外地采用了无监督的服务表不机制,即 tf.idf (term frequency-1nverse document frequency)术语加权机制。该机制并没有利用已有的服务类别标记信息,即使所抽取的特征向量能够很好地表达服务的语义信息,但由于缺乏类判别信息,也将导致所抽取的高维特征向量在特征空间中趋同而变得不可分,这显然是不利于服务发现和查找的。因此,针对上述两点不足,本专利技术一方面引入机器学习领域流行的矩阵补全技术,针对服务QoS采样矩阵中存在的行结构化噪声问题,提出了一种I2,i范数正则化约束的矩阵补全算法来对缺失的QoS信息进行预测,同时对失真的QoS信息进行纠错;另一方面结合有监督的服务特征提取方法,将服务的先验类别信息引入服务表示中,实现了一个QoS感知的有监督Web服务发现原型系统。真实Web服务数据集上的评测结果验证了本专利技术的有效性。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于QoS属性预测和纠错的有监督Web服务发现方法,用于解决开放网络环境下准确、高效地发现满足用户需求的可信Web服务,从而为高可信服务应用系统的构建提供重要的技术支撑。本专利技术的提出基于如下两个基本事实:(1)用户-服务QoS矩阵满足近似低秩特性,即该矩阵的奇异值呈幂式衰减。由于QoS属性具有较高的空间相关性,相邻地区的用户或相邻地区部署的服务共同使用相同或者类似的IT基础设施(网络带宽和网络拓扑结构等),使得用户-服务QoS矩阵通常表现出良好的近似低秩特性。(2)矩阵补全理论表明,虽然一般情况下从矩阵的采样元素预测未知元素是不可能的,但如果矩阵具有低秩或近似低秩特性,采用矩阵补全技术对采样矩阵的缺失元素进行预测和对含噪元素进行纠错在理论上是可行的。本专利技术为解决所述的技术问题采用如下技术方案:一种基于QoS属性预测和纠错的有监督Web服务发现方法,该方法适用于用户-服务QoS矩阵满足近似低秩特性的情况下,具体步骤包括:步骤(l)QoS数据收集中心按QoS属性类别收集服务调用者反馈的QoS历史数据,对其进行预处理后产生用户-服务QoS采样矩阵;步骤(2)采用矩阵补全技术对用户-服务QoS采样矩阵中缺失的QoS属性值进行预测,同时对失真的QoS属性值进行纠错,生成QoS完全矩阵;步骤(3)服务提供者发布所开发Web服务的WSDL文档至服务注册中心,服务注册中心对所收集的WSDL文档进行分类;步骤(4)对服务注册中心的分类WSDL文档进行有监督特征提取,生成低维紧致的Web服务语义特征表示向量;步骤(5)服务查询者构造Web服务查询请求描述文档提交给服务发现中介;步骤(6)服务发现中介根据Web服务查询请求描述文档计算每一个候选服务与用户总需求的匹配度并按匹配度大小排序;步骤(7)服务发现中介将符合查询请求的前η个查询结果包装成HTML页面格式,通过查询结果展示模块反馈给服务查询者,η为自然数;步骤(8)服务查询者根据查询结果选择并调用相应的Web服务,同时将获得的QoS信息反馈给QoS数据收集中心。进一步的,前述的基于QoS属性预测和纠错的有监督Web服务发现方法,步骤(2)所述的采用矩阵补全技术对缺失的QoS属性值进行预测,同时对失真的QoS属性值进行纠错,生成QoS完全矩阵,包括以下步骤:(2-1)根据矩阵补全理论将QoS属性预测和纠错问题建模为:本文档来自技高网
...

【技术保护点】
一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于:该方法适用于用户?服务QoS矩阵满足近似低秩特性的情况下,具体步骤包括:步骤(1)QoS数据收集中心按QoS属性类别收集服务调用者反馈的QoS历史数据,对其进行预处理后产生用户?服务QoS采样矩阵;步骤(2)采用矩阵补全技术对用户?服务QoS采样矩阵中缺失的QoS属性值进行预测,同时对失真的QoS属性值进行纠错,生成QoS完全矩阵;步骤(3)服务提供者发布所开发Web服务的WSDL文档至服务注册中心,服务注册中心对所收集的WSDL文档进行分类;步骤(4)对服务注册中心的分类WSDL文档进行有监督特征提取,生成低维紧致的Web服务语义特征表示向量;步骤(5)服务查询者构造Web服务查询请求描述文档提交给服务发现中介;步骤(6)服务发现中介根据Web服务查询请求描述文档计算每一个候选服务与用户总需求的匹配度并按匹配度大小排序;步骤(7)服务发现中介将符合查询请求的前n个查询结果包装成HTML页面格式,通过查询结果展示模块反馈给服务查询者,n为自然数;步骤(8)服务查询者根据查询结果选择并调用相应的Web服务,同时将获得的QoS信息反馈给QoS数据收集中心。...

【技术特征摘要】
1.一种基于Q0S属性预测和纠错的有监督Web服务发现方法,其特征在于:该方法适用于用户-服务QoS矩阵满足近似低秩特性的情况下,具体步骤包括: 步骤(l)QoS数据收集中心按QoS属性类别收集服务调用者反馈的QoS历史数据,对其进行预处理后产生用户-服务QoS采样矩阵; 步骤(2)采用矩阵补全技术对用户-服务QoS采样矩阵中缺失的QoS属性值进行预测,同时对失真的QoS属性值进行纠错,生成QoS完全矩阵; 步骤(3)服务提供者发布所开发Web服务的WSDL文档至服务注册中心,服务注册中心对所收集的WSDL文档进行分类; 步骤(4)对服务注册中心的分类WSDL文档进行有监督特征提取,生成低维紧致的Web服务语义特征表示向量; 步骤(5)服务查询者构造Web服务查询请求描述文档提交给服务发现中介; 步骤(6)服务发现中介根据Web服务查询请求描述文档计算每一个候选服务与用户总需求的匹配度并按匹配度大小排序; 步骤(7)服务发现中介将符合查询请求的前η个查询结果包装成HTML页面格式,通过查询结果展示模块反馈给服务查询者,η为自然数; 步骤(8)服务查询者根据查询结果选择并调用相应的Web服务,同时将获得的QoS信息反馈给QoS数据收集中心。2.按权利要求1所述的一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于,步骤(2)具体包括如下步骤: (2-1)根据矩阵补全理论将QoS属性预测和纠错问题建模为:3.按权利要求2所述的一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于:在步骤(2-2)中,将采样矩阵Q、投影算子?。、正则化因子α、参数ξ作为所述I2,!范数正则化约束的结构化噪声矩阵补全算法的输入,将QoS完全矩阵X,噪声矩阵Z作为所述I2,i范数正则化约束的结构化噪声矩阵补全算法的输出,其中,参数ξ为1Χ10_6 ;具体计算过程如下: 步骤(a):将公式(I)松弛为QoS属性预测和纠错问题的一个近似问题:4.按权利要求1所述的一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于:步骤(4)具体包括如下步骤: (4-1)使用开源软件WSDL4J对服务注册中心的WSDL文档进行服务解析; (4-2)对解析后的WSDL文档进行分词、缩写词补全、拼写错误纠正、停用词过滤和词干抽取,生成Web服务特征词项空间; (4-3)基于步骤(4-2)生成的Web服务特征词项空间,引入先验类别信息,利用有监督的词频tf-逆文档频率idf-逆类别频率icf术语加权机制生成Web服务特征表示向量;(4-4)基于隐含语义索引技术对步骤(4-3)生成的Web服务特征表示向量进行词义消岐和概念语义空间降维,生成低维紧致的Web服务语义特征表示向量; (4-5)对步骤(4-4)生成的Web服务语义特征表示向量进行规一化处理,将每个向量的长度均设定为I。5.按权利要求1所述的一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于:步骤(5)所述Web服务查询请求描述文档的内...

【专利技术属性】
技术研发人员:陈蕾杨庚陈正宇王传栋朱薇莫燕章
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1