一种基于随机游走的Web服务质量预测方法技术

技术编号:12426082 阅读:58 留言:0更新日期:2015-12-03 11:28
本发明专利技术公开了一种基于随机游走的Web服务质量预测方法,步骤包括:基于用户位置计算用户和用户之间的距离;为每个用户选择近邻用户构成邻域、并连接邻域用户构建用户关系网络;计算用户关系网络中用户和用户、服务和服务之间的相似度;计算用户关系网络中每一条边的权重;针对源用户所请求的目标服务,从源用户开始分别进行多次查找关于目标服务i的随机游走,每一次随机游走中的每一跳是根据一定概率随机选择下一跳节点,每次游走结束后返回一个QoS值;综合所有QoS值计算源用户相对目标服务的质量预测值。本发明专利技术能平衡Web服务质量预测的覆盖率和预测精度,具有预测准确、成功率高、通用性好、可评估置信度和可解释性好的优点。

【技术实现步骤摘要】

本专利技术涉及Web服务质量预测技术,具体涉及一种用于Web服务选择或推荐的基 于随机游走的Web服务质量预测方法。
技术介绍
Web服务是自描述、自包含的可用网络模块,用来帮助实现通过远程调用来完成不 同机器之间的交互操作,并成为了构造分布式系统、模块化应用程序和面向服务应用集成 的主要技术,如电子商务、车载系统、多媒体服务等。随着网络上Web服务数量的快速增长, 为用户推荐最优的服务变得更具有挑战性。为了能在大量的可供选择的功能相同的Web服 务集中找到最优的服务,Web服务的质量,即QoS(Quality of Service)被广泛用来描述和 评价Web服务的非功能属性。Web服务的QoS常常被定义为一系列用户感知的属性,典型的 有响应时间、吞吐量、可靠性等。由于QoS在成功建立面向服务的应用中的至关重要性,基 于QoS的Web服务选择和推荐方法成为近几年的一个研究热点。 传统的基于QoS的Web服务选择的研究都有一个通用的假设,即所有Web服务的 QoS值都是可用且准确的。然而,在现实中,这个前提不一定是真实的,用户想要总能获取到 服务的QoS值是不切实际的。这是由于Web服务的QoS值容易受到不可预测的网络环境和 用户环境(例如:用户位置,用户网络条件等)的影响,从而使得不同的用户在相同的Web 服务上所观察到的QoS值不同。换而言之,用户在进行服务选择时,不能直接使用另一个用 户对服务的QoS评价值。并且,由于现实中Web服务的调用既耗时间又耗资源,因此用户想 要通过自己调用Web服务来评价所有候选服务以获取QoS信息是不实际的。此外由于服务 用户需要评价的候选服务过多,且还有一些合适的Web服务未被发现,使得服务的QoS信息 大量缺失。针对这些未知的QoS进行预测是基于QoS的Web服务选择和推荐的重要依据。 现有技术中,最常用的预测QoS缺失值的方法存在以下缺陷:1)由于Web服务和 用户数量的剧增,存在数据稀疏性问题,使得协同过滤方法难以解决"冷启动"问题,即某用 户从未调用过任何服务,或某服务从未被任何用户调用过。2)有研究表明由于位置与服务 的QoS存在相关性,处于同一或邻近区域的用户在相同服务上会有相似的QoS体验。因此, 可以利用用户的位置来找到源用户的邻居,然后再根据这些邻居的历史QoS信息来进行推 荐,可以有效的解决QoS数据稀疏问题。然而,仅考虑用户位置来预测QoS可能降低预测精 度。
技术实现思路
本专利技术要解决的技术问题是:针对现有技术的上述问题,提供一种能在覆盖率和 预测精度间得到显著好的平衡,预测成功率高、通用性好、可评估置信度和可解释性好的基 于随机游走的Web服务质量预测方法。 为了解决上述技术问题,本专利技术采用的技术方案为: -种基于随机游走的Web服务质量预测方法,步骤包括: 1)根据Web服务QoS数据集中用户的位置信息计算用户和用户之间的物理距离; 2)为每个用户选择物理距离最近的K个近邻用户作为该用户的邻域; 3)为每个用户连接各自邻域的用户构建用户关系网络G ; 4)针对用户关系网络G,计算用户和用户之间的相似度、服务和服务之间的相似 度; 5)根据所述用户和用户之间的物理距离、用户和用户之间的相似度计算用户关系 网络G中每一条边的权重; 6)针对源用户u。所请求的目标服务i,从源用户u。开始分别进行多次查找关于目 标服务i的随机游走,每一次随机游走中的每一跳基于用户关系网络G中每一条边的权重 确定下一跳的用户选择概率,并根据所述用户选择概率从当前跳的用户u的邻域NUu中随 机选择一个用户V作为本次随机游走的下一跳节点,最终在找到调用过目标服务i或相似 服务的用户后结束本次游走并返回一个QoS值; 7)综合所有随机游走返回的QoS值计算源用户u。相对目标服务i的QoS预测值。 优选地,所述步骤1)中具体是指根据式(1)计算用户和用户之间的物理距离; 式(1)中,du,v为用户u和用户V之间的物理距离,为用户u的炜度、A u为用户 u的经度,乾为用户V的炜度、λ v为用户V的经度。 优选地,所述步骤4)具体是指根据式(2)计算用户和用户之间的相似度、根据式 (4)计算服务和服务之间的相似度;; 式(2)中,sim(u, V)为用户u和用户V之间的相似度,ICu,v是指用户u和用户V 共同调用过的Web服务集合,corr(u,V)为用户u和用户V之间的皮尔森相关系数,皮尔森 相关系数corr(u,v)的计算公式如式(3)所示; 式(3)中,ICu,v为用户u和用户V共同调用过的Web服务集合,r Uil为用户u在 Web服务i上观察到的QoS值,ξ为用户u的QoS向量的平均值,6为用户V的QoS向量的 平均值; 式⑷中,sim(i,j)为服务i和服务j之间的相似度,UCu是指共同调用过Web 服务i和j的用户集,c〇rr(i,j)为服务i和j之间的皮尔森相关系数,皮尔森相关系数 corr (i, j)的计算公式如式(5)所示,且服务i和j之间的皮尔森相关系数corr (i, j)仅仅 取正相关; 式(5)中,UCli j为共同调用过Web服务i和j的用户集,r Uil为用户u在Web服务 i上观察到的QoS值,巧为服务i的QoS向量的平均值,C为服务j的QoS向量的平均值。 优选地,所述步骤5)中具体是指根据式(6)计算用户关系网络G中每一条边的权 重; 式(6)中,用户关系网络G中用户u和用户V之间的边的权重,du,v为用户 u和用户V之间的物理距离,sim(u,V)为用户u和用户V之间的相似度,λ为区间 内的可调参数。 优选地,所述步骤6)中每一次随机游走的详细步骤包括: 6. 1)从源用户u。开始进行查找有关目标服务i的随机游走,当本次游走随机过程 中的某一跳到达某个用户u时跳转执行步骤6. 2); 6. 2)判断当前跳的用户u在目标服务i上是否有QoS值,如果有QoS值则将该QoS 值rUil作为本次随机游走的QoS值返回,本次随机游走结束;否则,跳转执行下一步; 6. 3)判断源用户u。开始进行随机游走的跳数是否等于预设的最大游走深度 max-depth,如果不等于预设的最大游走深度max-depth,则跳转执行步骤6. 4),否则跳转 执行步骤6. 5); 6.4)以指定的终止概率Civlik判断本次随机游走是否需要终止,如果不需要终 止,则基于用户关系网络G中每一条边的权重确定下一跳的用户选择概率,并根据所述用 户选择概率从当前跳的用户u的邻域NUu中选择一个用户V作为本次游走随机的下一跳节 点,跳转执行步骤6.2);如果需要终止,则跳转执行步骤6.5); 6. 5)从当前跳的用户u调用过的服务集合RSu中以指定的服务选择概率选择一个 和目标服务i相似的服务j,将当前跳的用户u在目标服务j上的QoS值作为本次随机游走 的QoS值rUi j返回,本次随机游走结束。 优选地,所述步骤6. 3)的详细步骤包括: 6. 3. 1)判断是否满足式(7)所示的全局游走终止条件,如果满足全局游走终止条 件,则跳转执行步骤6.5);否则跳转执行步骤6.3.2); |σ2, -σ"j < f (7) 式(7)中,<表示本文档来自技高网
...

【技术保护点】
一种基于随机游走的Web服务质量预测方法,其特征在于步骤包括:1)根据Web服务QoS数据集中用户的位置信息计算用户和用户之间的物理距离;2)为每个用户选择物理距离最近的K个近邻用户作为该用户的邻域;3)为每个用户连接各自邻域的用户构建用户关系网络G;4)针对用户关系网络G,计算用户和用户之间的相似度、服务和服务之间的相似度;5)根据所述用户和用户之间的物理距离、用户和用户之间的相似度计算用户关系网络G中每一条边的权重;6)针对源用户u0所请求的目标服务i,从源用户u0开始分别进行多次查找关于目标服务i的随机游走,每一次随机游走中的每一跳基于用户关系网络G中每一条边的权重确定下一跳的用户选择概率,并根据所述用户选择概率从当前跳的用户u的邻域NUu中随机选择一个用户v作为本次随机游走的下一跳节点,最终在找到调用过目标服务i或相似服务的用户后结束本次游走并返回一个QoS值;7)综合所有随机游走返回的QoS值计算源用户u0相对目标服务i的QoS预测值。

【技术特征摘要】

【专利技术属性】
技术研发人员:唐明董戴小玲
申请(专利权)人:湖南科技大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1