当前位置: 首页 > 专利查询>武汉大学专利>正文

一种无结构P2P网络的副本复制方法技术

技术编号:5451823 阅读:207 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及对等网络P2P技术领域,尤其涉及一种无结构P2P网络的副本复制方法。本发明专利技术首先在搜索过程中根据文件的访问频率来确定待复制的流行文件,然后根据查询发起节点访问频率的差异计算出中间转发节点相对查询发起节点的平均代价,在各节点存储空间有限的条件下,将流行文件复制到那些代价最小的节点上。本发明专利技术解决了P2P系统中流行文件带来的过大访问消耗问题,降低流行性文件的搜索延迟减少网络开销。

【技术实现步骤摘要】

本专利技术涉及对等网络(Peer-to-Peer,P2P)
,尤其涉及一种无结构P2P网 络的副本复制方法。
技术介绍
P2P技术已经被证实是能够实施大规模分布式应用的一种有效的方式。近十年来, P2P应用已经引起了众多研究团体的兴趣,部署在hternet上的最主要的P2P应用—— P2P文件共享系统也已经得到了广泛的应用。在P2P文件共享系统中,为了交换文件信息, 节点之间相互合作形成一个分布式系统,用户和系统的交互通过如下方式用户通过发起 查询来定位感兴趣的文件,一旦文件找到了,用户对拥有该文件的节点发起一个下载请求, 因此,文件共享应用消耗着大部分的hternet带宽,研究表明在大规模的HTTP流量中超过 75 %的hternet流量来自于P2P文件共享应用。在P2P文件共享系统中,搜索效率对系统的性能有着重大的影响,决定着系统的 可用性和可扩展性等。研究表明,系统中文件的查询并不是均衡的,符合Zif分布,有的文 件被频繁的查询变得流行而有的文件则很少访问,这就容易让网络中的某些节点因为承载 了流行文件而变成“热点”,导致网络拥塞,消耗了大量的网络资源,而副本复制是一个有效 的方法来分散节点的负载,它能将流行的文件按照一定的复制策略复制到选中的其他节点 上,帮助获得高的查询效率,减少响应时间和查询跳数。近来提出了很多副本复制方法。主要分为三类服务器端的复制方法、客户端的复 制方法和沿路复制方法。服务器端的复制指复制文件靠近文件拥有者。客户端的复制指复 制文件靠近文件请求者。沿路复制是指从请求者到文件拥有者沿路进行复制。然而,这三 种方法的效率都比较低并带来高的开销。靠近服务拥有者一端来复制文件即服务端的复制 能够提高复制命中率和查询效率,然而,它不能显著减少路径长度因为复制是靠近服务拥 有者的。另一方面,客户端的复制将显著提高查询效率,但是当节点的兴趣发生变化时不能 保证。因此,客户端的复制也不能保证高命中率和复制利用率。沿路复制避免了服务端的 和客户端的问题。它提供高命中率并且极大的减少了查询平均长度。然而,它的有效性超 过了它复制和维护的高开销,而且,它产生了很多无用的副本。既然复制更多的副本能够带来更高的查询效率,但也会产生更多的维护开销,所 以复制算法的挑战是如何最小化副本并获得高的查询效率,即减少响应时间、减少开销 并提高命中率。EAD (an Efficient and Adaptive Decentralized file replication algorithm)算法就是基于这种目标而提出的一种算法,EAD是一个有效的自适应的分散 副本复制算法,它根据用户兴趣或文件的流行性、非均勻分布等性质自适应的调整文件的 复制,并基于文件查询率动态选择查询流量集中的节点作为复制节点来确保高的复制命中 率,但是EAD没有考虑到各流行文件的查询率的不同对搜索延迟的影响,而只有尽快降低 搜索频率较高的流行文件的搜索延迟才能使网络整体搜索延迟降低的更快,并且网络中节 点的容量是有限的不能无差异的进行分配,只有优化资源配置,根据文件访问频率的差异性将文件复制到那些能够尽快的命中并使系统整体搜索延迟降低更快的节点上才能使系 统获得更短的平均搜索路径。
技术实现思路
针对上述存在的技术问题,本专利技术的目的是提供一种无结构P2P网络的副本复制 方法,首先在搜索过程中根据文件的访问频率来确定待复制的流行文件,然后根据查询发 起节点访问频率的差异计算出中间转发节点相对查询发起节点的平均代价,在各节点存储 空间有限的条件下,将流行文件复制到那些代价最小的节点上。为达到上述目的,本专利技术采用如下的技术方案-流行性文件评估步骤,该步骤包括①针对每个节点,统计每个节点自己在周期T内发起的查询信息,所述查询信息 包含查询目标文件A和查询次数 ‘②统计系统在周期T内总共发起的查询次数、各文件的查询率和系统平均查询 率;③在周期T内,引入平滑因子评估文件的流行度;④根据评估的查询率判断文件是否是待复制的流行文件;-文件复制步骤,该步骤包括假定查询发起源节点为S1, Lst,目标节点为t1; L,tk,中间转发节点为Ii1, L,H1①获得流行文件对应的查询发起节点对各目标文件的查询频率;②根据查询发起节点的查询频率计算出周期T内查询发起节点对流行文件的访 问频率矩阵;③根据流行文件在目标节点上的命中记录,从目标节点的路由表中获取各中间转 发节点对查询发起节点的距离矩阵;④根据访问频率矩阵和距离矩阵,计算出中间节点针对目标节点的搜索代价矩 阵;⑤根据代价矩阵获得中间节点在给定搜索频率下相对于目标节点的总搜索代价向量;⑥根据节点的剩余容量,将目标文件复制到代价最小并有剩余容量的节点上。流行性文件评估步骤②中,统计各文件的查询次数& =tf,,η为网络中节点的数/=1目,则在周期T内节点发起的查询总数乂 ,其中k为系统中不同文件的个数;I=INMa系统的平均查询次数Mfl =4,系统平均查询率为^ ,文件在周期T内的访问q kΝιNf率 ⑴=式。流行性文件评估步骤③中,采用指数平滑的方法,引入平滑指数β (0 < β < 1), 计算出文件fi在周期T的流行度为4 (T) = β^ Pa (T-DHI-β)νΑ (T)。流行性文件评估步骤④中,将文件的流行度4 ( 和νΤ值进行比较,如果& ( > ν,, 则文件fi是流行文件,其中i = 1,2,· · ·,k。5 文件复制步骤②中,获得查询发起源节点对目标节点的访问频率矩阵本文档来自技高网
...

【技术保护点】
一种无结构P2P网络的副本复制方法,其特征在于,包括以下步骤:-流行性文件评估步骤,该步骤包括:①针对每个节点,统计每个节点自己在周期T内发起的查询信息,所述查询信息包含查询目标文件f↓[i]和查询次数n↓[f↓[i]];②统计系统在周期T内总共发起的查询次数、各文件的查询率和系统平均查询率;③在周期T内,引入平滑因子评估文件的流行度;④根据评估的查询率判断文件是否是待复制的流行文件;-文件复制步骤,该步骤包括:假定查询发起源节点为s↓[1],Ls↓[t],目标节点为t↓[1],L,t↓[k],中间转发节点为n↓[1],L,n↓[l]①获得流行文件对应的查询发起节点对各目标文件的查询频率;②根据查询发起节点的查询频率计算出周期T内查询发起节点对流行文件的访问频率矩阵;③根据流行文件在目标节点上的命中记录,从目标节点的路由表中获取各中间转发节点对查询发起节点的距离矩阵;④根据访问频率矩阵和距离矩阵,计算出中间节点针对目标节点的搜索代价矩阵;⑤根据代价矩阵获得中间节点在给定搜索频率下相对于目标节点的总搜索代价向量;⑥根据节点的剩余容量,将目标文件复制到代价最小并有剩余容量的节点上。

【技术特征摘要】
1.一种无结构P2P网络的副本复制方法,其特征在于,包括以下步骤 -流行性文件评估步骤,该步骤包括①针对每个节点,统计每个节点自己在周期T内发起的查询信息,所述查询信息包含 查询目标文件fi和查询次数;②统计系统在周期T内总共发起的查询次数、各文件的查询率和系统平均查询率;③在周期T内,引入平滑因子评估文件的流行度;④根据评估的查询率判断文件是否是待复制的流行文件; -文件复制步骤,该步骤包括假定查询发起源节点为S1, Lst,目标节点为2.根据权利要求1所述的无结构P2P网络的副本复制方法,其特征在于流行性文件评估步骤②中,统计各文件的查询次数3.根据权利要求1或2所述的无结构P2P网络的副本复制方法,其特征在于流行性文件评估步骤③中,采用指数平滑的方法,引入平滑指数β (0 < β < 1),计算 出文件fi在周期T的流行度为4.根据权利要求3中任一项所述的无结构Ρ2Ρ网络的副本复制方法,其特征在于 流行性文件评估步骤④中,将文件的流行度4 (『)和ντ值进行比较,如果& (O > ν,,则文件fi是流行文件,其中i = 1,2,···,k。5.根据权利要求1所述的无结构P2P网络的副本复制方法,其特征在于 文件复制步骤②中,获得查询...

【专利技术属性】
技术研发人员:胡瑞敏朱永琼杨红云陈铙谭小琼
申请(专利权)人:武汉大学
类型:发明
国别省市:83[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1