一种基于万有引力搜索模型的副本替换方法技术

技术编号:9462902 阅读:155 留言:0更新日期:2013-12-19 00:20
本发明专利技术公开了一种基于万有引力搜索模型的副本替换方法:步骤1:获得最近T时间段内文件的副本文件被访问记录;步骤2:获得文件所在节点与副本文件所在节点之间最大网络带宽及副本文件访问时间;步骤3:当存储节点的文件被访问后,得到新的副本文件,判断该节点上是否至少有一个副本文件,是则执行步骤4,否则执行步骤5;步骤4:计算该文件的所有副本文件的替换价值,判断新的副本文件的大小是否小于替换价值最小的副本文件与该存储节点的剩余存储空间之和,是则替换价值最小的副本文件;步骤5:判断该存储节点的剩余存储空间是否大于新的副本文件的大小,存储将新的副本文件。该方法能够提高系统副本管理能力,优化网络存储系统整体性能。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了:步骤1:获得最近T时间段内文件的副本文件被访问记录;步骤2:获得文件所在节点与副本文件所在节点之间最大网络带宽及副本文件访问时间;步骤3:当存储节点的文件被访问后,得到新的副本文件,判断该节点上是否至少有一个副本文件,是则执行步骤4,否则执行步骤5;步骤4:计算该文件的所有副本文件的替换价值,判断新的副本文件的大小是否小于替换价值最小的副本文件与该存储节点的剩余存储空间之和,是则替换价值最小的副本文件;步骤5:判断该存储节点的剩余存储空间是否大于新的副本文件的大小,存储将新的副本文件。该方法能够提高系统副本管理能力,优化网络存储系统整体性能。【专利说明】
本专利技术涉及ー种副本替换方法,具体是ー种基于万有引力搜索模型的副本替换方法
技术介绍
在海量网络存储系统中,由于存储节点多而杂,而且存储网络存在异构性,使得各个存储节点在性能和可靠性上不尽相同,系统需要合理的管理这些节点,协调它们的工作,尽量使用大量价格低廉的存储设备按一定的规则组合成一个可靠性较强、可用性较高的存储系统,因此需要创建文件副本。副本管理技术是海量网络存储系统中保证数据可用性和可靠性的重要技术,其用于避免由于个别存储节点的网络故障或机器故障等不可预知的情况而造成文件的不可访问或丢失。因此,从理论上分析文件副本越多,则系统和文件的可用性及可靠性就越高;但是,副本的数量即副本冗余度的増加会消耗更多的系统资源如存储空间,并且随着副本数量的増加,为了更新副本,保持副本的一致性,也将会占用一定的网络资源,势必会加重网络带宽的负担。因此,副本管理过程要权衡上述两方面。副本数量的管理是在适当的时间、合适的节点创建或删除对应的副本,可明显地提高数据文件的访问速度以及降低网络资源的消耗和系统的负载均衡。海量网络存储系统中,副本选择策略可提高系统的响应时间、降低网络的时间延迟和带宽消耗,从而提高数据文件的访问速度。副本替换是副本管理技术中的ー种手段,由于文件副本数量的增加,不但占用了存储节点中的大量存储空间,而且加大了系统对副本管理和维护的开销,因此必须要适当地进行副本替换。副本替换的好坏会对存储系统的性能产生直接的影响。副本替换一般有以下两种情况:(I)创建副本之初,如果存储节点上没有足够的空间来存储,新的副本文件,这时需要存储系统调用副本替换策略,删除旧的文件副本;(2)需要定期进行副本替换来实现对系统中文件副本进行更新,旧版本的文件副本需要删除。当存储节点中剩余的存储空间不足以存储新副本的时候,如何选择ー个新的副本来替换旧的副本?传统的副本替换方法通常采用操作系统的页面置换算法的操作方式。传统的副本替换方法一般只适应于単一网络存储环境下,其无法适应海量信息网络存储环境(系统),对数据文件的读取速度较慢,且常常陷入局部最优值,无法在海量存储整体环境中找到最优的替换的副本文件。这是由于以下几个原因:1)海量存储环境中的存储节点更多,存储节点覆盖范围更广;2)存储的副本文件不仅仅放在单ー网络系统中,而可能分布在不同的网络系统中,因此具有更高的动态性;3)文件访问时延、网络带宽和硬件的配置等。因此,研究一种能够有效降低文件访问时间的副本替换方法,对于提高系统副本管理能力,达到优化系统的整体性能是十分有必要的。Esmat Rashedi和H.Nezamabadrpour等人于2009年提出一种源于对物理学中的牛顿万有引力定律进行模拟的优化捜索技术,即引力捜索算法(GSA),它与粒子群算法相似,是ー种元启发式算法,它通过群体中各粒子之间的万有引力相互作用产生的群体智能指导优化捜索,以达到节约网络资源,提高系统服务性能的目的。万有引力是自然界4种基础的カ之一,粒子在万有引力的作用下相互之间不断地靠近,在自然界中,每ー个里粒子都会和其他的所有粒子相互吸引,对于两个相互分离的粒子,它们相互之间的万有引力是没有间隔和延迟的。
技术实现思路
针对目前海量存储中因用户数量、数据类型以及网络环境复杂而引起对数据文件的读取速度较慢,导致系统整体服务性能降低、浪费部分网络资源的问题,本专利技术的目的在于,提供一种基于万有引力捜索模型的副本替换算法(GMRA),该方法根据海量网络存储的副本替换的特点及万有引力捜索算法的特性而提出,实现对数据文件读取请求快速响应。本专利技术在海量网络存储环境下,采用万有引力捜索模型有效地对系统进行负载均衡,降低文件访问时间,降低网络带宽的消耗和数据访问的延迟,使用本专利技术的方法能够提高副本管理能力,达到优化海量信息网络存储系统的整体性能的目的。为了实现上述任务,本专利技术采用如下的技术方案予以解决:一种基于万有引力捜索模型的副本替换方法,具体包括如下步骤:步骤1:获得最近T时间段内文件f的所有副本文件も的被访问记录,并将访问记录存储在多维关系索引表中;每条访问记录包括:最近T时间段内副本文件も被访问次数t、副本文件も所在节点位置、副本文件も的大小Si ;步骤2:根据多维关系索引表中的索引地址,找到步骤I中文件f的所有副本文件各自所在的节点,井分别获得文件f所在节点与它的每个副本文件所在节点之间的最大网络带宽Bi及每个副本文件的访问时间Tvt ;步骤3:当某存储节点上的某文件f被访问后,得到该文件f的新的副本文件,此处的访问是指用户对文件的写操作。 如果在文件f被访问前,该存储节点上存有文件f的至少ー个副本文件,执行步骤4;否则执行步骤5 ;步骤4:判断步骤3得到的新的副本文件的大小是否大于原有的所有副本文件与该存储节点的剩余存储空间之和,如果是,则将新的副本文件删除;否则,利用式3分别计算该文件f?的所有副本文件的替换价值,并按照替换价值将副本文件升序排列;此时,判断新的副本文件的大小是否小于替换价值最小的副本文件与该存储节点的剩余存储空间之和,是则用新的副本文件替换替换价值最小的副本文件,否则,比较新的副本文件的大小是否小于替换价值最小的两个副本文件与该存储节点的剩余存储空间之和,是则用新的副本文件替换该替换价值最小的两个副本文件,否则增加副本文件的个数继续判断并删除原有的副本文件,直到将新的副本文件存入该存储节点; 【权利要求】1.一种基于万有引力捜索模型的副本替换方法,其特征在于,具体包括如下步骤: 步骤1:获得最近T时间段内文件f的所有副本文件も的被访问记录,并将访问记录存储在多维关系索引表中;每条访问记录包括:最近T时间段内副本文件も被访问次数t、副本文件も所在节点位置、副本文件も的大小Si ; 步骤2:根据多维关系索引表中的索引地址,找到步骤I中文件f的所有副本文件各自所在的节点,井分别获得文件f?所在节点与它的每个副本文件所在节点之间的最大网络带宽Bi及每个副本文件的访问时间Tvt ; 步骤3:当某存储节点上的某文件f被访问后,得到该文件f的新的副本文件,此处的访问是指用户对文件的写操作。 如果在文件f被访问前,该存储节点上存有文件f的至少ー个副本文件,执行步骤4 ;否则执行步骤5 ; 步骤4:判断步骤3得到的新的副本文件的大小是否大于原有的所有副本文件与该存储节点的剩余存储空间之和,如果是,则将新的副本文件删除;否则,利用式3分别计算该文件f?的所有副本文件的替换价值,并按照替换价值将副本文档来自技高网
...

【技术保护点】
一种基于万有引力搜索模型的副本替换方法,其特征在于,具体包括如下步骤:步骤1:获得最近T时间段内文件f的所有副本文件fi的被访问记录,并将访问记录存储在多维关系索引表中;每条访问记录包括:最近T时间段内副本文件fi被访问次数t、副本文件fi所在节点位置、副本文件fi的大小Si;步骤2:根据多维关系索引表中的索引地址,找到步骤1中文件f的所有副本文件各自所在的节点,并分别获得文件f所在节点与它的每个副本文件所在节点之间的最大网络带宽Bi及每个副本文件的访问时间Tvt;步骤3:当某存储节点上的某文件f被访问后,得到该文件f的新的副本文件,此处的访问是指用户对文件的写操作。如果在文件f被访问前,该存储节点上存有文件f的至少一个副本文件,执行步骤4;否则执行步骤5;步骤4:判断步骤3得到的新的副本文件的大小是否大于原有的所有副本文件与该存储节点的剩余存储空间之和,如果是,则将新的副本文件删除;否则,利用式3分别计算该文件f的所有副本文件的替换价值,并按照替换价值将副本文件升序排列;此时,判断新的副本文件的大小是否小于替换价值最小的副本文件与该存储节点的剩余存储空间之和,是则用新的副本文件替换替换价值最小的副本文件,否则,比较新的副本文件的大小是否小于替换价值最小的两个副本文件与该存储节点的剩余存储空间之和,是则用新的副本文件替换该替换价值最小的两个副本文件,否则增加副本文件的个数继续判断并删除原有的副本文件,直到将新的副本文件存入该存储节点;Fi(f)=G0Ni(t,T)×SiBi×Tvt(式3)式中,Fi(f)表示副本文件fi的替换价值,i∈(1,n),n为文件f的所有副本文件的数目;Ni(t,T)表示副本文件fi在最近的时间段T内被访问t次;Bi表示文件f所在节点到副本文件fi所在节点之间的带宽(单位:MBps);Si表示副本文件fi的大小(单位: MB);Tvt表示访问副本文件fi所需要的时间(单位:S);G0为引力常数。步骤5:判断该存储节点的剩余存储空间是否大于新的副本文件的大小,如果是,将新的副本文件存储到该存储节点上,否则,删除该新的副本文件。...

【技术特征摘要】

【专利技术属性】
技术研发人员:边根庆邵必林卢才武张维琪张志霞叶娜李智杰龚培娇权西瑞赵华龙
申请(专利权)人:西安建筑科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1