基于内容相似性的分布式储存的副本替换算法制造技术

技术编号:6125673 阅读:246 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于内容相似性的分布式储存的副本替换算法,该算法首先基于内容相似性计算副本价值,然后计算复制代价,由于副本大小以及计算节点和存储节点之间连接带宽的差别,每一个副本的淘汰代价是不一样的。最后综合考虑预测和代价因素,提出基于内容相似性的分布式储存的副本替换算法。本发明专利技术通过基于内容相似性的副本替换算法提取最少使用的副本,使用分布式储存的副本替换算法找到最长没有被引用的副本,然后综合使用两种算法实现副本替换,提高了平均作业时间,减少了网络资源的消耗,在分布式存储领域具有重要意义。?

【技术实现步骤摘要】

【技术保护点】
1.一种基于内容相似性的分布式储存的副本替换算法,其特征在于该算法提取最少使用的副本,并在此基础上提取最长没有被引用的副本,然后综合使用两种算法实现副本替换;具体步骤如下:1)基于内容相似性计算副本价值;首先定义副本空间集合{R}和副本ID空间集合{r},设定副本的标识符为一个正整数,内容的相似性定义成集合{R}和集合{r}之间的映射,若|r1-r2|的值越小,则副本R1 和 R2 的相似度越大;2) 计算复制代价;引入代价因子来考虑由于大小以及带宽所引起的替换代价;定义C为代价因子,                                                ,其中,Sk代表副本大小,Bd代表复制请求节点与拥有该副本节点间的带宽;若多个节点都存储有副本k,则仅考虑与复制请求节点相连的最大带宽并赋值给Bd;3) 基于内容相似性的分布式储存的副本替换算法;标识符为k的替换测度F(k)如式(9)所示:                             (9)其中F(k)表示副本k的替换测度,替换测度越大,越应该被保留,完成基于内容相似性的分布式储存的副本替换算法。

【技术特征摘要】

【专利技术属性】
技术研发人员:张明明程伟华承轶青
申请(专利权)人:江苏省电力公司
类型:发明
国别省市:84

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1