【技术实现步骤摘要】
面向广域网的分布式文件系统副本因果一致的访问方法
[0001]本专利技术公开了一种面向广域网的分布式文件系统副本因果一致的访问方法,涉及广域高性能计算面临的挑战,属于计算机
技术介绍
[0002]文件副本跨域存放能够极大降低数据集的访问延迟,提高吞吐性能。在HPC应用(HPC,High performance computing,高性能计算)以及大数据处理应用中,大部分分布式计算任务采用内存计算的方法,只有在执行检查点或者持久化计算输出结果时会涉及到文件写入操作。并且计算任务也会通过合理设置的文件路径以及文件名以避免相互之间的冲突。Harding的研究说明,如果采取并发访问控制的手段,根据集群节点数量与冲突请求比例的差异,性能最大会有99%以上的损耗。
[0003]然而由于广域多中心之间的网络带宽较小,导致数据集在多中心不一致的时间窗口太长,并且在同步过程中发生的IO操作乱序、非原子性执行等故障也会导致数据集及其副本不可逆的损坏,后果较为严重。因此多应用在多中心并发访问时依旧有一定限度的一致性要求。
[0004]基于主从架构的并发访问控制方法限制对于单一文件或者存储单元的写访问均只能由主副本节点提交。当前工业界大部分存储系统都采用了中心集中式的并发访问控制方法,为了保证负载均衡也会采用一致性哈希算法或者数据布局策略进行数据分区,保证节点之间的读写访问均衡。
[0005]主流分布式存储系统Ceph、Glusterfs、HDFS都是主从副本机制的基于中心集中式的并发访问控制方法。因为在单 ...
【技术保护点】
【技术特征摘要】
1.一种面向广域网的分布式文件系统副本因果一致的访问方法,其特征在于,包括:仅同步副本文件的索引结构与按需同步数据;通过追溯广域分布式环境中副本文件数据操作的依赖顺序来提供因果一致的偏序关系;通过最大时间戳偏差分析以及用户可定义的优先级来为数据操作提供稳定的全序关系;通过一种支持回滚的多版本索引区间树来存储副本文件的索引结构并且进行多版本并发控制;通过副本文件索引结构的多版本并发控制来处理逻辑时间中的并发冲突。2.根据权利要求1所述的方法,其特征在于,包括以下步骤:步骤1,当客户端向广域网上某个存储中心的副本提交数据写入请求时,存储网关节点会根据当前存储中心对于目标副本文件可见的所有写入请求为该请求赋予依赖关系;步骤2,当广域网上的某个存储中心的存储网关节点接收到其他存储中心广播的数据段更新操作时,会根据当前请求的依赖关系、时间戳偏差以及用户定义的副本空间当前节点nice值为所有接收到的数据写操作构建全序关系;步骤3,存储网关节点会根据预先构建的数据写操作全序关系为目标副本文件构建多版本索引区间树,并通过树的版本回滚来解决网络包乱序到达导致的并发冲突;步骤4,当客户端向广域网上某个存储中心的副本提交数据读取请求时,存储网关节点会根据当前存储中心中维护的多版本索引区间树提供的满足因果一致性的最大版本进行数据同步,最终返回满足因果一致性的副本文件数据。3.根据权利要求2所述的方法,其特征在于,所述步骤1中当客户端向广域网上某个存储中心的副本提交数据写入请求时,还包括:A1)由管理节点组织与分发的集群节点状态图进行存储中心内部的存储网关节点的相互发现;A2)存储中心的存储网关节点维护一组副本文件的版本向量,版本向量由加入当前副本空间的所有存储中心所维护的某个副本文件在各个中心的最后一个写入请求的客户提交版本组成,并且按照各个存储中心加入副本空间的时间顺序进行排列;A3)当接收到其他存储中心广播的写入请求时,当前存储中心的版本向量中写入请求来源存储中心的对应版本槽将进行推进更新;A4)当接收到由客户端提交的数据写入请求时,在请求提交时刻存储网关节点所维护的副本文件版本向量将作为该数据写入请求的依赖版本,并且版本向量中当前存储中心的版本槽将向前推进;A5)存储网关节点会向其他中心推送所有带有时间戳以及依赖版本向量的数据段更新请求。4.根据权利要求2所述的方法,其特征在于,所述步骤2中当广域网上的某个存储中心的存储网关节点接收到其他存储中心广播的数据段更新操作时,还包括:B1)当广域网上的某个存储中心的存储网关节点接收到其他存储中心广播的数据段更新操作时,会根据当前请求的依赖关系、时间戳偏差以及用户定义的副本空间当前节点nice值为所有接收到的数据写操作构建全序关系;
B2)存储网关节点会根据接收到的数据段更新操作中携带的依赖关系来构建因果一致的偏序关系,其偏序关系由一个比较版本向量的函数产生,对于两个来源于不同存储中心的数据段更新请求,比较函数会将这两个更新请求的版本向量中对方存储中心所对应的版本槽进行比较,如果两个版本槽的对比形成了一致的大小关系,那么这两个请求拥有因果顺序关系,如果两个版本槽的对比形成了不一致的大小关系,那么两个请求拥有并行关系;B3)当两个请求拥有并行关系,由存储网关节点根据集群节...
【专利技术属性】
技术研发人员:肖利民,周汉杰,秦广军,霍志胜,宋尧,徐耀文,王超波,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。