一种提升大规模分布式存储集群升级效率的方法及系统技术方案

技术编号:34009592 阅读:17 留言:0更新日期:2022-07-02 14:15
本发明专利技术公开了一种提升大规模分布式存储集群升级效率的方法及系统,属于分布式存储领域;所述的方法具体步骤如下:S1查询当前存储集群中所有的数据存储设备,在每个存储节点上进行预检;S2对比确定待升级的数据存储设备列表;S3按照设定的故障域级别和对数据存储设备进行分组;S4按分组进行数据存储设备的安全停止检测和升级;S5数据存储节点重新加入集群;相比于单个数据存储设备的升级方式,本发明专利技术方法通过按照故障域对数据存储设备进行分组,并进行安全停止检测,极大缩减了升级大规模分布式存储集群所需要的时间。式存储集群所需要的时间。式存储集群所需要的时间。

【技术实现步骤摘要】
一种提升大规模分布式存储集群升级效率的方法及系统


[0001]本专利技术公开一种提升大规模分布式存储集群升级效率的方法及系统,涉及分布式存储


技术介绍

[0002]随着信息技术的蓬勃发展,以及政府、企业及个人日益增长的数据存储需求,分布式存储集群已经越来越受到欢迎。分布式存储集群,是将数据分散存储在多台独立的设备上。相对于集群中式存储,分布式存储集群在高扩展性、高可靠性、高性能及成本方面有着得天独厚的优势。但是随着生产数据中心分布存储系统的不断使用和迭代,存储集群的升级成为了急需解决的课题。通常升级关注两个方面:一是升级期间服务是否可用,二是升级窗口的时长。
[0003]现有升级方法大致分为两类,一类是离线升级,由于升级期间需要暂停服务,使用户业务中断,在此不再赘述。另一类则是在线升级,用户无感知,升级期间用户可正常对集群进行读写操作。在线升级又细分为两种方式:一种是对单个数据存储单元逐个进行升级,虽然升级过程影响面较小,且不影响用户正常读写,但是耗时长,大规模集群升级往往需要数个小时甚至更长,这是很多用户所不能接受的,同时也给负责升级的运维人员带来很多压力。另一种常见的升级方法是以存储节点为单位进行升级,方便直接,虽然一定程度上能够提升升级效率,但是在存储节点较少时或与存储节点数量与副本数相同时有一定使用局限性,且无法充分利用分布式存储集群在多副本冗余下满足最小可用副本即可正常工作的特性,在存储节点较多时升级时间仍会很长。
[0004]故现专利技术一种提升大规模分布式存储集群升级效率的方法及系统,以解决上述问题。

技术实现思路

[0005]本专利技术针对现有技术的问题,提供一种提升大规模分布式存储集群升级效率的方法及系统,所采用的技术方案为:一种提升大规模分布式存储集群升级效率的方法,所述的方法具体步骤如下:
[0006]S1查询当前存储集群中所有的数据存储设备,在每个存储节点上进行预检;
[0007]S2对比确定待升级的数据存储设备列表;
[0008]S3按照设定的故障域级别和对数据存储设备进行分组;
[0009]S4按分组进行数据存储设备的安全停止检测和升级;
[0010]S5数据存储节点重新加入集群。
[0011]所述S3按照设定的故障域级别和对数据存储设备进行分组的具体步骤如下:
[0012]S301获取各个存储节点待升级的数据存储设备列表;
[0013]S302根据当前集群设定的故障域级别对数据设备进行分组。
[0014]所述S4按分组进行数据存储设备的安全停止检测和升级的具体步骤如下:
[0015]S401在每组数据存储设备汇中建立key

value数据结构;
[0016]S402对设置的故障域同级别的数据存储设备进行安全停止检测;
[0017]S403对通过安全停止检测组的数据存储设备进行升级。
[0018]所述S5数据存储节点重新加入集群的具体步骤如下:
[0019]S501将已升级的数据存储设备的value设置为已升级,并等待集群状态恢复正常;
[0020]S502将未通过安全检测的数据存储设备进行再次分组;
[0021]S503将升级的标识数据存储设备更新value为已升级;
[0022]S504将升级的数据存储设备重新加入存储集群中。
[0023]一种提升大规模分布式存储集群升级效率的系统,所述的系统具体包括升级控制模块、信息比对模块、分组设定模块、分组处理模块和节点处理模块:
[0024]升级控制模块:查询当前存储集群中所有的数据存储设备,在每个存储节点上进行预检;
[0025]信息比对模块:对比确定待升级的数据存储设备列表;
[0026]分组设定模块:按照设定的故障域级别和对数据存储设备进行分组;
[0027]分组处理模块:按分组进行数据存储设备的安全停止检测和升级;
[0028]节点处理模块:数据存储节点重新加入集群。
[0029]所述分组设定模块具体包括列表获取模块和设备分组模块:
[0030]列表获取模块:获取各个存储节点待升级的数据存储设备列表;
[0031]设备分组模块:根据当前集群设定的故障域级别对数据设备进行分组。
[0032]所述分组处理模块具体包括结构建立模块、检测控制模块和设备升级模块:
[0033]结构建立模块:每组数据存储设备汇中建立key

value数据结构;
[0034]检测控制模块:对设置的故障域同级别的数据存储设备进行安全停止检测;
[0035]设备升级模块:对通过安全停止检测组的数据存储设备进行升级。
[0036]所述节点处理模块具体包括状态设置模块、二次分组模块、设备更新模块和集群更新模块:
[0037]状态设置模块:将已升级的数据存储设备的value设置为已升级,并等待集群状态恢复正常;
[0038]二次分组模块:将未通过安全检测的数据存储设备进行再次分组;
[0039]设备更新模块:将升级的标识数据存储设备更新value为已升级;
[0040]集群更新模块:将升级的数据存储设备重新加入存储集群中。
[0041]本专利技术的有益效果为:相比于单个数据存储设备的升级方式,本专利技术方法通过按照故障域对数据存储设备进行分组,并进行安全停止检测,极大缩减了升级大规模分布式存储集群所需要的时间;而相对于按照存储节点为单位的升级方式,能够满足在存储节点较少时或与存储节点数量与副本数相同场景下的有效升级,且能够充分利用分布式存储集群在多副本冗余下满足最小可用副本即可正常工作的特性,大大提高升级效率。
附图说明
[0042]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发
明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0043]图1是本专利技术方法的流程图;图2是本专利技术实施例的实施流程示意图。
具体实施方式
[0044]下面结合附图和具体实施例对本专利技术作进一步说明,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。
[0045]实施例一:
[0046]一种提升大规模分布式存储集群升级效率的方法,所述的方法具体步骤如下:
[0047]S1查询当前存储集群中所有的数据存储设备,在每个存储节点上进行预检;
[0048]S2对比确定待升级的数据存储设备列表;
[0049]S3按照设定的故障域级别和对数据存储设备进行分组;
[0050]S4按分组进行数据存储设备的安全停止检测和升级;
[0051]S5数据存储节点重新加入集群;
[0052]首先启动升级控制器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提升大规模分布式存储集群升级效率的方法,其特征是所述的方法具体步骤如下:S1查询当前存储集群中所有的数据存储设备,在每个存储节点上进行预检;S2对比确定待升级的数据存储设备列表;S3按照设定的故障域级别和对数据存储设备进行分组;S4按分组进行数据存储设备的安全停止检测和升级;S5数据存储节点重新加入集群。2.根据权利要求1所述的方法,其特征是所述S3按照设定的故障域级别和对数据存储设备进行分组的具体步骤如下:S301获取各个存储节点待升级的数据存储设备列表;S302根据当前集群设定的故障域级别对数据设备进行分组。3.根据权利要求2所述的方法,其特征是所述S4按分组进行数据存储设备的安全停止检测和升级的具体步骤如下:S401在每组数据存储设备汇中建立key

value数据结构;S402对设置的故障域同级别的数据存储设备进行安全停止检测;S403对通过安全停止检测组的数据存储设备进行升级。4.根据权利要求3所述的方法,其特征是所述S5数据存储节点重新加入集群的具体步骤如下:S501将已升级的数据存储设备的value设置为已升级,并等待集群状态恢复正常;S502将未通过安全检测的数据存储设备进行再次分组;S503将升级的标识数据存储设备更新value为已升级;S504将升级的数据存储设备重新加入存储集群中。5.一种提升大规模分布式存储集群升级效率的系统,其特征是所述的系统具体包括升级控制模块、信息比对模块、分...

【专利技术属性】
技术研发人员:李凯李超高传集冯建奎张锦志
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1