一种重启OSD的方法、装置及系统制造方法及图纸

技术编号:20025275 阅读:40 留言:0更新日期:2019-01-06 04:18
本发明专利技术公开了一种重启OSD的方法、装置及系统,其中,该方法包括:存储节点按照固定周期采集本节点中OSD的状态数据;当在预设时间段内所述OSD一直处于异常状态时,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件;当所述OSD满足所述重启条件时,所述存储节点利用重启脚本重启所述OSD。本发明专利技术可以实时监测OSD的状态,当监测到有故障OSD时,利用重启判断脚本确定该OSD是否满足重启条件,当该OSD满足重启条件时,利用重启脚本重启OSD,整个流程均采用自动化,实现了OSD故障的自动化分析及恢复,从而减少人力投入,提高处理的及时性和效率,为Ceph系统的运维工作带来更大的便利,并且能够避免人工疏漏,有效保证系统安全可靠运行。

【技术实现步骤摘要】
一种重启OSD的方法、装置及系统
本专利技术涉及计算机
,特别涉及一种重启OSD的方法、装置及系统。
技术介绍
Ceph是一种高可用、易于管理、开源的分布式存储系统。CephOSD(ObjectStorageDevice,对象存储设备)是Ceph存储系统最重要的组件,OSD将数据以对象的形式存储到系统中每个存储节点的物理磁盘上。在OSD发生故障,例如OSD挂掉后,可以通过重启,恢复该OSD。对于每个存储节点的OSD,可以在从节点上设置相应的副本OSD,在OSD发生故障的期间,可以改用副本OSD处理用户请求。例如,OSD存储为三副本的形式,若其中两个副本OSD发生故障没有及时恢复,而第三个副本OSD又发生故障,则会造成数据永久丢失。并且待故障OSD重启时,重启的OSD将副本OSD磁盘中异常期间存入的数据,即变化的数据同步到本OSD的磁盘中,同时副本OSD也被锁住,所以无法处理用户的数据写入请求。如果故障OSD越长时间没有被恢复,副本OSD磁盘写入的新数据越多,重启OSD越耗时,副本OSD被锁住的时间也就越久。因此,故障OSD恢复的时间越早,锁住写入的时间就会越短,对系统业务影响就会越小。重启恢复OSD之前,需要判断OSD是否满足重启条件,满足才能重启,否则可能重启后会直接影响整个Ceph存储系统的服务环境。并且在重启过程中,存在磁盘锁住影响写入的问题,以及可能存在其他问题影响到整个Ceph存储系统的局部写入运作,所以整个重启恢复过程需要完整的监控,以分析判断是否需要终止重启,控制住影响。目前,判断OSD是否可以重启以及监控重启过程均由人力介入处理,所以需要消耗大量的时间,并且复杂的逻辑判断容易造成人工的误判或者漏判。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种重启OSD的方法、装置及系统。所述技术方案如下:第一方面,提供了一种重启OSD的方法,所述方法包括:存储节点按照固定周期采集本节点中OSD的状态数据;当在预设时间段内所述OSD一直处于异常状态时,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件;当所述OSD满足所述重启条件时,所述存储节点利用重启脚本重启所述OSD。可选的,当在预设时间段内所述OSD一直处于异常状态时,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件,包括:所述存储节点向中心节点发送所述状态数据;当在预设时间段内所述OSD一直处于异常状态时,所述中心节点向所述存储节点发送重启指令;所述存储节点基于所述重启指令,利用所述重启判断脚本确定所述OSD是否满足重启条件。可选的,当在预设时间段内所述OSD一直处于异常状态时,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件,还包括:所述存储节点向监控节点发送所述状态数据;当在预设时间段内所述OSD一直处于异常状态时,所述监控节点向中心节点发送告警信息;所述中心节点基于所述告警信息向所述存储节点发送重启指令;所述存储节点基于所述重启指令,利用重启判断脚本确定所述OSD是否满足重启条件。可选的,所述中心节点向所述存储节点发送重启指令,包括:当在预设时间段内所述OSD一直处于异常状态,并且所述中心节点接收到上一个执行OSD重启的存储节点发送的OSD重启结果时,向所述存储节点发送重启指令。可选的,所述重启指令包括所述重启判断脚本和所述重启脚本。可选的,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件,包括:所述存储节点判断所述OSD的磁盘是否可用、所述OSD的磁盘的挂载目录是否正常显示、所述OSD的服务状态是否正常、所述OSD的日志中是否存在不可恢复的报错以及所述OSD的磁盘中是否存在以孤本形式存储的对象;当所述OSD的磁盘可用、所述OSD的磁盘的挂载目录正常显示、所述OSD的服务状态正常、所述OSD的日志中不存在不可恢复的报错以及所述OSD的磁盘中不存在以孤本形式存储的对象时,所述OSD满足重启条件。可选的,所述方法还包括:当所述OSD不满足所述重启条件时,所述存储节点修复所述OSD;所述存储节点利用所述重启判断脚本确定修复后的所述OSD是否满足重启条件;如果修复后的所述OSD满足所述重启条件,则利用所述重启脚本重启所述OSD。可选的,在所述存储节点利用重启脚本重启所述OSD之前,包括:所述存储节点将所述OSD的磁盘内容写入内存中,以与副本OSD的磁盘内容进行对比并同步变化的数据。可选的,所述存储节点利用重启脚本重启所述OSD,包括:在所述OSD的重启进程中,所述存储节点监控磁盘内容加载的持续时间,OSD启动过程的持续时间,锁定副本OSD磁盘的持续时间以及进程日志;当任一持续时间超过相应的阈值,并且进程没有进展时,结束所述OSD的重启进程。第二方面,提供了一种重启OSD的装置,包括:采集模块,用于按照固定周期采集本节点中OSD的状态数据;判断模块,用于当在预设时间段内所述OSD一直处于异常状态时,利用重启判断脚本确定所述OSD是否满足重启条件;重启模块,用于当所述OSD满足所述重启条件时,利用重启脚本重启所述OSD。可选的,所述判断模块,具体用于:判断所述OSD的磁盘是否可用、所述OSD的磁盘的挂载目录是否正常显示、所述OSD的服务状态是否正常、所述OSD的日志中是否存在不可恢复的报错以及所述OSD的磁盘中是否存在以孤本形式存储的对象;当所述OSD的磁盘可用、所述OSD的磁盘的挂载目录正常显示、所述OSD的服务状态正常、所述OSD的日志中不存在不可恢复的报错以及所述OSD的磁盘中不存在以孤本形式存储的对象时,所述OSD满足重启条件。可选的,所述判断模块,还用于当所述OSD不满足所述重启条件时,修复所述OSD,以及利用所述重启判断脚本确定修复后的所述OSD是否满足重启条件;所述重启模块,还用于当修复后的所述OSD满足所述重启条件时,利用所述重启脚本重启所述OSD。可选的,所述重启模块,还用于将所述OSD的磁盘内容写入内存中,以与副本OSD的磁盘内容进行对比并同步变化的数据。可选的,所述重启模块,用于:在所述OSD的重启进程中,监控磁盘内容加载的持续时间,OSD启动过程的持续时间,锁定副本OSD磁盘的持续时间以及进程日志;当任一持续时间超过预设阈值,并且进程没有进展时,结束所述OSD的重启进程。第三方面,提供了一种重启OSD的系统,包括存储节点以及中心节点;所述存储节点包括第二方面中所述的重启OSD的装置;所述存储节点,还用于向所述中心节点发送所述状态数据;所述中心节点,用于当在预设时间段内所述OSD一直处于异常状态时,向所述存储节点发送重启指令;所述存储节点,还用于基于所述重启指令,利用所述重启判断脚本确定所述OSD是否满足重启条件。可选的,所述系统还包括监控节点;所述存储节点,还用于向所述监控节点发送所述状态数据;所述监控节点,用于当在预设时间段内所述OSD一直处于异常状态时,向中心节点发送告警信息;所述中心节点,用于基于所述告警信息向所述存储节点发送重启指令;所述存储节点,用于基于所述重启指令,利用重启判断脚本确定所述OSD是否满足重启条件。可选的,所述中心节点,具体用于当在预设时间段内所述OSD一直处于异常状态,并且接收到上一个执行OSD重启的存储节点发送的OSD重启结果时,本文档来自技高网
...

【技术保护点】
1.一种重启OSD的方法,其特征在于,所述方法包括:存储节点按照固定周期采集本存储节点内OSD的状态数据;当在预设时间段内所述OSD一直处于异常状态时,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件;当所述OSD满足所述重启条件时,所述存储节点利用重启脚本重启所述OSD。

【技术特征摘要】
1.一种重启OSD的方法,其特征在于,所述方法包括:存储节点按照固定周期采集本存储节点内OSD的状态数据;当在预设时间段内所述OSD一直处于异常状态时,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件;当所述OSD满足所述重启条件时,所述存储节点利用重启脚本重启所述OSD。2.根据权利要求1所述的方法,其特征在于,当在预设时间段内所述OSD一直处于异常状态时,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件,包括:所述存储节点向中心节点发送所述状态数据;当在预设时间段内所述OSD一直处于异常状态时,所述中心节点向所述存储节点发送重启指令;所述存储节点基于所述重启指令,利用所述重启判断脚本确定所述OSD是否满足重启条件。3.根据权利要求1所述的方法,其特征在于,当在预设时间段内所述OSD一直处于异常状态时,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件,还包括:所述存储节点向监控节点发送所述状态数据;当在预设时间段内所述OSD一直处于异常状态时,所述监控节点向中心节点发送告警信息;所述中心节点基于所述告警信息向所述存储节点发送重启指令;所述存储节点基于所述重启指令,利用重启判断脚本确定所述OSD是否满足重启条件。4.根据权利要求2或3所述的方法,其特征在于,所述中心节点向所述存储节点发送重启指令,包括:当在预设时间段内所述OSD一直处于异常状态,并且所述中心节点接收到上一个执行OSD重启的存储节点发送的OSD重启结果时,向所述存储节点发送所述重启指令。5.根据权利要求4所述的方法,其特征在于,所述重启指令包括所述重启判断脚本和所述重启脚本。6.根据权利要求1所述的方法,其特征在于,所述存储节点利用重启判断脚本确定所述OSD是否满足重启条件,包括:所述存储节点判断所述OSD的磁盘是否可用、所述OSD的磁盘的挂载目录是否正常显示、所述OSD的服务状态是否正常、所述OSD的日志中是否存在不可恢复的报错以及所述OSD的磁盘中是否存在以孤本形式存储的对象;当所述OSD的磁盘可用、所述OSD的磁盘的挂载目录正常显示、所述OSD的服务状态正常、所述OSD的日志中不存在不可恢复的报错以及所述OSD的磁盘中不存在以孤本形式存储的对象时,所述OSD满足重启条件。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述OSD不满足所述重启条件时,所述存储节点修复所述OSD;所述存储节点利用所述重启判断脚本确定修复后的所述OSD是否满足重启条件;如果修复后的所述OSD满足所述重启条件,则利用所述重启脚本重启所述OSD。8.根据权利要求1所述的方法,其特征在于,在所述存储节点利用重启脚本重启所述OSD之前,包括:所述存储节点将所述OSD的磁盘内容写入内存中,以与副本OSD的磁盘内容进行对比并同步变化的数据。9.根据权利要求1所述的方法,其特征在于,所述存储节点利用重启脚本重启所述OSD,包括:在所述OSD的重启进程中,所述存储节点监控磁盘内容加载的持续时间,OSD启动过程的持续时间,锁定副本OSD磁盘的持...

【专利技术属性】
技术研发人员:郭凯
申请(专利权)人:网宿科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1