一种容器化部署Ceph集群对象unfound故障的恢复方法及系统技术方案

技术编号:28224710 阅读:27 留言:0更新日期:2021-04-28 09:56
本发明专利技术公开了一种容器化部署Ceph集群对象unfound故障的恢复方法及系统,属于云计算存储领域;所述的S1定位查找出unfound对象对应的pg及所映射的OSD;S2容器化下对pg映射OSD上unfound对象执行修复的特定操作方式;S3容器化下对执行修复后的unfound对象可用性及集群状态进行检测;通过本发明专利技术方法主要解决了容器化部署Ceph集群对象unfound故障快速恢复的方法;一方面明确了在容器化环境下区别于传统服务方式对OSD进行修复的执行过程和操作方式,提高容器化环境下下运维效率;另一方面,对出现unfound对象时最大限度对unfound对象数据进行快速恢复或恢复集群状态到健康状态保障生产环境Ceph集群的状态健康,及时消除告警保障集群的稳定性和数据安全。保障集群的稳定性和数据安全。保障集群的稳定性和数据安全。

【技术实现步骤摘要】
一种容器化部署Ceph集群对象unfound故障的恢复方法及系统


[0001]本专利技术公开一种容器化部署Ceph集群对象unfound故障的恢复方法及系统,涉及云计算存储


技术介绍

[0002]Ceph分布式存储系统通过多副本机制和故障域来保障数据的强一致性和完整性。但当Ceph存储集群在遇到集群突然掉电或存储介质缓存异常等极端情况下会导致数据对象的损坏或丢失,容器化部署环境下OSD进程的管理方式和非容器化部署有较大差异,本专利技术主要针对容器化部署环境下遇到unfound对象故障的恢复方法
[0003]Ceph容器化部署的主流方式是基于Rook和Kubernetes进行Ceph集群的自动化部署,容器化部署提高了部署的效率和降低了部署复杂度,但是微服务化的服务管理方式和传统服务的方式有较大的管理差异:传统是以service方式管理服务,容器化以deployment资源类型的pod方式运行且具有服务异常自重启机制,增大了异常问题处理方式难度。
[0004]Ceph在出现unfound异常后集群状态会不健康,业务应用在访本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种容器化部署Ceph集群对象unfound故障的恢复方法,其特征是所述的方法具体步骤包括:S1定位查找出unfound对象对应的pg及所映射的OSD;S2容器化下对pg映射OSD上unfound对象执行修复的特定操作方式;S3容器化下对执行修复后的unfound对象可用性及集群状态进行检测。2.根据权利要求1所述的方法,其特征是所述S1中根据unfound对象基础信息获取到pg及所映射的OSD ID信息,具体步骤包括:S101通过ceph health detail命令查询出unfound状态的pg编号及pg所映射的osd,记录并存储查询信息;S102根据osd的id通过ceph osd find osd.id命令查询出osd所在的存储节点host和osd_fsid,记录并存储查询信息;S103根据osd所在存储节点信息和osd.id,通过ceph

volume命令查询出osd对应的磁盘盘符,记录并存储查询信息。3.根据权利要求2所述的方法,其特征是所述S2容器化下对pg映射OSD上unfound对象执行修复的特定操作方式并特指容器化的操作,区别于服务管理osd的方式;修复的特定具体步骤包括:S301执行ceph pg repair${pgid},并检测pg所在osd的log输出和ceph集群状态;S302针对上步恢复失败的操作执行revert操作;S303根据unfound对象所在的pg及映射的osd停止osd服务。4.根据权利要求3所述的方法,其特征是所述S3容器化下对执行修复后的unfound对象可用性及集群状态进行检测;恢复后对象的可用性指使用该对象的应用能正常的读写数据,及数据损坏后的重写操作;并保证Ceph集群状态的监控,告警解除。5.一种容器化部署Ceph集群对象unfound故障的恢复系统,其特征是所述的系...

【专利技术属性】
技术研发人员:宋伟蔡卫卫谢涛涛申嘉童赵磊
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1