【技术实现步骤摘要】
一种容器化部署Ceph集群对象unfound故障的恢复方法及系统
[0001]本专利技术公开一种容器化部署Ceph集群对象unfound故障的恢复方法及系统,涉及云计算存储
技术介绍
[0002]Ceph分布式存储系统通过多副本机制和故障域来保障数据的强一致性和完整性。但当Ceph存储集群在遇到集群突然掉电或存储介质缓存异常等极端情况下会导致数据对象的损坏或丢失,容器化部署环境下OSD进程的管理方式和非容器化部署有较大差异,本专利技术主要针对容器化部署环境下遇到unfound对象故障的恢复方法
[0003]Ceph容器化部署的主流方式是基于Rook和Kubernetes进行Ceph集群的自动化部署,容器化部署提高了部署的效率和降低了部署复杂度,但是微服务化的服务管理方式和传统服务的方式有较大的管理差异:传统是以service方式管理服务,容器化以deployment资源类型的pod方式运行且具有服务异常自重启机制,增大了异常问题处理方式难度。
[0004]Ceph在出现unfound异常后集群状态会 ...
【技术保护点】
【技术特征摘要】
1.一种容器化部署Ceph集群对象unfound故障的恢复方法,其特征是所述的方法具体步骤包括:S1定位查找出unfound对象对应的pg及所映射的OSD;S2容器化下对pg映射OSD上unfound对象执行修复的特定操作方式;S3容器化下对执行修复后的unfound对象可用性及集群状态进行检测。2.根据权利要求1所述的方法,其特征是所述S1中根据unfound对象基础信息获取到pg及所映射的OSD ID信息,具体步骤包括:S101通过ceph health detail命令查询出unfound状态的pg编号及pg所映射的osd,记录并存储查询信息;S102根据osd的id通过ceph osd find osd.id命令查询出osd所在的存储节点host和osd_fsid,记录并存储查询信息;S103根据osd所在存储节点信息和osd.id,通过ceph
‑
volume命令查询出osd对应的磁盘盘符,记录并存储查询信息。3.根据权利要求2所述的方法,其特征是所述S2容器化下对pg映射OSD上unfound对象执行修复的特定操作方式并特指容器化的操作,区别于服务管理osd的方式;修复的特定具体步骤包括:S301执行ceph pg repair${pgid},并检测pg所在osd的log输出和ceph集群状态;S302针对上步恢复失败的操作执行revert操作;S303根据unfound对象所在的pg及映射的osd停止osd服务。4.根据权利要求3所述的方法,其特征是所述S3容器化下对执行修复后的unfound对象可用性及集群状态进行检测;恢复后对象的可用性指使用该对象的应用能正常的读写数据,及数据损坏后的重写操作;并保证Ceph集群状态的监控,告警解除。5.一种容器化部署Ceph集群对象unfound故障的恢复系统,其特征是所述的系...
【专利技术属性】
技术研发人员:宋伟,蔡卫卫,谢涛涛,申嘉童,赵磊,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。