一种监控分布式存储系统的方法及装置制造方法及图纸

技术编号:23897966 阅读:40 留言:0更新日期:2020-04-22 09:26
本发明专利技术提供一种监控分布式存储系统的方法及装置,监控服务器向分布式存储系统中的各集群发送采集指令;监控服务器获取各集群基于采集指令反馈的监控数据,监控数据包括集群自身的健康数据以及与集群相连的客户端的状态数据;针对至少一个集群,监控服务器根据预设的告警规则,从集群的监控数据中确定告警信息并将告警信息上报至告警平台。该方案,监控服务器将采集指令下发至分布式存储系统中的各集群,使得监控服务器可同时监控多个集群;此外,各集群所反馈的监控数据中包括与集群相连的客户端的状态数据,有利于监控服务器通过对与集群相连的客户端的状态数据的分析来确定告警信息,实现了监控服务器对与集群相连的客户端进行监控的目的。

【技术实现步骤摘要】
一种监控分布式存储系统的方法及装置
本专利技术涉及金融科技(Fintech)领域,尤其涉及一种监控分布式存储系统的方法及装置。
技术介绍
随着计算机技术的发展,越来越多的技术(例如:区块链、云计算或大数据)应用在金融领域,传统金融业正在逐步向金融科技转变,大数据技术也不例外。但由于金融、支付行业的安全性、实时性要求,也对大数据技术提出了更高的要求。出于对海量数据所要求的可扩展性以及高可用性等因素的考虑,银行业一般选择将CephFS(CephFileSystem,Ceph文件系统)这样一种分布式存储系统作为共享存储的技术方案,其中,CephFS下连接有CephFuse客户端;与此同时,本领域的技术人员通常采用开源的Prometheus这样一种监控系统对CephFS进行监控。其中,Prometheus主要由Exporters和PrometheusSever等部分组成;CephFS主要由监视器(Monitor,简写成MON)、目标存储设备(ObjectStorageDevice,简写成OSD)以及元数据服务器(MetaDataSever,简写本文档来自技高网...

【技术保护点】
1.一种监控分布式存储系统的方法,其特征在于,包括:/n监控服务器向所述分布式存储系统中的各集群发送采集指令;/n所述监控服务器获取所述各集群基于所述采集指令反馈的监控数据,所述监控数据包括集群自身的健康数据以及与集群相连的客户端的状态数据;/n针对至少一个集群,所述监控服务器根据预设的告警规则,从所述集群的监控数据中确定告警信息并将所述告警信息上报至告警平台。/n

【技术特征摘要】
1.一种监控分布式存储系统的方法,其特征在于,包括:
监控服务器向所述分布式存储系统中的各集群发送采集指令;
所述监控服务器获取所述各集群基于所述采集指令反馈的监控数据,所述监控数据包括集群自身的健康数据以及与集群相连的客户端的状态数据;
针对至少一个集群,所述监控服务器根据预设的告警规则,从所述集群的监控数据中确定告警信息并将所述告警信息上报至告警平台。


2.如权利要求1所述的方法,其特征在于,所述监控服务器为多台;任一集群中包括多台节点服务器,且连接有客户端的各节点服务器所连接的客户端均相同;
所述监控服务器向所述分布式存储系统中的各集群发送采集指令,包括:
针对任一台监控服务器,所述监控服务器向任一集群中的至少两台节点服务器下发采集指令。


3.如权利要求1所述的方法,其特征在于,所述告警规则包括告警生成规则;
所述监控服务器根据预设的告警规则,从所述监控数据中确定告警信息,包括:
所述监控服务器从所述监控数据中确定出与所述集群的连接状态发生变化的第一客户端;
所述监控服务器根据所述集群的业务变化确定与所述集群的连接状态发生变化的第二客户端;
根据包含在所述第一客户端中却不包含在所述第二客户端中的客户端及所述告警生成规则,生成客户端的告警信息。


4.如权利要求3所述的方法,其特征在于,所述告警规则还包括告警抑制规则;
所述监控服务器确定所述集群的业务变化的变化时长;
所述监控服务器设置所述客户端的告警信息的告警抑制规则,所述客户端的告警抑制规则用于将在所述变化时长内产生的所述客户端的告警信息不进行上报。


5.如权利要求3所述的方法,其特征在于,所述监控服务器根据所述集群自身的健康数据生成所述集群的MDS组件的告...

【专利技术属性】
技术研发人员:龚治文饶俊明卢道和郑晓腾龚洵峰刘生庆吴立吴传民
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1