故障节点的定位方法和定位装置、以及数据库集群系统制造方法及图纸

技术编号:26845337 阅读:25 留言:0更新日期:2020-12-25 13:07
本发明专利技术公开了故障节点的定位方法和定位装置、以及数据库集群系统,涉及计算机计算领域。该故障节点的定位方法的一具体实施方式包括:采集所属数据库集群包含的至少一个数据节点上的负载值,确定负载值最高的数据节点为本次问题节点;根据所属数据库集群的负载信息,判断本次问题节点是否处于负载倾斜状态;在本次问题节点处于负载倾斜状态的情况下,发送本次问题节点的告警信息,以对本次问题节点所在的机器进行故障检查。该实施方式可以让运维人员及时发现故障,还能够提高故障定位的准确率,减少数据库集群的故障运行时间,保障数据库集群的平稳运行。

【技术实现步骤摘要】
故障节点的定位方法和定位装置、以及数据库集群系统
本专利技术涉及计算机
,尤其涉及一种故障节点的定位方法和定位装置、以及数据库集群系统。
技术介绍
分布式数据库集群允许数据在多个节点上存储,对企业系统的业务逻辑不会产生影响,是很多企业在处理和存储数据时优先选择的解决方案。对于分布式架构,需要在多个节点上执行请求,当所有节点都执行并返回后才是完成请求,因此当出现性能问题时,需要在多个节点上进行定位,也即,多个节点会造成在运维上增加难度。现有技术分布式数据库集群的性能故障定位方法中,需要用户反馈去检查故障;或者,人工巡检收集节点所在机器的日志,然后对收集的日志进行分析,查询出故障问题。但是,在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:用户反馈才去检查故障的方法中,当有大批量高负载作业时,待到用户发现时已对作业产生较大影响;人工巡检收集机器日志进行分析的方法中,不仅工作量高且效率低下,无法及时快速定位故障节点。
技术实现思路
有鉴于此,本专利技术实施例提供一种故障节点的定位方法和定位装置、以及数据库集群本文档来自技高网...

【技术保护点】
1.一种故障节点的定位方法,其特征在于,包括:/n采集所属数据库集群包含的至少一个数据节点上的负载值,确定负载值最高的数据节点为本次问题节点;/n根据所述所属数据库集群的负载信息,判断所述本次问题节点是否处于负载倾斜状态;/n在所述本次问题节点处于负载倾斜状态的情况下,发送所述本次问题节点的告警信息,以对所述本次问题节点所在的机器进行故障检查。/n

【技术特征摘要】
1.一种故障节点的定位方法,其特征在于,包括:
采集所属数据库集群包含的至少一个数据节点上的负载值,确定负载值最高的数据节点为本次问题节点;
根据所述所属数据库集群的负载信息,判断所述本次问题节点是否处于负载倾斜状态;
在所述本次问题节点处于负载倾斜状态的情况下,发送所述本次问题节点的告警信息,以对所述本次问题节点所在的机器进行故障检查。


2.根据权利要求1所述的方法,其特征在于,所述所属数据库集群的负载信息包括:所述所属数据库集群的上次问题节点、所述所属数据库集群的负载均值、以及所述所属数据库集群的工作状态。


3.根据权利要求2所述的方法,其特征在于,所述根据所述所属数据库集群的负载信息,判断所述本次问题节点是否处于负载倾斜状态,包括:
判断所述本次问题节点与所述上次问题节点是否为同一个节点、所述本次问题节点上的负载值与所述负载均值的比值是否大于预设比例阈值、以及所述工作状态是否为非空闲状态;
若是,则确认所述本次问题节点处于负载倾斜状态;
若否,则确认所述本次问题节点未处于负载倾斜状态。


4.根据权利要求3所述的方法,其特征在于,在判断所述上次问题节点与所述本次问题节点是否为同一个节点之前,所述方法还包括:
获取所述上次问题节点;其中,所述上次问题节点为上一次采集确定的负载值最高的数据节点。


5.根据权利要求3所述的方法,其特征在于,在判断所述本次问题节点上的负载值与所述负载均值的比值是否大于预设比例阈值之前,所述方法还包括:
对剩余数据节点上的负载值进行均值计算,获得所述所属数据库集群的负载均值;其中,
所述剩余数据节点为所述所属数据库集群包含的至少一个数据节点中所述本次问题节点之外的数据节点。


6.根据权利要求3所述的方法,其特征在于,所述判断所述当前工作状态是否为非空闲状态,包括:
判断所述所属数据库集群对应的查询语句是否小于预设个数且所述本次问题节点上的负载值是否小于预设负载值阈值;
若是,则确定所述当前工作状态为空闲状态,若否,则确定所述当前工作状态为非空闲状态。


7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
若所述所属数据库集群对应的查询语句不小于预设个数且所述本次问题节点上的负载值小于预设负载值阈值,则发送所述所属数据库集群的异常信息。


8.根据权利要求1所述的方法,其特征在于,在发送所述本次问题节点的告警信息之前,所述方法还包括:
查询所述本次问题节点所在的机器的操作系统日志,判断所述操作系统日志中是否已经出现至少一次报错关键字;
若是,则发送所述本次问题节点的告警信息,若否,则监控所述本次问题节点的状态;
在所述本次问题节点持续处于负载倾斜状态的时间大于预设时间的情况下,对所述本次问题节点所在的机器进行停机处理,以对所述本次问题节点所在的机器进行检查。


9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述本次问题节点处于负载倾斜状态的情况下,将所述本次问题节点从所述所属数据库集群包含的至少一个数据节点中隔离出去;以及,
在所述本次问题节点对应的机器通过故障检查维修后,将所述本次问题节点加入所述所属数据库集群包含的至少一个数据节点中。


10.根据权利要求1或3所述的方法,其特征在于,所述方法还包括:
在所述本次问题节点未处于负载倾斜状态的情况下,确认所述所属数据库集群正常工作运行。


11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据接收的定位故障节点请求,获取预设采集时间周期,按照所述预设采集时间周期,定时执行负载值采集。


12.根据权利要求11所述的方法,其特...

【专利技术属性】
技术研发人员:蔡雅琼吕文栋陈晓新邓宇
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1