一种服务器故障诊断方法、装置及电子设备制造方法及图纸

技术编号:30633862 阅读:33 留言:0更新日期:2021-11-04 00:15
本发明专利技术实施例提供了一种服务器故障诊断方法、装置及电子设备,所述方法包括:采集目标服务器运行参数的服务器时序数据,以及运行在目标服务器上服务的运行参数的服务时序数据;从服务器时序数据和服务时序数据中,确定预先指定的各监控指标对应的异常点和异常点对应的时间戳;基于各监控指标对应的异常点和异常点对应的时间戳,确定历史时间段内与目标服务器的目标硬件发生故障相关联的目标指标;计算目标指标为异常点的概率,并基于目标指标为异常点的概率与第一预设阈值之间的关系,确定目标硬件是否将会发生故障。本发明专利技术实施例,能够减少服务器故障所引起的运行在服务器上应用程序的故障。程序的故障。程序的故障。

【技术实现步骤摘要】
一种服务器故障诊断方法、装置及电子设备


[0001]本专利技术涉及故障诊断
,特别是涉及一种服务器故障诊断方法、装置及电子设备。

技术介绍

[0002]随着企业等数据中心服务器节点数的增加,服务器节点的硬件故障时有发生,服务器硬件故障的情况会影响服务器中正在运行的应用程序。服务器硬件故障,例如,磁盘只读、内存故障等等。
[0003]相关技术中,针对服务器硬件故障的情况,设置相应的监控系统,该监控系统采集各服务器的硬件参数以及运行在各服务器上应用程序的参数,进而基于预先设定的参数阈值,以及所采集的硬件参数和应用程序的参数,判断对应的服务器硬件是否故障,并在判断出服务器硬件故障的情况下,输出告警信息,以使得维修人员对服务器硬件故障对应的服务器进行修复和相关应用程序的下线处理。
[0004]相关技术中,在监控系统判断出服务器硬件故障时,才对服务器硬件故障对应的服务器进行修复和相关应用程序的下线处理,然而此时对应的服务器已经发生故障,对在服务器上运行的应用程序已经产生了影响,使得在服务器上运行的应用程序发生故障,且该影响可能会为服本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种服务器故障诊断方法,其特征在于,所述方法包括:采集目标服务器运行参数的服务器时序数据,以及运行在所述目标服务器上服务的运行参数的服务时序数据;从所述服务器时序数据和所述服务时序数据中,确定预先指定的各监控指标对应的异常点和所述异常点对应的时间戳;基于所述各监控指标对应的异常点和所述异常点对应的时间戳,确定历史时间段内与所述目标服务器的目标硬件发生故障相关联的目标指标;计算所述目标指标为异常点的概率,并基于所述目标指标为异常点的概率与第一预设阈值之间的关系,确定所述目标硬件是否将会发生故障。2.根据权利要求1所述的方法,其特征在于,所述基于所述各监控指标对应的异常点和所述异常点对应的时间戳,确定历史时间段内与所述目标服务器的目标硬件发生故障相关联的目标指标,包括:基于所述各监控指标对应的异常点和所述异常点对应的时间戳,计算历史时间段内目标硬件发生故障对应的故障时间内,各监控指标或各组合监控指标为异常点的概率;所述组合监控指标为至少包含两个监控指标的指标组合;判断所述概率是否大于第二预设阈值;如果大于,则将所述概率大于所述第二预设阈值对应的监控指标或组合监控指标确定为目标指标。3.根据权利要求1所述的方法,其特征在于,所述从所述服务器时序数据和所述服务时序数据中,确定预先指定的各监控指标对应的异常点和所述异常点对应的时间戳,包括:针对所述服务器时序数据和所述服务时序数据中每一预先指定的监控指标,计算该监控指标对应的权重系数;基于所述权重系数,计算该监控指标对应的修正权重系数;判断所述修正权重系数是否大于第三预设阈值;如果大于,则该监控指标为异常点,并确定该异常点对应的时间戳。4.根据权利要求3所述的方法,其特征在于,所述计算所述目标指标为异常点的概率,包括:计算所述目标指标对应的修正权重系数,将所述修正权重系数确定为所述目标指标为异常点的概率;在所述目标指标为组合指标的情况下,所述基于所述目标指标为异常点的概率与第一预设阈值之间的关系,确定所述目标硬件是否将会发生故障,包括:判断所述组合指标中每一子目标指标为异常点的概率是否均...

【专利技术属性】
技术研发人员:孙吴昊郭广路
申请(专利权)人:北京爱奇艺科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1