一种计算机用服务器故障预警方法技术

技术编号:38385499 阅读:12 留言:0更新日期:2023-08-05 17:41
本发明专利技术涉及安全预警技术领域,具体为一种计算机用服务器故障预警方法;通过对服务器数据信息中的数据进行异常值的删除和保留,并对空缺位和删除位进行数据填充,去除异常数据干扰,以保证数据的可靠性和准确性,提高预测模型的准确性;通过对服务器内存数据信息和服务器CPU数据信息分别进行多模型综合分析进行服务器存储容量、CPU运行和服务器运行状态进行准确故障预警,利用多数据模型综合分析判断,提高服务器运行预警的准确率,实现服务器故障预警的优化;依据接收到的服务器故障预警类型进行优化预警通知,便于在服务器故障预警时能够第一时间进行服务器故障预警通知并选取合适的人员进行管理,实现服务预警通知的优化。实现服务预警通知的优化。实现服务预警通知的优化。

【技术实现步骤摘要】
一种计算机用服务器故障预警方法


[0001]本专利技术涉及安全预警
,具体为一种计算机用服务器故障预警方法。

技术介绍

[0002]计算机用服务器故障预警方法从数据采集到故障预测、预警通知到故障诊断分析,通过对服务器性能指标数据进行实时监控和预测分析。
[0003]存在以下方面的缺陷:1、故障预测准确率有限:当前服务器故障预警方法主要使用数据挖掘和机器学习算法进行故障预测,使用的数据质量不高,预警准确率不够高,容易误报或漏报;2、预警通知不够完善:当前服务器故障预警方法通常是通过邮件、短信等方式向管理员发出故障预警,但在某些情况下,这种方式无法及时对预警通知进行有效处理,不够实时,尤其是在管理员不在办公室的时候。

技术实现思路

[0004]本专利技术的目的在于提供一种计算机用服务器故障预警方法。
[0005]本专利技术的目的可以通过以下技术方案实现:一种计算机用服务器故障预警方法,包括以下步骤:S1:采集服务器数据信息,并将其保存至数据库;其中服务器数据信息包括服务器内存数据信息和服务器CPU数据信息;S2:将服务器数据进行处理之后发送至数据库保存;S3:对服务器内存数据信息进行分析以得到服务器存储指数或触发存储容量故障预警,具体为:S31:提取服务器内存数据信息,按照时间先后顺序生成内存使用报表;依据内存使用报表识别出操作点,统计操作点的数量,并计算操作点对应的释放内存的释放值;S32:取相邻释放值对应的相邻时刻进行差值计算得到相隔时长,同时将相隔时长和释放变化值通过设定的公式计算得到相邻操作变化值,其中b1和b2分别为设定的比例系数;S33:将相邻操作变化值与设定的变化区间进行比较分析,当相邻操作变化值大于设定的变化区间中的最大值时,则将该两个相邻操作点对应时刻内的时间段记为强操作时间段;当相邻操作变化值处于设定的变化区间之内时,则将该两个相邻操作点对应时刻内的时间段记为中操作时间段;当相邻操作变化值小于设定的变化区间中的最小值时,则将该两个相邻操作点对应时刻内的时间段记为弱操作时间段;S34:分别统计强操作时间段的数量tm2、中操作时间段的数量tm3和弱操作时间段的数量tm4,将其与操作点的总数n1通过设定的公式
计算得到服务器存储指数TMZ,其中c1、c2、c3和c4分别为设定的比利系数;将服务器存储指数与设定的存储阈值进行比较分析,当服务器存储指数大于设定的存储阈值时,则直接触发存储容量故障预警;否则直接输出服务器存储指数;S4:对服务器CPU数据信息运行进行CPU运行分析以得到服务器CPU运行指数或触发CPU运行故障预警。
[0006]S5:将服务器存储指数TMZ、服务器CPU运行指数CYZ通过设定的公式P=g1
×
TMZ+g2
×
CYZ计算得到服务器运行状态指数P,其中g1和g2分别为设定比例系数;据此判断服务器运行状态以触发服务器自检修复操作或者触发服务器运行状态故障预警;当触发服务器自检修复操作时,服务器进行自检修复完成之后再次对服务器进行存储状态和CPU运行分析,直至触发存储容量故障预警或CPU运行故障预警或服务器运行状态故障预警其中一种为止;S6:依据接收到的服务器故障预警类型进行优化预警通知。
[0007]优选地,数据处理的具体步骤为:S21:提取数据以生成数据条形报表,识别出异常值和空缺位;提取异常值和异常值对应的时刻,将任意两个异常值对应的时刻进行差值计算得到间隔时长,将对应两个异常值进行差值计算得到异常差;间隔时长和设定的时长区间进行比较分析以生成对应的间隔关联系数;S22:将异常差与设定的异常区间进行比较分析以生成对应的差值关联系数为;S23:将任意两个异常值的间隔时长Rat1、异常差Rat2、间隔关联系数αk和差值关联系数βk通过设定的公式计算得到两个异常值之间的关联值RAT;将关联值与设定的关联阈值进行比较分析,生成有效关联值,有效关联值对应两个时刻的异常值记为有效关联;S24:统计所有有效关联值对应的两个时刻,并将该两个时刻记为有效时刻;当任意两个有效关联值中对应的时刻有重叠时,则该两个有效关联值属于连续关联值;以此类推,将所有的关联值进行分析得到连续关联值,并提取连续关联值对应的有效时刻,按照时间先后顺序将对应的异常值排列得到连续异常值,其他时刻对应的异常值记为单点异常值;S25:利用拉格朗日插值法将空缺位和删除位进行数据填充以得到完整数据,并将其发送至数据存储。
[0008]优选地,CPU运行分析的具体步骤为:S41:设定每个CPU型号均对应一个类型值,将CPU型号与设定的所有类型进行比较匹配得到对应的类型值;S42:将时钟频率除以使用率到效能值;S43:设定温度区间;将温度与温度区间进行比较,生成高温、中温和低温,并分别统计高温、中温和低温的数量,并将其分别记为q1、q2和q3;当q1≥q2+q3时,则将CPU温度状态记为第一温度状态;当q1≥q2+q3时,则将CPU温度状态记为第三温度状态;其他情况则将CPU温度状态记为第二温度状态;设定第一温度状态、第二温度状态和第三温度状态分别对应一个温度系数;
S44:将所有的温度、低温进行求和计算得到总高温和总低温,总高温除以总低温得到温差比;再将温度系数Cw1和温差比率Cw2利用设定的公式Cm3=h1
×
Cw1+h2
×
Cw2计算得到温异值Cm3,其中h1和h2为设定的比例系数;S45:将类型值Cm1、效能值Cm2和温异值Cm3通过设定的公式计算得到服务器CPU运行指数CYZ,其中d1、d2和d3分别为设定比例系数,μ为校正因子;S46:将服务器CPU运行指数和设定的运行阈值进行比较分析,当服务器CPU运行指数大于设定的运行阈值时,则直接触发CPU运行故障预警;否则直接输出服务器CPU运行指数。
[0009]优选地,优化预警通知的具体步骤为:步骤一:当接收到故障预警时,分别调取对应故障类型的空闲状态工作人员,并将其记为备选人员;步骤二:提取备选员工距离服务器端的距离,将在预设距离范围内备选员工记为复选员工;提取复选员工与服务器端的距离记为管理距离;步骤三:设定工作人员分别对一个效处值,将复选人员与所有工作人员进行匹配得到对应的效处值;步骤四:提取复选人员的管理次数和每次管理的管理日期;获取服务器在该管理日期之后的下一次管理日期;将下一次管理日期与该管理日期作时间的差值计算得到管间时长;将复选员工所有维修次数的管间时长进行均值计算得到平均管间时长;步骤五:提取复选人员年龄Yu,将其与管理距离Gu、效处值η和平均管间时长Cu通过设定的公式计算得到管理值GMZ,其中d1、d2和d3分别为设定的比例系数,λ为设定的误差因子;将管理值最大的复选人员记为目标管理员,并将故障信息和管理指令发送至目标管理员;目标管理员的管理次数增加一次,同时目标管理员的工作状态从空闲状态变更为工作状态。
[0010]优选地,对目标管理员进行效率分析以得到效处值的具体步骤为:步骤一:提取发送管理指令时刻和接收到目标管理员回复确认管理时刻,并将本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机用服务器故障预警方法,其特征在于,包括以下步骤:S1:采集服务器数据信息;S2:将数据进行处理之后发送至数据库保存;S3:对服务器内存数据信息进行分析以得到服务器存储指数或触发存储容量故障预警,具体为:S31:提取服务器内存数据信息,按照时间先后顺序生成内存使用报表;依据内存使用报表识别出操作点,统计操作点的总数,并计算操作点对应的释放内存的释放值;S32:取相邻释放值对应的相邻时刻进行差值计算得到相隔时长,同时将相邻释放值进行差值计算得到释放变化值;将相隔时长、释放变化值进行归一化处理并取其数值,对数值进行分析得到相邻操作变化值;S33:将相邻操作变化值与设定的区间进行比较分析,当相邻操作变化值大于设定的区间中的最大值时,则将该两个相邻操作点对应时刻内的时间段记为强操作时间段;当相邻操作变化值处于设定的区间之内时,则将该两个相邻操作点对应时刻内的时间段记为中操作时间段;当相邻操作变化值小于设定的区间中的最小值时,则将该两个相邻操作点对应时刻内的时间段记为弱操作时间段;S34:分别统计强操作时间段、中操作时间段和弱操作时间段的数量,将其与操作点的数量通过数值化分析得到服务器存储指数;将服务器存储指数与设定的阈值进行比较分析,当服务器存储指数大于设定的阈值时,则直接触发存储容量故障预警;否则直接输出服务器存储指数;S4:对服务器CPU数据信息进行CPU运行分析以得到服务器CPU运行指数或触发CPU运行故障预警;S5:将服务器存储指数和服务器CPU运行指数进行归一化处理并取其数值,对数值进行分析得到服务器运行状态指数,据此判断服务器运行状态以触发服务器自检修复操作或者触发服务器运行状态故障预警;当触发服务器自检修复操作时,服务器进行自检修复完成之后再次对服务器进行存储状态和CPU运行分析,直至触发存储容量故障预警或CPU运行故障预警或服务器运行状态故障预警其中一种为止;S6:依据接收到的服务器故障预警类型进行优化预警通知。2.根据权利要求1所述的一种计算机用服务器故障预警方法,其特征在于,数据处理的具体步骤为:S21:提取数据以生成数据条形报表,识别出异常值和空缺位;提取异常值和异常值对应的时刻,将任意两个异常值对应的时刻进行差值计算得到间隔时长,将对应两个异常值进行差值计算得到异常差;间隔时长和设定的区间进行比较分析以生成对应的间隔关联系数;S22:将异常差与设定的区间进行比较分析以生成对应的差值关联系数为;S23:将任意两个异常值的间隔时长、异常差、间隔关联系数和差值关联系数进行归一化处理并取其数值,对数值分析得到两个异常值之间的关联值;将关联值与设定的关联阈值进行比较分析,生成有效关联值,有效关联值对应两个时刻的异常值记为有效关联;S24:统计所有有效关联值对应的两个时刻,并将该两个时刻记为有效时刻;当任意两个有效关联值中对应的时刻有重叠时,则该两个有效关联值属于连续关联值;以此类推,将
所有的关联值进行分析得到连续关联值,并提取连续关联值对应的有效时刻,按照时间先后顺序将对应的异常值排列得到连续异常值,其他时刻对应的异常值记为单点异常值;S25:利用拉格朗日插值法将空缺位和删除位进行数据填充以得到完整数据,并将...

【专利技术属性】
技术研发人员:唐斌冯葆党德华姚玲赵美玉
申请(专利权)人:深圳市同泰怡信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1