获取平台故障成因的方法及平台故障自动检查处置方法技术

技术编号:37641301 阅读:20 留言:0更新日期:2023-05-25 10:08
本发明专利技术公开了一种获取平台故障成因的方法及平台故障自动检查处置方法,包括以下步骤:(a)输入:预先制造各种故障,通过系统监控和日志分析的方式获得故障成因分析的输入信息;(b)中心化处理:对于每个所述输入信息,减去其均值,使其变成零均值信息;(c)白化处理:利用加权相关系数的PCA算法对所述实际故障信息向量X进行线性变换以得到白化矩阵V;(d)故障成因分析:利用改进的牛顿迭代法,从输入信息中分离出故障成因关键指标和其线性组合系数,从而计算出故障DNA;(e)输出:根据故障成因分析模型,输出故障关键指标和指标之间的线性组合。能够从多个混合故障信息中分离出故障成因中的关键指标和指标之间的关联关系。因中的关键指标和指标之间的关联关系。因中的关键指标和指标之间的关联关系。

【技术实现步骤摘要】
获取平台故障成因的方法及平台故障自动检查处置方法


[0001]本专利技术属于分布式系统中平台故障检测
,涉及一种获取平台故障成因的方法及平台故障自动检查处置方法。

技术介绍

[0002]现有的平台故障检测方法主要是基于人工检测方法,需要有硬件技术员、软件程序员等专业技能人才参与:需要专业人员来判断故障类型(例如网络故障、服务器故障),然后根据收集到的信息对可能的故障原因进行排查和诊断,确认故障源头;需要人工收集和分析平台的日志和报告,以确定故障原因和影响范围;根据诊断结果,采取相应措施解决故障,例如修复程序、替换硬件等等;在解决问题后,需要手动验证平台是否已经恢复正常运行,需要人工模拟用户使用平台或者进行系统测试来验证;同时对解决问题的过程进行手动记录和分析,总结经验教训以便今后遇到类似问题时能够更快速、更有效地解决。
[0003]现有检测方法中包括一些辅助人工故障诊断的监控工具,可以记录故障时的硬件、平台组件状态,收集OS组件与故障日志,同时报告各种系统指标、警告和错误,以保证系统的可用性、可靠性和安全性。现有常用的监控工具有N本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种获取平台故障成因的方法,其特征在于,包括以下步骤:(a)输入:预先制造各种故障,通过系统监控和日志分析的方式获得故障成因分析的输入信息;所述故障成因分析的输入信息为混合故障信息矩阵,其包括CPU占用率、内存占用率、网络流量统计和错误代码;(b)中心化处理:对于每个所述输入信息,减去其均值,使其变成零均值信息;所述输入信息为实际故障信息向量X;(c)白化处理:利用加权相关系数的PCA算法对所述实际故障信息向量X进行线性变换以得到白化矩阵V;(d)故障成因分析:利用改进的牛顿迭代法,从输入信息中分离出故障成因关键指标和其线性组合系数,从而计算出故障DNA;(e)输出:根据故障成因分析模型,输出故障关键指标和指标之间的线性组合。2.根据权利要求1所述获取平台故障成因的方法,其特征在于:步骤(a)中,各种所述故障通过故障注入进行预先制造;所述故障注入包括以下步骤:(a1)制定故障注入计划:确定需要注入的故障类型和注入时间,并记录下来;(a2)进行故障注入:根据所述故障注入计划,人为地关闭一个服务、随机地杀死某个进程或/和故意制造网络延迟,记录日志以进行后续分析。3.根据权利要求1所述获取平台故障成因的方法,其特征在于,步骤(c)中,所述加权相关系数按以下公式计算:。4.根据权利要求3所述获取平台故障成因的方法,其特征在于,步骤(c)中,还计算每两个故障输入信息之间的相关系数以得到相关系数矩阵P,再计算相关系数矩阵P的特征向量矩阵U和特征值矩阵∧以得到白化矩阵V;;。5.根据权利要求1所述获取平台故障成因的方法,其特征在于,...

【专利技术属性】
技术研发人员:李子星赵涛聂少龙
申请(专利权)人:霖济智云科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1