获取平台故障成因的方法及平台故障自动检查处置方法技术

技术编号:37641301 阅读:18 留言:0更新日期:2023-05-25 10:08
本发明专利技术公开了一种获取平台故障成因的方法及平台故障自动检查处置方法,包括以下步骤:(a)输入:预先制造各种故障,通过系统监控和日志分析的方式获得故障成因分析的输入信息;(b)中心化处理:对于每个所述输入信息,减去其均值,使其变成零均值信息;(c)白化处理:利用加权相关系数的PCA算法对所述实际故障信息向量X进行线性变换以得到白化矩阵V;(d)故障成因分析:利用改进的牛顿迭代法,从输入信息中分离出故障成因关键指标和其线性组合系数,从而计算出故障DNA;(e)输出:根据故障成因分析模型,输出故障关键指标和指标之间的线性组合。能够从多个混合故障信息中分离出故障成因中的关键指标和指标之间的关联关系。因中的关键指标和指标之间的关联关系。因中的关键指标和指标之间的关联关系。

【技术实现步骤摘要】
获取平台故障成因的方法及平台故障自动检查处置方法


[0001]本专利技术属于分布式系统中平台故障检测
,涉及一种获取平台故障成因的方法及平台故障自动检查处置方法。

技术介绍

[0002]现有的平台故障检测方法主要是基于人工检测方法,需要有硬件技术员、软件程序员等专业技能人才参与:需要专业人员来判断故障类型(例如网络故障、服务器故障),然后根据收集到的信息对可能的故障原因进行排查和诊断,确认故障源头;需要人工收集和分析平台的日志和报告,以确定故障原因和影响范围;根据诊断结果,采取相应措施解决故障,例如修复程序、替换硬件等等;在解决问题后,需要手动验证平台是否已经恢复正常运行,需要人工模拟用户使用平台或者进行系统测试来验证;同时对解决问题的过程进行手动记录和分析,总结经验教训以便今后遇到类似问题时能够更快速、更有效地解决。
[0003]现有检测方法中包括一些辅助人工故障诊断的监控工具,可以记录故障时的硬件、平台组件状态,收集OS组件与故障日志,同时报告各种系统指标、警告和错误,以保证系统的可用性、可靠性和安全性。现有常用的监控工具有Nagios,可以监控各种系统指标,如CPU使用率、内存使用率、网络流量等;Zabbix,可以监控各种系统指标、网络设备和应用程序,支持分布式监控、自动发现和数据可视化等功能;Prometheus,可以监控各种指标并支持数据可视化和告警功能,常用于云原生应用的监控。
[0004]现有的平台故障人工检测方法虽然可以帮助解决平台故障,但也存在一些问题:(1)时间成本高:人工检测需要花费大量时间来分析和诊断问题,导致平台停机时间变长,影响用户体验;(2)精度受限:人工检测的精度取决于技术人员的经验和技能水平,如果技术人员缺乏经验或错误地判断问题,会导致解决问题的延误和用户的不满;(3)人力资源有限:平台故障需要专业的技术人员来处理,而这些人力资源通常是有限的,可能会影响平台故障处理的速度和效率;(4)无法覆盖所有情况:由于平台故障种类繁多,人工检测不可能覆盖所有情况,有些问题可能需要其他技术手段来解决;(5)需要持续更新和维护:平台技术不断更新和升级,需要对平台故障人工检测方法进行持续更新和维护,以适应新的技术环境。

技术实现思路

[0005]基于上述缺陷,本专利技术提供一种获取平台故障成因的方法,以从多个混合故障信息中自动分离获得输出故障关键指标和指标之间的的关联关系。
[0006]为了达成上述目的,本专利技术提供一种获取平台故障成因的方法,包括以下步骤:(a)输入:预先制造各种故障,通过系统监控和日志分析的方式获得故障成因分析的输入信息;所述故障成因分析的输入信息为混合故障信息矩阵,其包括CPU占用率、内存占用率、网络流量统计和错误代码;(b)中心化处理:对于每个所述输入信息,减去其均值,使其变成零均值信息;所述
输入信息为实际故障信息向量X;(c)白化处理:利用加权相关系数的PCA算法对所述实际故障信息向量X进行线性变换以得到白化矩阵V;(d)故障成因分析:利用改进的牛顿迭代法,从输入信息中分离出故障成因关键指标和其线性组合系数,从而计算出故障DNA;(e)输出:根据故障成因分析模型,输出故障关键指标和指标之间的线性组合。
[0007]优化地,步骤(a)中,各种所述故障通过故障注入进行预先制造;所述故障注入包括以下步骤:(a1)制定故障注入计划:确定需要注入的故障类型和注入时间,并记录下来;(a2)进行故障注入:根据所述故障注入计划,人为地关闭一个服务、随机地杀死某个进程或/和故意制造网络延迟,记录日志以进行后续分析。
[0008]优化地,步骤(c)中,所述加权相关系数按以下公式计算:。
[0009]进一步地,步骤(c)中,还计算每两个故障输入信息之间的相关系数以得到相关系数矩阵P,再计算相关系数矩阵P的特征向量矩阵U和特征值矩阵∧以得到白化矩阵V;;。
[0010]优化地,步骤(c)中,所述相关系数定义如下:;式中,cov(x,y)是故障输入信息x和故障输入信息y的协方差,D
x
、D
y
分别是故障输入信息x和故障输入信息y的方差。
[0011]优化地,步骤(d)中,所述改进的牛顿迭代法按以下迭代公式进行:。
[0012]进一步地,步骤(d)中,所述故障成因分析模型中设有N个相互独立的故障初始预设信息和M个实际故障检测信息,所述故障初始预设信息表示为,所述M个实际故障检测信息表示为,则对每个t都有如下关系成立:
ꢀꢀꢀꢀꢀ
(a);则M个实际检测故障信息由N个初始故障预设信息按以下线性组合公式而成:
ꢀꢀꢀꢀꢀꢀ
(b);
式中,A为混合矩阵,由式(a)中的系数a
ij
组成;x
t
是已知的,s(t)和A都是未知的。
[0013]更进一步地,步骤(d)中,所述故障成因分析的目标为求得一个分离矩阵W,并通过W从x(t)中分离出独立的故障信息;定义分离出的故障信息为,则。
[0014]本专利技术的又一目的在于提供一种上述平台故障自动检查处置方法,它基于上述获取平台故障成因的方法。
[0015]优化地,还包括以下步骤:(f)利用基于模拟退火算法的隐马尔可夫模型对分离出的故障信息进行自动化诊察检测。
[0016]本专利技术获取平台故障成因的方法,通过依次进行输入、中心化处理、白化处理、故障成因分析和输出等步骤,能够从多个混合故障信息中分离出故障成因中的关键指标和指标之间的关联关系,不仅可以去除属性间的相关关系,还可以降低故障数据向量的维度,减小噪声。
附图说明
[0017]图1为本专利技术获取平台故障成因的方法的流程图;图2为本专利技术获取平台故障成因的方法中改进的牛顿迭代法算法流程图;图3为本专利技术获取平台故障成因分析模型的示意图;图4为模拟退火算法的流程图。
具体实施方式
[0018]为了使本
的人员更好地理解本专利技术,下面将结合实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员所做的等效变化与修饰前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0019]实施例1本实施例提供获取平台故障成因的方法,如图1所示,包括以下步骤:(a)输入:预先制造各种故障,通过系统监控和日志分析的方式获得故障成因分析的输入信息(输入信息为混合故障信息矩阵,其包括CPU占用率、内存占用率、网络流量统计和错误代码等大量的采集数据);为了获取故障的特征值,减少故障的诊察时间,可以预先制造各种故障并进行监控和日志分析,称为故障注入(Fault Injection)。故障注入包括以下步骤:(a1)制定故障注入计划:确定需要注入的故障类型和注入时间,并记录下来;(a2)进行故障注入:根据所述故障注入计划,人为地关闭一个服务、随机地杀死某个进程或/和故意制造网络延迟,记录日志本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种获取平台故障成因的方法,其特征在于,包括以下步骤:(a)输入:预先制造各种故障,通过系统监控和日志分析的方式获得故障成因分析的输入信息;所述故障成因分析的输入信息为混合故障信息矩阵,其包括CPU占用率、内存占用率、网络流量统计和错误代码;(b)中心化处理:对于每个所述输入信息,减去其均值,使其变成零均值信息;所述输入信息为实际故障信息向量X;(c)白化处理:利用加权相关系数的PCA算法对所述实际故障信息向量X进行线性变换以得到白化矩阵V;(d)故障成因分析:利用改进的牛顿迭代法,从输入信息中分离出故障成因关键指标和其线性组合系数,从而计算出故障DNA;(e)输出:根据故障成因分析模型,输出故障关键指标和指标之间的线性组合。2.根据权利要求1所述获取平台故障成因的方法,其特征在于:步骤(a)中,各种所述故障通过故障注入进行预先制造;所述故障注入包括以下步骤:(a1)制定故障注入计划:确定需要注入的故障类型和注入时间,并记录下来;(a2)进行故障注入:根据所述故障注入计划,人为地关闭一个服务、随机地杀死某个进程或/和故意制造网络延迟,记录日志以进行后续分析。3.根据权利要求1所述获取平台故障成因的方法,其特征在于,步骤(c)中,所述加权相关系数按以下公式计算:。4.根据权利要求3所述获取平台故障成因的方法,其特征在于,步骤(c)中,还计算每两个故障输入信息之间的相关系数以得到相关系数矩阵P,再计算相关系数矩阵P的特征向量矩阵U和特征值矩阵∧以得到白化矩阵V;;。5.根据权利要求1所述获取平台故障成因的方法,其特征在于,...

【专利技术属性】
技术研发人员:李子星赵涛聂少龙
申请(专利权)人:霖济智云科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1