一种机器故障自动化处理方法技术

技术编号:14803325 阅读:66 留言:0更新日期:2017-03-14 23:28
本发明专利技术公开了一种机器故障自动化处理方法,所述方法通过在操作系统的内核中打入故障补丁模块,用于收集机器故障信息,将故障的详细信息封装好通过内核态和用户态的传输通道模块,将收集的故障信息传送到用户态,供故障统计分析模块使用,列出故障分布图表,然后将故障分析结果传送给故障处理模块进行处理。本发明专利技术方法使用内核热补丁的方式,将内核产生的故障信息传输得到用户态,并将这些信息集中管理、统计、分析,以及自动化处理,大大减少了故障管理的工作,实现故障管理的自动化,能及时有效的发现并解决故障,保证系统及关键服务的安全、可靠的运行,均具有很高的技术价值。

【技术实现步骤摘要】

本专利技术涉及计算机故障处理
,具体涉及一种机器故障自动化处理方法
技术介绍
随着计算机技术以及集成电路技术的飞速发展,不论从软件还是硬件,计算机都得到了飞速提升。由于计算机硬件的增加,同时也提高了计算机硬件的故障率,给管理员带来很大的挑战,需要经常的关注机器的健康状态,即便如此也很难做到及时发现故障。机器产生故障时,需要管理员查看大量的系统日志并分析,花费很长时间去修复故障的设备,而且现在有些服务数据量巨大,服务器的集群也是相当大,维护起来相当的费时费力,而且可能严重影响服务的质量。
技术实现思路
本专利技术要解决的技术问题是:本专利技术提供一种机器故障自动化处理方法,能够解决上述问题。本专利技术所采用的技术方案为:一种机器故障自动化处理方法,所述方法通过在操作系统的内核中打入故障补丁模块,用于收集机器故障信息,将故障的详细信息封装好通过内核态和用户态的传输通道模块,将收集的故障信息传送到用户态,供故障统计分析模块使用,列出故障分布图表,然后将故障分析结果传送给故障处理模块进行处理。所述故障补丁模块,负责收集内核中产生的机器故障信息,以故障补丁模块的方式向内核中添加代码,不用修改已安装的内核(如使用kpatch工具就可以实现该功能),很方便在各个机器上使用该方法处理故障。所述内核态和用户态传输通道模块,通过创建一个用户态和内核态通信的通道,将故障信息安全高效的传输到用户态。所述故障处理模块,根据故障分析的结果,对该故障自动做合理的处理,如自动修复故障,若修复不成功,还可以隔离该故障,以免该故障对系统或者关键服务造成严重的影响,产生严重的后果,同时把故障的处理结果及详细的信息发送给管理员,以确保故障处理是否合理。所述方法当前使用的机器及Linux操作系统支持kpatch,kpatch是内核热补丁(kernelpatch)工具,热补丁就是操作系统在运行过程中打入内核补丁。所述方法操作过程如下:首先将收集故障的补丁模块加载到内核中;然后利用kpatch工具产生补丁模块并加载到系统中;当机器产生故障后补丁模块就会收集到相关故障信息,然后将该信息放入到netlink的通道中,发送到用户态;Netlink是Linux系统中内核态和用户态通信的方式;当故障信息被传送到用户态,对这些信息做统计,制作图表或曲线更直观的观察故障,根据故障的类型及原因做相应的故障处理,如内存错误,可以将故障的内存做离线,避免了故障内存再次被使用,使系统不稳定。本专利技术的有益效果为:本专利技术方法弥补了人为监控机器健康状态、手动管理故障及分析故障产生原因效率低下、不能及时有效处理而导致机器不能稳定运行的不足,使用内核热补丁的方式,将内核产生的故障信息传输得到用户态,并将这些信息集中管理、统计、分析,以及自动化处理,大大减少了故障管理的工作,实现故障管理的自动化,能及时有效的发现并解决故障,保证系统及关键服务的安全、可靠的运行,均具有很高的技术价值。当机器故障时,无需手动分析大量的内核日志或其他故障日志,而且产生故障时会及时得到通知,或者通过故障统计分析结果自动修复故障,大大缩短了机器故障的修复时间,在机器的维护和故障管理上有很高的技术价值。附图说明图1为机器故障自动化处理流程图。具体实施方式下面通过说明书附图,结合具体实施方式对本专利技术进一步说明:实施例1:如图1所示,一种机器故障自动化处理方法,所述方法通过在操作系统的内核中打入故障补丁模块,用于收集机器故障信息,如故障的硬件、故障的位置、故障的原因等,将故障的详细信息封装好通过内核态和用户态的传输通道模块,将收集的故障信息传送到用户态,供故障统计分析模块使用,列出故障分布图表,然后将故障分析结果传送给故障处理模块进行处理,如故障修复、故障隔离、故障详细日志、故障通告等操作。实施例2:在实施例1的基础上,本实施例所述故障补丁模块,负责收集内核中产生的机器故障信息,以故障补丁模块的方式向内核中添加代码,不用修改已安装的内核(如使用kpatch工具就可以实现该功能),很方便在各个机器上使用该方法处理故障。实施例3:在实施例1的基础上,本实施例所述内核态和用户态传输通道模块,通过创建一个用户态和内核态通信的通道,将故障信息安全高效的传输到用户态。实施例4:在实施例1的基础上,本实施例所述故障处理模块,根据故障分析的结果,对该故障自动做合理的处理,如自动修复故障,若修复不成功,还可以隔离该故障,以免该故障对系统或者关键服务造成严重的影响,产生严重的后果,同时把故障的处理结果及详细的信息发送给管理员,以确保故障处理是否合理。实施例5:在1-4任一实施例的基础上,本实施例所述方法当前使用的机器及Linux操作系统支持kpatch,kpatch是内核热补丁(kernelpatch)工具,热补丁就是操作系统在运行过程中打入内核补丁。实施例5:在实施例5的基础上,本实施例所述方法操作过程如下:首先将收集故障的补丁模块加载到内核中,该补丁模块可以根据需求开发;然后利用kpatch工具产生补丁模块并加载到系统中;当机器产生故障后补丁模块就会收集到相关故障信息,然后将该信息放入到netlink的通道中,发送到用户态;Netlink是Linux系统中内核态和用户态通信的方式;当故障信息被传送到用户态,对这些信息做统计,制作图表或曲线更直观的观察故障,根据故障的类型及原因做相应的故障处理,如内存错误,可以将故障的内存做离线,避免了故障内存再次被使用,使系统不稳定。以上实施方式仅用于说明本专利技术,而并非对本专利技术的限制,有关
的普通技术人员,在不脱离本专利技术的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本专利技术的范畴,本专利技术的专利保护范围应由权利要求限定。本文档来自技高网
...

【技术保护点】
一种机器故障自动化处理方法,其特征在于:所述方法通过在操作系统的内核中打入故障补丁模块,用于收集机器故障信息,将故障的详细信息封装好通过内核态和用户态的传输通道模块,将收集的故障信息传送到用户态,供故障统计分析模块使用,列出故障分布图表,然后将故障分析结果传送给故障处理模块进行处理。

【技术特征摘要】
1.一种机器故障自动化处理方法,其特征在于:所述方法通过在操作系统的内核中打入故障补丁模块,用于收集机器故障信息,将故障的详细信息封装好通过内核态和用户态的传输通道模块,将收集的故障信息传送到用户态,供故障统计分析模块使用,列出故障分布图表,然后将故障分析结果传送给故障处理模块进行处理。
2.根据权利要求1所述的一种机器故障自动化处理方法,其特征在于:所述故障补丁模块,负责收集内核中产生的机器故障信息,以故障补丁模块的方式向内核中添加代码,不用修改已安装的内核。
3.根据权利要求1所述的一种机器故障自动化处理方法,其特征在于:所述内核态和用户态传输通道模块,通过创建一个用户态和内核态通信的通道,将故障信息安全高效的传输到用户态。
4.根据权利要求1所述的一种机器故障自动化处理方法,其特征在于:所述故障处理模块,根据故障...

【专利技术属性】
技术研发人员:常现超
申请(专利权)人:浪潮集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1