【技术实现步骤摘要】
一种批量诊断服务器故障的方法及系统
[0001]本专利技术涉及服务器故障诊断领域,特别是涉及一种批量诊断服务器故障的方法及系统。
技术介绍
[0002]目前,服务器故障是困扰服务器厂商问题之一,妥善解决客户服务器故障是服务器厂商应尽义务。现有的解决服务器故障的方式,是通过客服人员到客户现场解决服务器故障,并将客户服务器的日志等信息拷贝回来,通过人工对日志进行分析。但这种解决故障的方式,客服人员出差成本高,需要付出较大的人力成本;采用人工分析方式,分析准确性效率不高;并且,服务器故障日志作为重要的数据源,没有合理利用开发。
[0003]目前服务器种类多,服务器上固件种类繁多,现有的方法无法实现统一有效的兼容所有机型和每种机型上所有类型固件的故障诊断的问题;并且运维机房中服务器数量非常庞大,少则数百台,多则上万台服务武器,如果只使用一种单机版的诊断工具,一个是花费的时间多,工作量大,另一个是很难实现做到实时监控等问题;现有技术中无法解决服务器故障诊断准确率及定位精准的问题。
技术实现思路
[0004]本专 ...
【技术保护点】
【技术特征摘要】
1.一种批量诊断服务器故障的方法,其特征在于,包括:获取服务器中选择日志和硬件日志;检测选择日志第一预设时间段内是否被清除;若被清除,则检测硬件日志中对应的固件的状态;若未被清除,则检测固件中告警信息次数,并判断是否超过告警次数阈值,若未超过告警次数阈值,则服务器无故障,若超过告警次数阈值,则检查选择日志状态,若选择日志状态为“取消评估”,则服务器无故障,否则,检测硬件日志中固件的状态;根据检测的固件的状态分别检测不同固件状态下选择日志中是否出现过对应的固件故障,若出现过则提取故障信息并与服务器中配置文件中的解决方法进行关联性分析,确定故障产生的原因。2.根据权利要求1所述的一种批量诊断服务器故障的方法,其特征在于:所述检测选择日志第一预设时间段内是否被清除包括以下步骤:根据正则表达式检测选择日志能否匹配清除命令;若能匹配清除命令,则选择日志第一预设时间段内被清除,使用分隔符将选择日志分割为若干段,并将若干段中第二段记为清除选择日志日期;若不能匹配清除命令,则获取选择日志中最后一行的信息,记为最新选择日志日期;比较清除选择日志日期和最新选择日志日期,若清除选择日志日期和最新选择日志日期相同,则选择日志第一预设时间段内被清除,否则选择日志第一预设时间段内未被清除。3.根据权利要求1所述的一种批量诊断服务器故障的方法,其特征在于:所述检测固件中告警信息次数包括:根据服务器配置文件中诊断规则读取选择日志中与诊断规则相匹配的日志信息;从相匹配的日志信息中提取固件信息;循环遍历固件信息,以固件信息中固件的类型和关键字为命令,从选择日志中匹配出符合固件的类型和关键字命令的日志信息并获取最后一行日志信息,记为“最后行”;从“最后行”中提取日期信息记为最后日期;以最后日期、固件的类型和关键字为命令从选择日志中得出固件中告警信息次数。4.根据权利要求3所述的一种批量诊断服务器故障的方法,其特征在于:所述检测硬件日志中对应的固件的状态包括以下步骤:检测固件信息是否在硬件日志中;若固件信息在硬件日志中,则检查固件信息对应的硬件日志中的状态是否为:“完好”或“无问题”;若不为“完好”或“无问题”,则输出“风险”;若为“完好”或“无问题”,则检查固件状态为“禁止读取状态”、“只读事件状态”或“其他状态”;若固件信息不在硬件日志中,则输出错误固件...
【专利技术属性】
技术研发人员:孔涛,王吉宏,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。