【技术实现步骤摘要】
一种智能显示服务器故障信息的方法、装置及系统
[0001]本专利技术涉及服务器故障信息处理
,尤其涉及一种智能显示服务器故障信息的方法、装置及系统。
技术介绍
[0002]现有服务器的管理软件,一般按照功能模块分门别类划分,比如告警管理、性能管理等。往往服务器出现故障问题后,告警、性能、日志等其中几项或者都有异常表象。使用现有的管理软件,就必须逐个访问对应的功能模块,依靠专家综合分析这些信息进行分析,效率很低。
[0003]随着智能运维(artificial intelligence for IT operations,AIOPS)技术兴起,结合现有的日志异常检测、性能异常检测等技术,针对服务器故障,有可能探索一种新的显示故障相关信息的方法。
技术实现思路
[0004]本申请实施例提供了一种智能显示服务器故障信息的方法、装置及系统,以故障为核心,智能分析各种数据源异常的相关度,把强相关的异常汇聚在一起统一显示。避免了在多个功能模块中反复切换界面对比查看的痛点,解决了需要反复手工筛选分析对象或指标的繁琐操作。
[0005]第一方面,本申请实施例提供了一种智能显示服务器故障信息的方法,用于对服务器上的异常信息进行管理,该方法包括:接收至少一个告警信息或性能异常信息,并将其中的一个告警信息或性能异常信息作为基准异常信息;获取该基准异常信息发生的一个时间段内的至少一个其他异常信息;其中,其他异常信息包括:日志异常信息、事件信息、告警信息和性能异常信息中的至少一种;确定至少一个其他异常信息 ...
【技术保护点】
【技术特征摘要】
1.一种智能显示服务器故障信息的方法,其特征在于,所述方法用于对服务器上的异常信息进行管理,所述方法包括:接收至少一个告警信息或性能异常信息,并将其中的一个告警信息或性能异常信息作为基准异常信息;获取所述基准异常信息发生的一个时间段内的至少一个其他异常信息;所述其他异常信息包括:日志异常信息、事件信息、告警信息和性能异常信息中的至少一种;确定所述至少一个其他异常信息中的每一个其他异常信息与所述基准异常信息的综合相关度值;根据所述综合相关度值确定所述至少一个其他异常信息中需要显示给用户的其他异常信息;将所述基准异常信息和所述需要显示给用户的其他异常信息显示给用户。2.根据权利要求1所述的方法,其特征在于,所述获取所述基准异常信息发生的一个时间段内的其他异常信息包括:获取所述基准异常信息发生前的第一时间阈值内的其他异常信息,和/或获取所述基准异常信息发生后的第二时间阈值内的其他异常信息。3.根据权利要求1
‑
2中任一项所述的方法,其特征在于,所述确定所述至少一个其他异常信息中的每一个其他异常信息与所述基准异常信息的综合相关度值包括:确定所述至少一个其他异常信息中的每一个其他异常信息与基准异常信息的规则相关度值和模型相关度值;根据所述至少一个其他异常信息中的每一个其他异常信息与基准异常信息的规则相关度值和模型相关度值确定所述至少一个其他异常信息中的每一个其他异常信息与基准异常信息综合相关度值。4.根据权利要求3所述的方法,其特征在于,所述根据所述至少一个其他异常信息与基准异常信息的规则相关度值和模型相关度值确定所述至少一个其他异常信息与基准异常信息的综合相关度包括:将所述其他异常信息与基准异常信息的规则相关度值与模型相关度值进行比较,将所述规则相关度值和模型相关度值中的最大值作为所述其他异常信息与基准异常信息的综合相关度值。5.根据权利要求1所述的方法,其特征在于,所述根据所述综合相关度值确定所述至少一个其他异常信息中需要显示给用户的其他异常信息包括:将所述综合相关度值按照从大到小的顺序进行排序,并将前n个综合相关度值对应的其他异常信息确定为需要显示给用户的其他异常信息,其中n为大于等于1的自然数。6.根据权利要求1所述的方法,其特征在于,所述将所述基准异常信息和所述需要显示给用户的其他异常信息显示给用户包括:将所述需要显示给用户的其他异常信息和所述基准异常信息按照发生的时间顺序进行排序,并将排序后的所述需要显示给用户的其他异常信息和所述基准异常信息显示给用户;或者,按照所述需要显示给用户的其他异常信息和所述基准异常信息对应的对象的依赖关系,对所述需要显示给用户的其他异常信息和所述基准异常信息进行排序,并将排序后的
所述需要显示给用户的其他异常信息和所述基准异常信息显示给用户。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:接收用户对显示的异常信息的标注信息,所述标注信息包括:对显示的异常信息的先后顺序的调整,以及对显示的异常信息的正确性的标注;根据所述标注信息对后续的基准异常信息和其他异常信息的显示顺序算法进行优化;或者,根据所述标注信息对后续的基准异常信和其他异常信息的推荐算法进行优化。8.一种智能显示服务器故障信息的系统,其特征在于,包括:采集单元,用于采集系统中的异常信息,当所述异常信息中包括至少一个告警信息或性能异常信息时,将其中的一个告警信息或性能异常信息作为基准异常信息,并采集所述基准异常信息发生的一个时间段内的至少一个其他异常信息;所述其他异常信息包括:日志异常信息、事件信息、告警信息和性能异常信息中的至少一种;故障综合管理单元,用于确定所述至少一个其他异常信息中的每一个其他异常信息与所述基准异常信息的综合相关度值;根据所述综合相关度值确定所述至少一个其他异常信息中需要显示给用户的其他异常信息;故障显示单元,用于显示所述基准异常信息和所述需要显示给用户的其他异常信息。9.根据权利要求8所述的系统,其特征在于,所述采集所述基准异常信息发生的一个时间段内的其他异常信息包括:采集所述基准异常信息发生前的第一时间阈值内的其他异常信息,和/或采集所述基准异常信息发生后的第二时间阈值内的其他异常信息。10.根据权利要求8
‑
9任一项所述的系统,其特征在于,所述故障综合管理单元还用于:确定所述其他异常信息与基准异常信息的规则相关度值和模型相关度值;根据所述其他异常信息与基准异常信息的规则相关度值和模型相关度值确定所述其他异常信息与基准异常信息综合相关度值。11.根据权利要求10所述的系统,其特征...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。