一种智能显示服务器故障信息的方法、装置及系统制造方法及图纸

技术编号:35243563 阅读:13 留言:0更新日期:2022-10-19 09:49
本发明专利技术提供一种智能显示服务器故障信息的方法、装置及系统,包括:接收至少一个告警信息或性能异常信息,并将其中的一个告警信息或性能异常信息作为基准异常信息;获取所述基准异常信息发生的一个时间段内的至少一个其他异常信息;确定其中的每一个其他异常信息与基准异常信息的综合相关度值;根据该综合相关度值确定至少一个其他异常信息中需要显示给用户的其他异常信息;并将确定好的其他该异常信息和基准异常信息显示给用户。该方法以故障为核心,智能分析各种数据源异常的相关度,把强相关的异常汇聚在一起统一显示。避免了在多个功能模块中反复切换界面对比查看的痛点,解决了需要反复手工筛选分析对象或指标的繁琐操作。作。作。

【技术实现步骤摘要】
一种智能显示服务器故障信息的方法、装置及系统


[0001]本专利技术涉及服务器故障信息处理
,尤其涉及一种智能显示服务器故障信息的方法、装置及系统。

技术介绍

[0002]现有服务器的管理软件,一般按照功能模块分门别类划分,比如告警管理、性能管理等。往往服务器出现故障问题后,告警、性能、日志等其中几项或者都有异常表象。使用现有的管理软件,就必须逐个访问对应的功能模块,依靠专家综合分析这些信息进行分析,效率很低。
[0003]随着智能运维(artificial intelligence for IT operations,AIOPS)技术兴起,结合现有的日志异常检测、性能异常检测等技术,针对服务器故障,有可能探索一种新的显示故障相关信息的方法。

技术实现思路

[0004]本申请实施例提供了一种智能显示服务器故障信息的方法、装置及系统,以故障为核心,智能分析各种数据源异常的相关度,把强相关的异常汇聚在一起统一显示。避免了在多个功能模块中反复切换界面对比查看的痛点,解决了需要反复手工筛选分析对象或指标的繁琐操作。
[0005]第一方面,本申请实施例提供了一种智能显示服务器故障信息的方法,用于对服务器上的异常信息进行管理,该方法包括:接收至少一个告警信息或性能异常信息,并将其中的一个告警信息或性能异常信息作为基准异常信息;获取该基准异常信息发生的一个时间段内的至少一个其他异常信息;其中,其他异常信息包括:日志异常信息、事件信息、告警信息和性能异常信息中的至少一种;确定至少一个其他异常信息中的每一个其他异常信息与基准异常信息的综合相关度值,根据该综合相关度值确定所述至少一个其他异常信息中需要显示给用户的其他异常信息;将该基准异常信息和该需要显示给用户的其他异常信息显示给用户。
[0006]也就是说,本申请实施例提供的智能显示服务器故障信息的方法,通过将接收的第一个告警信息或性能异常信息作为基准异常信息,然后分析各异常信息与基准异常信息的相关度,把强相关的异常信息汇聚在一起统一显示给用户,解决了用户需要在多个功能模块中反复切换界面查看并反复手工筛选各种异常信息的繁琐操作。
[0007]在一个可能的实现方式中,获取所述基准异常信息发生的一个时间段内的其他异常信息包括:获取该基准异常信息发生前的第一时间阈值内的其他异常信息,和/或获取该基准异常信息发生后的第二时间阈值内的其他异常信息。
[0008]也就是说,在该实现方式中,进一步考虑到了基准异常信息发生前的一个时间阈值内的其他异常信息和基准异常信息发生后的一个时间阈值内的其他异常信息,保证了显示给用户的故障信息的准确性。
[0009]在一个可能的实现方式中,确定至少一个其他异常信息中的每一个其他异常信息与基准异常信息的综合相关度值包括:确定至少一个其他异常信息中的每一个其他异常信息与基准异常信息的规则相关度值和模型相关度值;根据至少一个其他异常信息中的每一个其他异常信息与基准异常信息的规则相关度值和模型相关度值确定至少一个其他异常信息中的每一个其他异常信息与基准异常信息综合相关度值。
[0010]也就是说,在该实现方式中,首先从多个角度确定其他异常信息与基准异常信息的相关度值,然后再通过确定的相关度值确定其他异常信息与基准异常信息的综合相关度值,保证了所获取的其他异常信息与基准异常信息的综合相关度值的准确性。
[0011]在一个可能的实现方式中,根据至少一个其他异常信息与基准异常信息的规则相关度值和模型相关度值确定至少一个其他异常信息与基准异常信息的综合相关度包括:将确定好的其他异常信息与基准异常信息的规则相关度值与模型相关度值进行比较,将规则相关度值和模型相关度值中的最大值作为该异常信息与基准异常信息的综合相关度值。
[0012]也就是说,在该实现方式中,进一步地给出了如何确定其他异常信息与基准异常信息的综合相关度值的方法。
[0013]在一个可能的实现方式中,根据所述综合相关度值确定至少一个其他异常信息中需要显示给用户的其他异常信息包括:将综合相关度值按照从大到小的顺序进行排序,并将前n个综合相关度值对应的其他异常信息确定为需要显示给用户的其他异常信息,其中n为大于等于1的自然数。
[0014]也就是说,在该实现方式中,给出了根据确定好的综合相关度值确定需要显示给用户的其他异常信息的方法。
[0015]在一个可能的实现方式中,将基准异常信息和需要显示给用户的其他异常信息显示给用户包括:将需要显示给用户的其他异常信息和基准异常信息按照发生的时间顺序进行排序,并将排序后的需要显示给用户的其他异常信息和基准异常信息显示给用户;或者,按照需要显示给用户的其他异常信息和基准异常信息对应的对象的依赖关系,对需要显示给用户的其他异常信息和基准异常信息进行排序,并将排序后的需要显示给用户的其他异常信息和基准异常信息显示给用户。
[0016]也就是说,在该实现方式中,可以将其他异常信息和基准异常信息按照发生的时间顺序进行排序或者按照其他异常信息和基准异常信息对应的对象的依赖关系进行排序,方便了用户查看,且有效降低了对用户的技能要求。
[0017]在一个可能的实现方式中,该方法还包括:接收用户对显示的异常信息的标注信息,该标注信息包括:对显示的异常信息的先后顺序的调整,以及对显示的异常信息的正确性的标注;根据该标注信息对后续的基准异常信息和其他异常信息的显示顺序算法进行优化;或者根据该标注信息对后续的基准异常信和其他异常信息的推荐算法进行优化。
[0018]也就是说,在该实现方式中,根据用户对已显示的异常信息的标注信息,来调整后续显示的异常信息的显示以及显示顺序,使得后续显示的异常信息更加的符合用户的要求。
[0019]第二方面,本申请实施例提供了一种智能显示服务器故障信息的系统,包括:采集单元,用于采集系统中的异常信息,当异常信息中包括至少一个告警信息或性能异常信息时,将其中的一个告警信息或性能异常信息作为基准异常信息,并采集基准异常信息发生
的一个时间段内的至少一个其他异常信息;其中,其他异常信息包括:日志异常信息、事件信息、告警信息和性能异常信息中的至少一种;故障综合管理单元,用与确定至少一个其他异常信息中的每一个其他异常信息与基准异常信息的综合相关度值;根据该综合相关度值确定至少一个其他异常信息中需要显示给用户的其他异常信息;故障显示单元,用于显示基准异常信息和需要显示给用户的其他异常信息。
[0020]在一个可能的实现方式中,该采集单元还用于:采集该基准异常信息发生前的第一时间阈值内的其他异常信息,和/或采集该基准异常信息发生后的第二时间阈值内的其他异常信息。
[0021]在一个可能的实现方式中,该故障综合管理单元还用于:确定至少一个其他异常信息中的每一个异常信息与基准异常信息的规则相关度值和模型相关度值;根据其他异常信息中的每一个异常信息与基准异常信息的规则相关度值和模型相关度值确定其他异常信息中的每一个异常信息与基准异常信息综合相关度值。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能显示服务器故障信息的方法,其特征在于,所述方法用于对服务器上的异常信息进行管理,所述方法包括:接收至少一个告警信息或性能异常信息,并将其中的一个告警信息或性能异常信息作为基准异常信息;获取所述基准异常信息发生的一个时间段内的至少一个其他异常信息;所述其他异常信息包括:日志异常信息、事件信息、告警信息和性能异常信息中的至少一种;确定所述至少一个其他异常信息中的每一个其他异常信息与所述基准异常信息的综合相关度值;根据所述综合相关度值确定所述至少一个其他异常信息中需要显示给用户的其他异常信息;将所述基准异常信息和所述需要显示给用户的其他异常信息显示给用户。2.根据权利要求1所述的方法,其特征在于,所述获取所述基准异常信息发生的一个时间段内的其他异常信息包括:获取所述基准异常信息发生前的第一时间阈值内的其他异常信息,和/或获取所述基准异常信息发生后的第二时间阈值内的其他异常信息。3.根据权利要求1

2中任一项所述的方法,其特征在于,所述确定所述至少一个其他异常信息中的每一个其他异常信息与所述基准异常信息的综合相关度值包括:确定所述至少一个其他异常信息中的每一个其他异常信息与基准异常信息的规则相关度值和模型相关度值;根据所述至少一个其他异常信息中的每一个其他异常信息与基准异常信息的规则相关度值和模型相关度值确定所述至少一个其他异常信息中的每一个其他异常信息与基准异常信息综合相关度值。4.根据权利要求3所述的方法,其特征在于,所述根据所述至少一个其他异常信息与基准异常信息的规则相关度值和模型相关度值确定所述至少一个其他异常信息与基准异常信息的综合相关度包括:将所述其他异常信息与基准异常信息的规则相关度值与模型相关度值进行比较,将所述规则相关度值和模型相关度值中的最大值作为所述其他异常信息与基准异常信息的综合相关度值。5.根据权利要求1所述的方法,其特征在于,所述根据所述综合相关度值确定所述至少一个其他异常信息中需要显示给用户的其他异常信息包括:将所述综合相关度值按照从大到小的顺序进行排序,并将前n个综合相关度值对应的其他异常信息确定为需要显示给用户的其他异常信息,其中n为大于等于1的自然数。6.根据权利要求1所述的方法,其特征在于,所述将所述基准异常信息和所述需要显示给用户的其他异常信息显示给用户包括:将所述需要显示给用户的其他异常信息和所述基准异常信息按照发生的时间顺序进行排序,并将排序后的所述需要显示给用户的其他异常信息和所述基准异常信息显示给用户;或者,按照所述需要显示给用户的其他异常信息和所述基准异常信息对应的对象的依赖关系,对所述需要显示给用户的其他异常信息和所述基准异常信息进行排序,并将排序后的
所述需要显示给用户的其他异常信息和所述基准异常信息显示给用户。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:接收用户对显示的异常信息的标注信息,所述标注信息包括:对显示的异常信息的先后顺序的调整,以及对显示的异常信息的正确性的标注;根据所述标注信息对后续的基准异常信息和其他异常信息的显示顺序算法进行优化;或者,根据所述标注信息对后续的基准异常信和其他异常信息的推荐算法进行优化。8.一种智能显示服务器故障信息的系统,其特征在于,包括:采集单元,用于采集系统中的异常信息,当所述异常信息中包括至少一个告警信息或性能异常信息时,将其中的一个告警信息或性能异常信息作为基准异常信息,并采集所述基准异常信息发生的一个时间段内的至少一个其他异常信息;所述其他异常信息包括:日志异常信息、事件信息、告警信息和性能异常信息中的至少一种;故障综合管理单元,用于确定所述至少一个其他异常信息中的每一个其他异常信息与所述基准异常信息的综合相关度值;根据所述综合相关度值确定所述至少一个其他异常信息中需要显示给用户的其他异常信息;故障显示单元,用于显示所述基准异常信息和所述需要显示给用户的其他异常信息。9.根据权利要求8所述的系统,其特征在于,所述采集所述基准异常信息发生的一个时间段内的其他异常信息包括:采集所述基准异常信息发生前的第一时间阈值内的其他异常信息,和/或采集所述基准异常信息发生后的第二时间阈值内的其他异常信息。10.根据权利要求8

9任一项所述的系统,其特征在于,所述故障综合管理单元还用于:确定所述其他异常信息与基准异常信息的规则相关度值和模型相关度值;根据所述其他异常信息与基准异常信息的规则相关度值和模型相关度值确定所述其他异常信息与基准异常信息综合相关度值。11.根据权利要求10所述的系统,其特征...

【专利技术属性】
技术研发人员:冯文梁
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1