System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及云存储,尤其涉及一种告警方法、设备及存储介质。
技术介绍
1、云存储可理解为是一种网上在线存储(cloud storage)的模式。随着云存储技术的发展,基于云存储技术还提出了存储计算分离架构,简称存算分离架构。云存储技术可用于实现存算分离架构中的存储层。在存算分离架构中还可包含计算层,计算层和存储层解耦合,通过网络进行连通,计算层和存储层都可实现为独立的分布式系统。计算层中的各个计算节点可通过io请求的方式访问存储层,以从存储层中的存储节点上读写数据。
2、目前,在存算分离架构中通常部署有全链路的异常监测系统,用于发现及自动诊断存在异常的io请求,并以异常io请求为单位进行告警。
3、但是,随着io请求的数量级不断攀升,告警的次数也在不断增多,海量的告警信息导致告警堆积,带来了很大的告警处理压力,无法及时处理告警。
技术实现思路
1、本申请的多个方面提供一种告警方法、设备及存储介质,用以改善对告警的处理效率。
2、本申请实施例提供一种告警方法,包括:
3、在发生告警触发事件的情况下,确定异常io请求各自所对应的请求路径,单条请求路径表征所对应的异常io请求途经的物理节点之间的连通关系;
4、基于请求路径对异常io请求进行聚类,以产生至少一个异常io请求组,其中,途经同一物理节点的请求路径所对应的异常io请求位于同一异常io请求组内;
5、以异常io请求组为单位,输出告警信息。
6、进一步
7、获取所述异常io请求各自所对应的异常监测信息;
8、从所述异常监测信息中,解析所对应异常io请求所途经的物理节点的标识信息及途经顺序,以确定所述异常io请求各自所对应的请求路径。
9、进一步,获取所述异常io请求各自所对应的异常监测信息,包括:
10、向异常监测系统发送异常监测信息获取请求,所述获取请求中携带有目标异常类型,其中,所述异常监测系统已诊断出异常io请求各自所对应的异常类型;
11、接收所述异常监测系统返回的已诊断为所述目标异常类型的异常io请求所对应的异常监测信息。
12、进一步,所述异常监测信息采用追踪trace信息,trace信息与io请求一一对应,trace信息中包含多个存在顺序关系的跨度span项,span项与io请求所途经的物理节点一一对应,span项中包含所对应物理节点的标识信息,trace信息中包含的span项之间的顺序关系用于表征io请求所途经的物理节点之间的途经顺序。
13、进一步,基于请求路径对异常io请求进行聚类,以产生至少一个异常io请求组,包括:
14、将能够通过物理节点而连通的各条请求路径所对应的异常io请求,聚类为异常io请求组,或者,
15、查询能够连通多条请求路径的物理节点,作为聚类节点;将单个聚类节点所能连通的各条请求路径所对应的异常io请求聚类为异常io请求组。
16、进一步,将能够通过物理节点而连通的各条请求路径所对应的异常io请求,聚类为异常io请求组,包括:
17、以各条请求路径上的物理节点作为顶点,各条请求路径上物理节点之间的连通关系作为边,构建无向图;
18、从所述无向图中,搜索连通分量;
19、将单个连通分量内所包含的请求路径各自所对应的异常io请求,聚类为异常io请求组。
20、进一步,从所述无向图中,搜索连通分量,包括:
21、在遍历至所述无向图中的目标顶点时,搜索所述目标顶点所处的连通分量;
22、从所述无向图中删除所述目标顶点所处的连通分量;
23、从所述无向图中的剩余顶点中,继续确定下一个目标顶点并搜索及删除对应的连通分量,直至所述无向图中不存在剩余顶点;
24、输出所搜索到的连通分量。
25、进一步,以异常io请求组为单位,输出告警信息,包括:
26、对目标异常io请求组内各个异常io请求所途经的物理节点进行去重后,将剩余的物理节点确定为目标节点;
27、基于所述目标节点的标识信息、所述目标节点所属集群的标识信息和/或所述目标异常io请求组所涉及到的异常类型,为所述目标异常io请求组,输出告警信息;
28、其中,所述目标异常io请求组为任一异常io请求组。
29、进一步,对所述目标异常io请求组内各个异常io请求所途经的物理节点进行去重后,将剩余的物理节点确定为目标节点,包括:
30、若基于各条请求路径构建无向图并从所述无向图中搜索连通分量以聚类出所述目标异常io请求组,则将所述目标异常io请求组所对应的连通分量中包含的各个顶点所代表的物理节点,作为目标节点。
31、进一步,所述物理节点至少包括计算节点和存储节点,在输出所述告警信息之后,所述方法还包括:
32、响应于告警处理指令,在目标告警信息所对应的目标异常io请求组下,分析计算节点与存储节点之间形成的连通结构;
33、基于连通结构与异常节点之间的指向关系,在所述目标异常io请求组下推测导致异常的异常节点。
34、进一步,基于连通接结构与异常节点之间的指向关系,在所述目标异常io请求组下推测导致异常的异常节点,包括:
35、若所述目标异常io请求组下存在第一类连通结构,则将所述第一类连通结构中的计算节点推测为异常节点,所述第一类连通结构为一个计算节点连通多个存储节点;或者,
36、若所述目标异常io请求组下存在第二类连通结构,则将所述第二类连通结构中的存储节点推测为异常节点,所述第二类连通结构为一个存储节点连通多个计算节点;或者,
37、若所述目标异常io请求组下存在第三类连通结构,则将所述第三类连通结构中的中间节点推测为异常节点,所述第三类连通结构为多个计算节点和多个存储节点通过中间节点连通。
38、进一步,所述目标异常类型包括io不可用类或io受损类,所述物理节点包括计算系统中的计算节点、存储系统中的存储节点和/或用于网络连接的中间节点,所述异常io请求为所述计算系统中的计算节点向所述存储系统中的存储节点发起的且已发生异常的io请求。
39、本申请实施例还提供一种电子设备,包括存储器和处理器;
40、所述存储器用于存储一条或多条计算机指令;
41、所述处理器与所述存储器耦合,用于执行所述一条或多条计算机指令,以用于执行前述述的告警方法。
42、本申请实施例还提供一种存储计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行前述的数据处理方法。
43、本申请实施例还提供一种计算机程序产品,包括计算机程序/指令,其中,当计算机程序被处理器执行时,致使处理器实现前述的告本文档来自技高网...
【技术保护点】
1.一种告警方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,确定所述异常IO请求各自所对应的请求路径,包括:
3.根据权利要求2所述的方法,其特征在于,获取所述异常IO请求各自所对应的异常监测信息,包括:
4.根据权利要求2或3所述的方法,其特征在于,所述异常监测信息采用追踪trace信息,trace信息与IO请求一一对应,trace信息中包含多个存在顺序关系的跨度span项,span项与IO请求所途经的物理节点一一对应,span项中包含所对应物理节点的标识信息,trace信息中包含的span项之间的顺序关系用于表征IO请求所途经的物理节点之间的途经顺序。
5.根据权利要求1所述的方法,其特征在于,基于请求路径对异常IO请求进行聚类,以产生至少一个异常IO请求组,包括:
6.根据权利要求5所述的方法,其特征在于,将能够通过物理节点而连通的各条请求路径所对应的异常IO请求,聚类为异常IO请求组,包括:
7.根据权利要求6所述的方法,其特征在于,从所述无向图中,搜索连通分量,包括:
9.根据权利要求8所述的方法,其特征在于,对所述目标异常IO请求组内各个异常IO请求所途经的物理节点进行去重后,将剩余的物理节点确定为目标节点,包括:
10.根据权利要求1所述的方法,其特征在于,所述物理节点至少包括计算节点和存储节点,在输出所述告警信息之后,所述方法还包括:
11.根据权利要求10所述的方法,其特征在于,基于连通接结构与异常节点之间的指向关系,在所述目标异常IO请求组下推测导致异常的异常节点,包括:
12.根据权利要求3所述的方法,其特征在于,所述目标异常类型包括IO不可用类和/或IO受损类,所述物理节点包括计算系统中的计算节点、存储系统中的存储节点和/或用于网络连接的中间节点,所述异常IO请求为所述计算系统中的计算节点向所述存储系统中的存储节点发起的且已发生异常的IO请求。
13.一种电子设备,其特征在于,包括存储器和处理器;
14.一种存储计算机指令的计算机可读存储介质,其特征在于,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行权利要求1-12任一项所述的告警方法。
15.一种计算机程序产品,其特征在于,包括计算机程序/指令,其中,当计算机程序被处理器执行时,致使处理器实现权利要求1-12任一项所述的告警方法。
...【技术特征摘要】
1.一种告警方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,确定所述异常io请求各自所对应的请求路径,包括:
3.根据权利要求2所述的方法,其特征在于,获取所述异常io请求各自所对应的异常监测信息,包括:
4.根据权利要求2或3所述的方法,其特征在于,所述异常监测信息采用追踪trace信息,trace信息与io请求一一对应,trace信息中包含多个存在顺序关系的跨度span项,span项与io请求所途经的物理节点一一对应,span项中包含所对应物理节点的标识信息,trace信息中包含的span项之间的顺序关系用于表征io请求所途经的物理节点之间的途经顺序。
5.根据权利要求1所述的方法,其特征在于,基于请求路径对异常io请求进行聚类,以产生至少一个异常io请求组,包括:
6.根据权利要求5所述的方法,其特征在于,将能够通过物理节点而连通的各条请求路径所对应的异常io请求,聚类为异常io请求组,包括:
7.根据权利要求6所述的方法,其特征在于,从所述无向图中,搜索连通分量,包括:
8.根据权利要求1所述的方法,其特征在于,以异常io请求组为单位,输出告警信息,包括:
9.根据权利要求8所述的...
【专利技术属性】
技术研发人员:洪元东,
申请(专利权)人:杭州阿里云飞天信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。