System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 网络故障的定位方法、装置、存储介质及电子设备制造方法及图纸_技高网

网络故障的定位方法、装置、存储介质及电子设备制造方法及图纸

技术编号:41319004 阅读:15 留言:0更新日期:2024-05-13 14:59
本申请公开了一种网络故障的定位方法、装置、存储介质及电子设备,该方法应用于云计算领域、金融科技领域或者其他技术领域,该方法包括:在检测到报警信息的情况下,依据报警信息在知识图谱集合中确定出现异常的至少一个起始节点的起始节点信息;在知识图谱集合中查询至少一个起始节点的子树,得到子树集合;遍历子树集合中每个子树的节点,并检测存在异常的异常节点,得到异常节点集合;按照知识图谱集合中节点之间的关系对异常节点集合中的节点进行排序,依据排序后处于队列末端的节点定位报警信息的根因。通过本申请,解决了相关技术中维护服务器的过程时运维人员需要逐层获取配置信息并进行分析,导致服务器异常的处理效率较低的问题。

【技术实现步骤摘要】

本申请涉及云计算领域、金融科技领域或者其他,具体而言,涉及一种网络故障的定位方法、装置、存储介质及电子设备


技术介绍

1、随着虚拟化、容器化技术的发展,越来越多的服务系统和计算资源采用容器和虚拟化的部署和管理方式,以达到高效利用资源的目的。iaas(infrastructure as aservice,下文简称为iaas)基础设施即服务将计算资源进行池化,按照客户需要将物理机灵活地组装成可运行的虚拟机。paas(platform as a service,下文简称为paas)平台即服务提供了一种平台供开发人员部署、管理自己的应用程序,典型代表是基于k8s的容器化paas平台。在这种系统架构中,应用往往被分成了很多以容器为载体的微服务,容器又组成了容器组(pod)。而容器又分布在集群的各个虚拟机中,形成了庞大的服务架构、复杂的层级关系。因此,对集群中每个层级进行准确且及时地监控和异常报警通常需要付出很大的成本。

2、在这个架构背景下,当某一层级的故障时会在其它层级产生连锁反应,异常随着层级之间纵向的进程传播。有时候问题的根因发生在iaas层的某个硬件故障,但直接表现在服务的异常。例如,物理计算节点磁盘io缓慢导致服务响应异常,运维人员最先也是最直接感知的是应用服务层面服务异常。这种情况下,运维人员很难高效地发现故障的根因是物理计算节点磁盘io缓慢。通常运维人员先排查应用层面是否有问题,再看容器部署的层面,再到虚拟机层。如此一层层的排查,最后才能定位到物理计算节点问题。因此,在云环境下,纵向上的异常根因定位这个过程费时费力,降低了工作效率。

3、针对相关技术中维护服务器的过程时运维人员需要逐层获取配置信息并进行分析,导致服务器异常的处理效率较低的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请的主要目的在于提供一种网络故障的定位方法、装置、存储介质及电子设备,以解决相关技术中维护服务器的过程时运维人员需要逐层获取配置信息并进行分析,导致服务器异常的处理效率较低的问题。

2、为了实现上述目的,根据本申请的一个方面,提供了一种网络故障的定位方法,该方法包括:在检测到报警信息的情况下,依据所述报警信息在知识图谱集合中确定出现异常的至少一个起始节点的起始节点信息,其中,所述知识图谱集合包含集群中每个应用部署实体的连接关系对应的知识图谱;在所述知识图谱集合中查询至少一个所述起始节点的子树,得到子树集合;遍历所述子树集合中每个子树的节点,并检测存在异常的异常节点,得到异常节点集合;按照所述知识图谱集合中节点之间的关系对所述异常节点集合中的节点进行排序,依据排序后处于队列末端的节点定位所述报警信息的根因。

3、进一步地,在依据所述报警信息在知识图谱集合中确定出现异常的至少一个起始节点的起始节点信息之前,所述方法还包括:在配置管理数据库中确定每个应用部署的实体,以及采集所述实体之间的关联关系;将每个应用部署的实体作为节点,依据所述关联关系构建所述节点之间的边;依据所述节点和所述边构建每个应用的知识图谱,得到所述知识图谱集合。

4、进一步地,所述节点至少包括以下类型:第一类型、第二类型,所述第一类型的节点是指部署在paas层的实体对应的节点,所述第二类型的节点部署在iaas层的实体对应的节点,所述第一类型的节点至少包括以下节点:宿主机,所述第二类型的节点至少包括以下节点:所述宿主机,依据所述节点和所述边构建每个应用的知识图谱,包括:依据所述第一类型的节点和所述第二类型的节点之间的边构建每个应用在所述paas层对应的知识图谱;依据所述第一类型的节点和所述第二类型的节点之间的边构建每个应用在所述iaas层对应的知识图谱;依据所述宿主机将每个应用在所述paas层对应的知识图谱和每个应用在所述iaas层对应的知识图谱进行连接,得到每个应用的知识图谱。

5、进一步地,所述起始节点信息至少包括以下信息:节点id,遍历所述子树集合中每个子树的节点,并检测存在异常的异常节点,得到异常节点集合,包括:针对所述子树集合中每个子树,依据所述节点id对所述子树中的起始节点进行异常检测,得到第一检测结果;在所述第一检测结果指示所述起始节点处于正常状态的情况下,停止检测,依据空集合配置所述异常节点集合;在所述第一检测结果指示所述起始节点处于异常状态的情况下,遍历所述起始节点下的每个节点,并对每个节点进行异常检测,直到被检测的节点处于正常状态,停止检测;将遍历过程中处于异常状态的节点和所述起始节点标记为异常节点,得到所述异常节点集合。

6、进一步地,所述起始节点信息至少包括以下信息:所述节点id、异常时间段,依据所述节点id对所述子树中的起始节点进行异常检测,得到第一检测结果,包括:在指标数据集合中查询所述节点id在异常时间段内预设指标的目标变化趋势,其中,所述指标数据集合包含不同时刻下所述知识图谱集合中每个节点的预设指标的指标值;将所述目标变化趋势与节点处于异常状态时的预设变化趋势进行比对,得到比对结果;在所述比对结果指示比对成功的情况下,确定所述节点处于异常状态,得到所述第一检测结果;在所述比对结果指示比对失败的情况下,确定所述节点处于正常状态,得到所述第一检测结果。

7、进一步地,在依据排序后处于队列末端的节点定位所述报警信息的根因之后,包括:在所述知识图谱集合中向上遍历所述队列末端的节点的父节点,确定被影响的节点;依据所述队列末端的节点和所述被影响的节点生成异常报告;将所述异常报告发送至目标对象,以对所述队列末端的节点和所述被影响的节点进行调整和维护。

8、进一步地,在依据所述节点和所述边构建每个应用的知识图谱,得到所述知识图谱集合之后,所述方法还包括:每经过第一预设时长重新采集每个应用部署实体的实体信息,并依据重新采集到的实体信息更新所述知识图谱集合;在检测到所述知识图谱集合中节点变更的情况下,获取节点变更信息,并依据所述节点变更信息更新所述知识图谱集合。

9、进一步地,在指标数据集合中查询所述节点id在异常时间段内预设指标的目标变化趋势之前,包括:每经过第二预设时长采集所述知识图谱集合中每个节点的所述预设指标的指标值,得到所述指标数据集合。

10、为了实现上述目的,根据本申请的另一方面,提供了一种网络故障的定位装置,该装置包括:第一确定单元,用于在检测到报警信息的情况下,依据所述报警信息在知识图谱集合中确定出现异常的至少一个起始节点的起始节点信息,其中,所述知识图谱集合包含集群中每个应用部署实体的连接关系对应的知识图谱;查询单元,用于在所述知识图谱集合中查询至少一个所述起始节点的子树,得到子树集合;检测单元,用于遍历所述子树集合中每个子树的节点,并检测存在异常的异常节点,得到异常节点集合;排序单元,用于按照所述知识图谱集合中节点之间的关系对所述异常节点集合中的节点进行排序,依据排序后处于队列末端的节点定位所述报警信息的根因。

11、进一步地,所述装置还包括:第二确定单元,用于在依据所述报警信息本文档来自技高网...

【技术保护点】

1.一种网络故障的定位方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在依据所述报警信息在知识图谱集合中确定出现异常的至少一个起始节点的起始节点信息之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述节点至少包括以下类型:第一类型、第二类型,所述第一类型的节点是指部署在PAAS层的实体对应的节点,所述第二类型的节点部署在IAAS层的实体对应的节点,所述第一类型的节点至少包括以下节点:宿主机,所述第二类型的节点至少包括以下节点:所述宿主机,依据所述节点和所述边构建每个应用的知识图谱,包括:

4.根据权利要求1所述的方法,其特征在于,所述起始节点信息至少包括以下信息:节点ID,遍历所述子树集合中每个子树的节点,并检测存在异常的异常节点,得到异常节点集合,包括:

5.根据权利要求4所述的方法,其特征在于,所述起始节点信息至少包括以下信息:所述节点ID、异常时间段,依据所述节点ID对所述子树中的起始节点进行异常检测,得到第一检测结果,包括:

6.根据权利要求1所述的方法,其特征在于,在依据排序后处于队列末端的节点定位所述报警信息的根因之后,包括:

7.根据权利要求2所述的方法,其特征在于,在依据所述节点和所述边构建每个应用的知识图谱,得到所述知识图谱集合之后,所述方法还包括:

8.根据权利要求5所述的方法,其特征在于,在指标数据集合中查询所述节点ID在异常时间段内预设指标的目标变化趋势之前,包括:

9.一种网络故障的定位装置,其特征在于,包括:

10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至8中任意一项所述的网络故障的定位方法。

...

【技术特征摘要】

1.一种网络故障的定位方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在依据所述报警信息在知识图谱集合中确定出现异常的至少一个起始节点的起始节点信息之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述节点至少包括以下类型:第一类型、第二类型,所述第一类型的节点是指部署在paas层的实体对应的节点,所述第二类型的节点部署在iaas层的实体对应的节点,所述第一类型的节点至少包括以下节点:宿主机,所述第二类型的节点至少包括以下节点:所述宿主机,依据所述节点和所述边构建每个应用的知识图谱,包括:

4.根据权利要求1所述的方法,其特征在于,所述起始节点信息至少包括以下信息:节点id,遍历所述子树集合中每个子树的节点,并检测存在异常的异常节点,得到异常节点集合,包括:

5.根据权利要求4所述的方法,其特征在于,所述起始节点信息至少包括...

【专利技术属性】
技术研发人员:李轶
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1