【技术实现步骤摘要】
基于事件分析的故障定位方法、装置、电子设备及介质
[0001]本专利技术涉及计算机
,尤其是一种基于事件分析的故障定位方法、装置、电子设备及介质。
技术介绍
[0002]近年来,在日常生活中提供各种服务(例如搜索引擎、社交媒体、翻译应用程序)的软件系统越来越普遍。现代软件相比传统本地软件规模更大复杂性更高,如何管理系统中的服务故障和性能下降成为市场的核心竞争力。在托管在kubernetes环境中的dapr这样复杂的分布式运行时系统中部署应用时,dapr控制面将把sidecar容器与应用程序容器部署在同一个pod上,这会引入较多的动态,可能干扰系统管理人员对故障问题的诊断。由于系统的组件众多,以及故障的可传播性(某个部件的故障不一定是它内部的问题,也可能是在分布式环境中由于故障的传播所导致的),当出现问题时对故障进行定位将变得困难。用户无法得知故障的根因是在kubernetes集群,dapr sidecar容器,还是发生在测试的流程中。
技术实现思路
[0003]有鉴于此,本专利技术实施例提供一种基于事件 ...
【技术保护点】
【技术特征摘要】
1.一种基于事件分析的故障定位方法,其特征在于,包括:在目标系统模拟故障注入;其中,所述目标系统基于分布式运行时搭建得到;获取所述故障注入产生的事件数据,对所述事件数据进行持久化保存;对所述事件数据进行分组排序,得到若干不同的事件序列;对所述事件序列中的每条事件进行解析,生成事件模板;通过无监督方法对所述事件模板进行异常检测,得到变化故障;所述变化故障包括导致事件序列顺序变化的序列事件异常和导致事件时间间隔变化的性能问题;基于所述变化故障进行故障定位,确定异常事件序列,进而定位所述目标系统的异常部分。2.根据权利要求1所述的一种基于事件分析的故障定位方法,其特征在于,所述在目标系统环境模拟故障注入,包括:利用实验注入工具在所述目标系统进行故障自动注入;或,响应于配置指令,在所述目标系统进行故障手动注入。3.根据权利要求1所述的一种基于事件分析的故障定位方法,其特征在于,所述事件数据包括端到端测试事件、kubernetes事件和dapr事件,所述对所述事件数据进行持久化保存,包括以下至少之一:将所述端到端测试事件保存到本地日志文件;将所述kubernetes事件执行过程中,对api对象的操作记录在events中,并存储到etcd里;采用node logging agent的方式收集所述dapr事件,通过在kubernetes集群的每个节点上以daemonset的方式部署一个logging agent服务,进而基于所述logging agent服务进入各所述节点上所有容器的事件目录,收集所述dapr事件并传递到后端存储进行保存。4.根据权利要求1所述的一种基于事件分析的故障定位方法,其特征在于,所述对所述事件数据进行分组排序,得到若干不同的事件序列,包括:通过事件标识符对所述事件数据中的各个事件进行分组,获得若干事件组别;根据各所述事件组别中所述事件的时间戳顺序进行各所述事件组别的事件排序,得到若干不同的事件序列。5.根据权利要求1所述的一种基于事件分析的故障定位方法,其特征在于,所述对所述事件序列中的每条事件进行解析,生成事件模板,包括:基于固定深度...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。