一种基于大语言模型的IT系统故障诊断方法及系统技术方案

技术编号:44186133 阅读:22 留言:0更新日期:2025-02-06 18:27
本发明专利技术公开了一种基于大语言模型的IT系统故障诊断方法及系统,方法包括:利用LLM技术对排障指南TSG进行向量化,生成对应的TSG向量,并根据TSG定义自动化排障流程;根据接收到的告警事件信息,利用IT拓扑图确定相关联的IT组件及发生的告警事件;利用LLM技术对告警事件进行向量化生成告警事件向量,与TSG向量进行相似性对比,确定相似故障的TSG;执行相似故障TSG的自动化排障流程,根据所得的诊断信息确定故障根因,并利用LLM技术生成故障诊断报告。通过本发明专利技术的技术方案,能够精确快速定位故障根因,实现了故障自动化诊断,提高了故障处置效率。

【技术实现步骤摘要】

本专利技术涉及系统错误检测,尤其涉及一种基于大语言模型的it系统故障诊断方法以及一种基于大语言模型的it系统故障诊断系统。


技术介绍

1、分布式微服务应用架构、云原生技术让it架构规模变得非常庞大、组成及运行逻辑也巨复杂,极大加剧了故障发生时诊断分析的难度。

2、首先,it系统可能出现故障的环节比较多,从底层网络系统到服务器、数据库、中间件、应用程序均有可能发生故障,并且会产生故障传播。其次,分布式架构用户访问路径比较长,其中任何一个环节都有可能出现问题。生产环境的故障因为部署架构和配置差异、数据量、并发量、数据敏感性、偶然性等原因,难以在测试环境通过模拟调试方式定位故障。

3、当前it系统一般会部署多种监控系统,持续对it系统各个层面的监控指标数据、调用链数据、日志数据进行监控,通过静态或者动态指标阈值、ai机器学习算法对系统异常行为进行判断产生告警事件,结合it系统组件之间的拓扑关系,在系统异常时间点前后时间窗内产生的众多告警事件中确定根因事件。根据根因事件找到预设的故障排查方案,手工排查造成业务访问异常的原因并恢复系统。...

【技术保护点】

1.一种基于大语言模型的IT系统故障诊断方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的IT系统故障诊断方法,其特征在于,所述利用大语言模型LLM技术对排障指南TSG进行向量化,生成对应的TSG向量,具体过程包括:

3.根据权利要求1所述的基于大语言模型的IT系统故障诊断方法,其特征在于,所述根据接收到的告警事件信息,利用IT拓扑图确定相关联的IT组件,并确定发生在所述IT组件上的告警事件,具体过程包括:

4.根据权利要求1所述的基于大语言模型的IT系统故障诊断方法,其特征在于,所述将所述告警事件向量与所述TSG向量库中的TSG向量进...

【技术特征摘要】

1.一种基于大语言模型的it系统故障诊断方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的it系统故障诊断方法,其特征在于,所述利用大语言模型llm技术对排障指南tsg进行向量化,生成对应的tsg向量,具体过程包括:

3.根据权利要求1所述的基于大语言模型的it系统故障诊断方法,其特征在于,所述根据接收到的告警事件信息,利用it拓扑图确定相关联的it组件,并确定发生在所述it组件上的告警事件,具体过程包括:

4.根据权利要求1所述的基于大语言模型的it系统故障诊断方法,其特征在于,所述将所述告警事件向量与所述tsg向量库中的tsg向量进行相似性对比,确定相似故障tsg,具体过程包括:

5.根据权利要求1所述的基于大语言模型的it系统故障诊断方法,其特征在于,所述执行所...

【专利技术属性】
技术研发人员:方宇炜王东
申请(专利权)人:神州数码系统集成服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1