全面兼容扩展的智能问诊告警系统、方法及介质技术方案

技术编号:32668983 阅读:12 留言:0更新日期:2022-03-17 11:22
本发明专利技术提供一种全面兼容扩展的智能问诊告警系统、方法及介质,包括:配置管理模块、告警分组管理模块、历史告警查询模块、告警通知模块及告警适配模块;其中,配置管理模块:承担告警规则动态配置,借助配置中心的能力将告警规则下发至对应的告警计算组件;告警分组管理模块:承担业务系统和告警负责人以及通知渠道的绑定;历史告警查询模块:统一展示各种来源告警;告警通知模块:承担告警屏蔽,重复告警过滤以及进行邮件在内的相关通知功能;告警适配模块:实现不同格式的告警报文转换为告警中心标准的报文格式。本发明专利技术能提供全面标准统一的告警消息展示管理入口,避免告警风暴,用户收到的消息优化更友好。到的消息优化更友好。到的消息优化更友好。

【技术实现步骤摘要】
全面兼容扩展的智能问诊告警系统、方法及介质


[0001]本专利技术涉及通信
,具体地,涉及一种全面兼容扩展的智能问诊告警系统、方法及介质。

技术介绍

[0002]未来技术中台建设数字化运维服务场景越来越复杂,不仅仅来自于Prometheus告警,还有调用链告警、日志告警,未来可能会有更多接入告警的场景。不同来源的告警从处理手段上有相似点更有不同点,因此提供一套全面具有统一标准的告警中心十分有必要。
[0003]公开号为CN109218097A的专利技术专利,公开了一种云平台可配置告警规则的告警系统及告警方法,设置有告警转发API接口、告警处理模块和云平台,告警源具有统一的告警转发API接口,各告警源调用所述告警转发API接口传入告警对象,告警转发API接口将接收到的告警对象转为统一格式的告警消息,并转发给告警来源消息队列,转发失败的告警消息由API接口暂存;告警处理模块监听告警来源消息队列,获取告警消息,同时轮询暂存的告警消息;告警处理模块根据前台配置的告警规则对告警消息进行处理。
[0004]告警中心不仅要解决告警来源不同,产生的告警报文难以统一的问题,因此要实现告警适配层。还要解决在我们提供的全局告警模板基础上,用户期望根据自身场景做个性化配置导致的重复告警的问题。告警中心还要具备将专业性的指标汇聚成一目了然的告警诊断结论。就像看病,病人不需要知道体温多高,哪里有炎症,医生只要最终给出感冒发烧的结论,然后对症下药就好。
[0005]目前,现有技术中存在以下缺陷:1、告警功能单一,现有技术仅聚焦于某一
的告警。本系统针对上述问题,兼容扩展了业内主流的各个领域的监控告警能力,对告警进行集中统一管控。2、大规模部署企业级监控场景下,传统方式为在部署节点修改配置的方式实现告警规则更新,告警配置管理难度会随部署复杂度直线上升。本系统针对上述问题,进行了集中管控,通过友好的配置页面,高效的路由策略,将配置规则动态下发至对应的计算节点,解决了运维难题,痛点。3、目前业内的告警不够智能,仅能根据告警严重等级保留最严重的告警,却难以从复杂场景中识别同一等级下阈值更高的告警。本系统将告警规则生成指纹(告警规则语句复杂难以比对,指纹作为告警规则语句的唯一表示,自身是简单的字符串利于比较),对指纹进行语义拆分解析,比较同一指纹下的阈值高低,保留最高阈值。进而根据指纹比对去除低阈值的告警。

技术实现思路

[0006]针对现有技术中的缺陷,本专利技术提供一种全面兼容扩展的智能问诊告警系统、方法及介质。
[0007]根据本专利技术提供的一种全面兼容扩展的智能问诊告警系统、方法及介质,所述方案如下:
[0008]第一方面,提供了一种全面兼容扩展的智能问诊告警系统,所述系统包括:
[0009]配置管理模块、告警分组管理模块、历史告警查询模块、告警通知模块、告警文件共享盘、告警适配模块、Alertmanager模块、预警代理模块以及配置文件中心;
[0010]其中,配置管理模块:承担告警规则动态配置,借助配置中心的能力将告警规则下发至对应的告警计算组件;
[0011]告警分组管理模块:承担业务系统和告警负责人以及通知渠道的绑定;
[0012]历史告警查询模块:统一展示各种来源告警;
[0013]告警通知模块:承担告警屏蔽,重复告警过滤以及进行邮件在内的相关通知功能;
[0014]告警文件共享盘:部署一台与数据中心可用性监控平台网络互通的服务器,挂载磁盘,磁盘卷的访问权限包含本系统负责人和数据中心相关运维人员。将告警消息以文件形式在服务器中落盘,供其他系统使用;
[0015]告警适配模块:实现不同格式的告警报文转换为告警中心标准的报文格式;
[0016]Alertmanager模块:负责收集各个告警计算节点触发的告警消息,去除重复告警,对告警进行抑制合并,达到防范告警风暴的目的;
[0017]预警代理模块:实现从配置文件中心拉取配置文件并在本地目录替换配置文件,实现热加载;
[0018]配置文件中心:承担配置文件集中管控能力,实现配置文件上传与持久化,发布配置和回滚配置的能力。
[0019]优选的,所述告警分组管理模块具体包括:添加告警分组时从平台已录入的系统进行筛选,一个分组关联一个系统;
[0020]接着从企业用户平台筛选联系人,一个分组包含N个联系人;
[0021]然后选择触达方式,一个分组包含一种触达方式;
[0022]最后选择触发告警关联的告警规则,一个分组包含N条告警规则,作为扩展一个系统包含N条告警抑制规则。
[0023]优选的,所述历史告警查询模块具体包括:历史告警消息通过服务接口收集Alertmanager发送的告警报文,对其告警报文进行丰富优化。
[0024]优选的,所述告警适配模块和Alertmanager模块提供API接口用于接收告警报文,且告警适配模块和Alertmanager模块均部署在云原生同一个Pod中,申请不同的域名和端口对外提供服务。
[0025]第二方面,提供了一种全面兼容扩展的智能问诊告警方法,所述方法包括:
[0026]步骤S1:配置管理模块在文件树中将配置保存成文件,传输至配置文件中心,并通知预警代理模块获取配置文件的地址;
[0027]步骤S2:所述配置文件中心获取更新预警代理模块中的配置文件;
[0028]步骤S3:预警代理模块再更新本地模块的配置文件、调用相应接口更新配置;
[0029]步骤S4:若发现异常现象,对应的告警计算节点上报告警信息依次至Alertmanager模块、告警通知模块,其中告警通知模块将告警消息保存成数据中心规定的告警文件,传至告警文件共享盘;
[0030]步骤S5:最后,由数据中心读取告警文件。
[0031]第三方面,提供了一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现所述方法中的步骤。
[0032]与现有技术相比,本专利技术具有如下的有益效果:
[0033]1、通过兼容扩展业内主流的各个领域的监控告警能力,取得了对告警进行集中统一管控的效果;
[0034]2、通过友好的配置页面,对告警配置集中管控;实现高效的路由策略,将配置规则动态下发至对应的计算节点,取得了解决运维难题、痛点的效果;
[0035]3、通过将告警规则生成指纹,对指纹进行语义拆分解析,比较同一指纹下的阈值高低,保留最高阈值。提高了告警精确度,取得了智能告警、智能运维的效果。
附图说明
[0036]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:
[0037]图1为本专利技术告警中心技术架构示意图;
[0038]图2为告警分组管理模块中相应的功能E

R图;
[0039]图3为历史告警存储展示效果E

R。
具体实施方式
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种全面兼容扩展的智能问诊告警系统,其特征在于,包括:配置管理模块、告警分组管理模块、历史告警查询模块、告警通知模块、告警文件共享盘、告警适配模块、Alertmanager模块、预警代理模块以及配置文件中心;其中,配置管理模块:承担告警规则动态配置,借助配置中心的能力将告警规则下发至对应的告警计算组件;告警分组管理模块:承担业务系统和告警负责人以及通知渠道的绑定;历史告警查询模块:统一展示各种来源告警;告警通知模块:承担告警屏蔽,重复告警过滤以及进行邮件在内的相关通知功能;告警文件共享盘:部署一台与数据中心可用性监控平台网络互通的服务器,挂载磁盘,磁盘卷的访问权限包含本系统负责人和数据中心相关运维人员,将告警消息以文件形式在服务器中落盘,供其他系统使用;告警适配模块:实现不同格式的告警报文转换为告警中心标准的报文格式;Alertmanager模块:负责收集各个告警计算节点触发的告警消息,去除重复告警,对告警进行抑制合并,达到防范告警风暴的目的;预警代理模块:实现从配置文件中心拉取配置文件并在本地目录替换配置文件,实现热加载;配置文件中心:承担配置文件集中管控能力,实现配置文件上传与持久化,发布配置和回滚配置的能力。2.根据权利要求1所述的全面兼容扩展的智能问诊告警系统,其特征在于,所述告警分组管理模块具体包括:添加告警分组时从平台已录入的系统进行筛选,一个分组关联一个系统;接着从企业用户平台筛选联系人,一个分组包含N个联系人;然后选择触达方式,一个分组包含一种触达方式;最后...

【专利技术属性】
技术研发人员:未元詹赵林郑文礼徐小斌柳开弘段然杨鑫培金晋明曾仁杰刘聪
申请(专利权)人:兴业数字金融服务上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1