一种全链路监控系统技术方案

技术编号:37510546 阅读:10 留言:0更新日期:2023-05-12 15:29
本发明专利技术涉及互联网运维技术领域,尤其涉及IPC H04L12领域,进一步的,涉及一种全链路监控系统。包括IT架构、监控工具、数据采集服务、告警服务、全链路数据服务、全链路监控和全链路配置服务;所述全链路监控系统还包括用户管理服务、接入规范和监控指标体系。本发明专利技术能够收敛技术栈,降低全链路监控系统本身的构建和运维成本;打通监控运维工具间的数据孤岛,将全部监控运维工具产生的数据进行统一的处理和存储;实现精确监控和有效告警;实现全链路可视化,实现IT事件与运维实况共享、数据分析,提升运维效率;建立以网络为核心的拓扑视图、统一关联设备本身的运行、设备之间、设备与系统间的关系视图情况,提升运维效率。提升运维效率。

【技术实现步骤摘要】
一种全链路监控系统


[0001]本专利技术涉及互联网运维
,尤其涉及IPC H04L12领域,进一步的,涉及一种全链路监控系统。

技术介绍

[0002]随着业务规模的扩展,特别是伴随销售目标的达成,逐渐形成系统用户数日益增加,前端用户的请求频度增加,链路变得更长,应用之间的调用关系变得越来越复杂,系统对业务的支持作用也日益增大,在数字化转型推进时期,为了帮助IT运维团队全面洞察系统运行的状态,在系统遇到故障时能够早发现,根因定位,防止再发,因此需要建立一种全新的全链路监控系统,通过实现可视可控可追溯的全链路监控,强化了系统运维的保障能力,提升故障发现和故障定位的时间效率。
[0003]中国专利CN 109962792 A公开了一种基于大数据的全链路监控系统,包括监控目标、数据抽取单元、日志传输单元、存储单元、监控展现单元以及任务调度服务框架;其解决的技术问题是通过系统的监控日志,分析并展现当前系统各种状态的平台环境,通过从系统的运行节点获取的日志信息,并对其进行收集清洗、汇总并转换后,将这些信息存储在分布式的搜索引擎环境中,然后通过对这些信息进行分析,最终以图表等方式展现或通知给运维以及系统开发人员。然而该专利的监控数据比较分散,不能及时的对故障进行处理。

技术实现思路

[0004]针对运维管理中发生的故障对应时长大于业务恢复时长、运维工时成本逐年增长、核心系统故障多发,实现快速有效追踪、定位故障并降低系统故障导致的业务影响等问题,本专利技术通过从业务视角出发提供了一种全链路监控系统对应用基础设施进行全面链路监控,可支持的监控类型超过数十种,支持监控指标超200个。
[0005]本专利技术提供了一种全链路监控系统,包括IT架构、监控工具、数据采集服务、告警服务、全链路数据服务、全链路监控和全链路配置服务。
[0006]优选的,所述全链路监控系统还包括用户管理服务、接入规范和监控指标体系。
[0007]优选的,所述IT架构包括容器化、数据库、服务器、应用服务、中间件、存储设备、安全设备、终端设备、链路和网络设备。
[0008]优选的,所述监控工具包括APEX、EFK、Prometheus、IPaaS、VMware、听云APM、博睿APM和博睿NPM。
[0009]优选的,所述数据采集服务包括接口适配、数据转换、数据清洗、调度管理、任务控制、链路追踪、日志数据采集、指标数据采集和告警数据采集;所述接口适配和数据清洗用于监控数据接口适配与清洗;所述数据采集服务可将全部监控运维工具产生的数据进行统一的处理和存储,打通信息孤岛,并可以确保每个业务系统的每个监控指标都有唯一且定义明确的数据来源;实现准确、低延迟、低入侵、低资源消耗的监控数据采集和处理。
[0010]优选的,所述告警服务包括告警源管理、告警压缩、告警合并、级别映射、告警处
置、告警通知、告警升级和告警屏蔽;用于对告警信息进行有效的关联、收敛和压缩,精确指标/日志定位告警;所述告警服务可准确定义告警和事件级别,以及对应的处理和通知流程,有效抑制“告警风暴”。
[0011]优选的,所述全链路数据服务包括数据建模、指标汇聚、数据接入、数据存储、数据处理和流式计算;用于用户数据接入、处理和存储。
[0012]优选的,所述全链路配置服务包括配置项管理、拓扑管理、关联关系管理、模型管理和资源分区;所述配置项管理用于进行IT资产配置管理;所述拓扑管理用于构造并管理整个网络的拓扑结构,以反映设备的组网情况和运行状态。通过拓扑视图中网元或子网图标所显示的颜色及状态,可以实时监控整个网络的运行情况。
[0013]优选的,所述全链路监控包括业务概述、全链路视图、业务分析、告警定位、告警分析、性能分析、日志分析和影响分析;所述全链路监控通过建立全链路拓扑大屏,用于用户进行整个链路视图监控。
[0014]优选的,所述用户管理服务包括组织机构管理、用户管理、角色权限管理和用户组管理。
[0015]优选的,所述接入规范包括告警接入规范、指标接入规范和日志接入规范;用于规范化接口接入标准,统一接口数据格式,规范化技术栈,降低全链路监控系统本身的构建和运维成本;针对全链路监控数据实施有效的数据治理,为后续的运维能力建设与拓展提供有效的数据支撑体系。
[0016]优选的,所述监控指标体系包括运维对象、监控指标和指标阈值;通过建立一套面向业务服务、层次化、可量化的监控指标体系用于规范接入的监控工具基于统一指标体系进行监控,规范企业监控指标的选取和使用。
[0017]有益效果:
[0018](1)统一规范:收敛技术栈,降低全链路监控系统本身的构建和运维成本;针对全链路监控数据实施有效的数据治理,为后续的运维能力建设与拓展提供有效的数据支撑体系。
[0019](2)统一数据:支持集成和打通监控运维工具间的数据孤岛,将全部监控运维工具产生的数据进行统一的处理和存储,确保每个业务系统的每个监控指标都有唯一且定义明确的数据来源。
[0020](3)统一标准:指定面向整个组织的运维数据处理和运维事件处理技术规范,包括运维监控数据处理规范、运维事件和告警处理流程规范、监控指标定义。
[0021](4)统一服务:用户可通过统一的服务接口消费运维监控相关的数据和功能,包括:数据呈现服务、数据分析服务、监控指标异常检测服务、监控告警通知订阅服务等。
[0022](5)实现全链路可视化,通过建立全链路监控拓扑可视化大屏,统一关联业务系统的应用/基础/网络视图情况,联动IT服务管理系统,实现IT事件与运维实况共享、数据分析,提升运维效率;建立以网络为核心的拓扑视图、统一关联设备本身的运行、设备之间、设备与系统间的关系视图情况,提升运维效率。
附图说明
[0023]图1为本专利技术一种全链路监控系统的业务架构示意图。
[0024]图2为本专利技术一种全链路监控系统的监控数据流图。
具体实施方式
[0025]下面结合附图和具体实施例对本专利技术作进一步说明,但不作为本专利技术的限定。
[0026]实施例:
[0027]如图1所示,本实施例提供了一种全链路监控系统,包括IT架构、监控工具、数据采集服务、告警服务、全链路数据服务、全链路监控和全链路配置服务。
[0028]所述全链路监控系统还包括用户管理服务、接入规范和监控指标体系。
[0029]所述IT架构即是监控工具所要进行监控的目标,基于监控目标确定监控指标和监控任务;所述IT架构包括容器化、数据库、服务器、应用服务、中间件、存储设备、安全设备、终端设备、链路和网络设备。
[0030]基于所述IT架构,所述监控工具包括APEX、EFK、Prometheus、IPaaS、VMware、听云APM、博睿APM和博睿NPM;具体的,如图2所示,其中APEX用于网络、主机和操作系统的监控;EFK用于数据库的监控;Prometheus用于容器和中间件的监控;IPaaS用于云平台的监控;VM本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种全链路监控系统,其特征在于,包括IT架构、监控工具、数据采集服务、告警服务、全链路数据服务、全链路监控和全链路配置服务。2.根据权利要求1所述的一种全链路监控系统,其特征在于,所述全链路监控系统还包括用户管理服务、接入规范和监控指标体系。3.根据权利要求1所述的一种全链路监控系统,其特征在于,所述IT架构包括容器化、数据库、服务器、应用服务、中间件、存储设备、安全设备、终端设备、链路和网络设备。4.根据权利要求1所述的一种全链路监控系统,其特征在于,所述数据采集服务包括接口适配、数据转换、数据清洗、调度管理、任务控制、链路追踪、日志数据采集、指标数据采集和告警数据采集。5.根据权利要求1所述的一种全链路监控系统,其特征在于,所述告警服务包括告警源管理、告警压缩、告警合并、级别映射、告...

【专利技术属性】
技术研发人员:孙玉新金春雷李宝丹
申请(专利权)人:迈威科技广州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1