【技术实现步骤摘要】
一种可视化的分布式系统实时监控运维方法及装置
本专利技术涉及一种可视化的分布式系统实时监控运维方法及装置。
技术介绍
随着技术的不断进步,IT的发展已由普遍建设向普遍运维转型,面对电信行业多级、分域、面向社会服务的特性,电信互联网化分布式应用可视化项目,为中国电信的互联网分布式的运维提供了从IT可用到服务可用的保障性解决方案,助力IT企业服务型组织的快速转型。传统的SSH架构在分布式应用架构的转换过程中,运维的技术特点和业务特点都发生了极大的改变,现有的一系列运维工具和流程已不适应新的架构,因此,需要有一套运维体系来支撑IT系统的日常运行维护。下面让我们来看看在分布式架构下,分布式系统存在有哪些问题呢?系统部署架构不可见:在传统的运维工作流程中,企业建设的各类IT系统运行在分散的主机上,维护人员对需要维护的系统没有一个直观的概念,无法了解系统的部署架构,从而对运维的质量和效率带来了极大的影响;系统健康状态不可知:经过长期的企业信息系统建设,企业采购的系统硬件(CPU\内存\磁盘\网卡\中间件等)、机房的环境、硬件物理特性的老化等,必然导致硬件出现各种健康状况,现有的IT系统没有定期的巡检机制或者是依靠传统的人力进行相关的巡检,不仅工作量大、周期长,流程较固化,投入产出比低;应用性能不可控:传统系统建设,重功能,轻维护,这样的IT建设模式,注定了随着应用功能的越来越多,代码逻辑的逐步堆积,所消耗的中间件内存、数据库和系统相关资源越来越大,必然会导致系统的性能急剧下降,以系统订单提交环节为例,上线初为8秒/笔,而上线运行5年后是120秒/笔。而这还不是最可怕的 ...
【技术保护点】
一种可视化的分布式系统实时监控运维方法,其特征在于:所述方法包括如下步骤:步骤1、在各个应用系统上进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;步骤2、将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收到的数据信息存储成HBase或者HDFS格式的文件;步骤3、在ELK框架中的Kibana框架的基础上,结合业界的报表插件来实现在Web页面中展示各种视图,包括获取存储的数据信息,并根据数据信息以及数据层中的CMDB配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示;同时通过分布式缓存来实时推送更新各种视图中的数据。
【技术特征摘要】
1.一种可视化的分布式系统实时监控运维方法,其特征在于:所述方法包括如下步骤:步骤1、在各个应用系统上进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;步骤2、将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收到的数据信息存储成HBase或者HDFS格式的文件;步骤3、在ELK框架中的Kibana框架的基础上,结合业界的报表插件来实现在Web页面中展示各种视图,包括获取存储的数据信息,并根据数据信息以及数据层中的CMDB配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示;同时通过分布式缓存来实时推送更新各种视图中的数据。2.根据权利要求1所述的一种可视化的分布式系统实时监控运维方法,其特征在于:所述步骤1具体为:使用各类钩子脚本在各个应用系统上进行无侵入式埋点,通过各类钩子脚本来拦截各个应用系统中的应用程序或者内部组件的传递参数,以实现获取各个应用系统的日志信息;在应用的操作系统上部署开源的Flume插件,并通过该Flume插件来采集操作系统上的各种硬件运行信息;同时,在应用的操作系统上部署开源的Logstash或Fluentd插件,并通过该Logstash或Fluentd插件来采集操作系统上的操作日志信息。3.根据权利要求1所述的一种可视化的分布式系统实时监控运维方法,其特征在于:所述步骤2具体为:将采集到的各种数据信息通过socket异步抛给消息中间件集群,并由消息中间件集群将各种数据信息传递给流式计算框架集群;流式计算框架集群将接收到的数据信息直接分类并存储成HBase或者HDFS格式的文件;或者流式计算框架集群先采用Storm技术对接收到的数据信息进行流式计算,以根据预先配置在流式计算库中的拦截规则来对数据信息进行过滤和清洗,然后将过滤和清洗后的数据信息分类并存储成HBase或者HDFS格式的文件。4.根据权利要求1所述的一种可视化的分布式系统实时监控运维方法,其特征在于:在所述步骤3中,所述“根据数据信息以及数据层中的CMDB配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示”具体为:通过基于复杂事件处理的事件流引擎来对数据信息中的业务发展数据进行复杂事件计算,并根据计算结果以及配置的相关业务规则来进行业务发展视图的展示;根据数据信息中的相关应用的性能数据来实时计算API耗时,并根据计算结果来进行应用性能视图的展示;根据数据层中的CMDB配置库信息并结合设备间的拓扑关系来进行应用部署视图的展示;根据CMDB配置库中的拓扑关系信息得到设备在应用中所承担的角色,同时提取角色作为轮询调度主机列表,完成对后台轮询调度任务的分析和统计,并根据统计结果来进行后台轮询调度视图的展示;根据数据信息中的接口服务调用数据来分析和统计应用接口的调用情况,且根据应用接口的调用情况来进行应用接口调用视图的展示;根据数据信息中的用户操作行为数据来分析和统计用户的体验情况,并根据用户的体验情况来进行用户体验视图的展示;通过基于复杂事件处理的事件流引擎来对数据信息中的告警信息进行复杂事件计算,并根据计算结果来进行应用监控视图的展示;同时,在数据层中设置告警阈值,当出现计算结果超过告警阈值的情况时,自动向相关人员发送告警信息。5.一种可视化的分布式系统实时监控运维装置,其特征在...
【专利技术属性】
技术研发人员:刘壮飞,郑国伟,连超,
申请(专利权)人:福建富士通信息软件有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。