一种可视化的分布式系统实时监控运维方法及装置制造方法及图纸

技术编号:17346099 阅读:53 留言:0更新日期:2018-02-25 11:11
本发明专利技术提供一种可视化的分布式系统实时监控运维方法,包括在各个应用系统进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收的数据信息存储成HBase或者HDFS格式的文件;在ELK框架中的Kibana框架的基础上,结合业界的报表插件来实现在Web页面中展示各种视图,并通过分布式缓存来实时推送更新各种视图中的数据。本发明专利技术优点:可极大的降低分布式系统的运维难度,提升分布式应用的运维效率,为系统的建设、部署、运行、维护、升级改造等过程提供强有力的保障。

【技术实现步骤摘要】
一种可视化的分布式系统实时监控运维方法及装置
本专利技术涉及一种可视化的分布式系统实时监控运维方法及装置。
技术介绍
随着技术的不断进步,IT的发展已由普遍建设向普遍运维转型,面对电信行业多级、分域、面向社会服务的特性,电信互联网化分布式应用可视化项目,为中国电信的互联网分布式的运维提供了从IT可用到服务可用的保障性解决方案,助力IT企业服务型组织的快速转型。传统的SSH架构在分布式应用架构的转换过程中,运维的技术特点和业务特点都发生了极大的改变,现有的一系列运维工具和流程已不适应新的架构,因此,需要有一套运维体系来支撑IT系统的日常运行维护。下面让我们来看看在分布式架构下,分布式系统存在有哪些问题呢?系统部署架构不可见:在传统的运维工作流程中,企业建设的各类IT系统运行在分散的主机上,维护人员对需要维护的系统没有一个直观的概念,无法了解系统的部署架构,从而对运维的质量和效率带来了极大的影响;系统健康状态不可知:经过长期的企业信息系统建设,企业采购的系统硬件(CPU\内存\磁盘\网卡\中间件等)、机房的环境、硬件物理特性的老化等,必然导致硬件出现各种健康状况,现有的IT系统没有定期的巡检机制或者是依靠传统的人力进行相关的巡检,不仅工作量大、周期长,流程较固化,投入产出比低;应用性能不可控:传统系统建设,重功能,轻维护,这样的IT建设模式,注定了随着应用功能的越来越多,代码逻辑的逐步堆积,所消耗的中间件内存、数据库和系统相关资源越来越大,必然会导致系统的性能急剧下降,以系统订单提交环节为例,上线初为8秒/笔,而上线运行5年后是120秒/笔。而这还不是最可怕的,更可怕的是开发者还无法直观的了解到“时间去哪儿了”,想要优化都无从入手,到最后只能是推倒重来;业务发展不直观:传统的营销活动的流程是业务部门根据后期的大数据分析,结合咨询公司的业界了解和自身业务的特点来判断和制定相关的营销策略、套餐,并定价推向市场,然后就坐等最终的营销结果统计和后评估。这使得业务部门无法实时了解营销活动的执行情况,无法及时根据营销过程中的一些业务特点和变化来调整营销策略及方案,以达到更好的营销效果;应用接口调用不可见:IT系统的接口众多,根据梳理出来的情况,多达1000+接口,涉及的支撑厂商在数十个以上,数量庞大且在后台执行的接口在执行调用的过程中,存在接入安全审计、调用数据暴增、异常定位困难等问题,不利于维护工作开展;应用轮询调度不可见:后台的轮询调度程序,往往因为长期运行,极容易存在假死、挂起、占用内存过高等情况,系统无视图可以查看轮询的执行情况,就无法实时对假死挂起的轮询进行监控和告警;IT硬件投资决策难:在电信的企业IT系统建设中,存在业务系统多,硬件投资成本高等特点,在传统的硬件投资中,主要靠主观判断来决定哪些系统的哪些硬件需要升级,哪些硬件需要更新换代、淘汰等,没有故障数据、体检数据、运行数据为硬件投资决策提供数据支持;运维工作量大:由于在建的系统为分布式业务系统,虽然在逻辑上实现了业务数据的统一处理,但是在物理上,是由后端几百台的PC机支撑,任何一次系统配置文件的修改、数据脚本的执行,都需要确保内容的一致性、事务的一致性。此时依靠人力逐一核查,维护工作量无比巨大;基于以上情况,需要有一套完整的、体系化的应用可视化项目,来支撑系统的日常运维工作,以极大的降低分布式系统的运维难度,提升分布式应用的运维效率,为系统的建设、部署、运行、维护、升级改造等过程提供强有力的保障。
技术实现思路
本专利技术要解决的技术问题之一,在于提供一种可视化的分布式系统实时监控运维方法,通过该方法来实现分布式系统应用的可视化管理,可极大的降低分布式系统的运维难度,提升分布式应用的运维效率,为系统的建设、部署、运行、维护、升级改造等过程提供强有力的保障。本专利技术是这样实现技术问题之一的:一种可视化的分布式系统实时监控运维方法,所述方法包括如下步骤:步骤1、在各个应用系统上进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;步骤2、将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收到的数据信息存储成HBase或者HDFS格式的文件;步骤3、在ELK框架中的Kibana框架的基础上,结合业界的报表插件来实现在Web页面中展示各种视图,包括获取存储的数据信息,并根据数据信息以及数据层中的CMDB配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示;同时通过分布式缓存来实时推送更新各种视图中的数据。进一步地,所述步骤1具体为:使用各类钩子脚本在各个应用系统上进行无侵入式埋点,通过各类钩子脚本来拦截各个应用系统中的应用程序或者内部组件的传递参数,以实现获取各个应用系统的日志信息;在应用的操作系统上部署开源的Flume插件,并通过该Flume插件来采集操作系统上的各种硬件运行信息;同时,在应用的操作系统上部署开源的Logstash或Fluentd插件,并通过该Logstash或Fluentd插件来采集操作系统上的操作日志信息。进一步地,所述步骤2具体为:将采集到的各种数据信息通过socket异步抛给消息中间件集群,并由消息中间件集群将各种数据信息传递给流式计算框架集群;流式计算框架集群将接收到的数据信息直接分类并存储成HBase或者HDFS格式的文件;或者流式计算框架集群先采用Storm技术对接收到的数据信息进行流式计算,以根据预先配置在流式计算库中的拦截规则来对数据信息进行过滤和清洗,然后将过滤和清洗后的数据信息分类并存储成HBase或者HDFS格式的文件。进一步地,在所述步骤3中,所述“根据数据信息以及数据层中的CMDB配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示”具体为:通过基于复杂事件处理的事件流引擎来对数据信息中的业务发展数据进行复杂事件计算,并根据计算结果以及配置的相关业务规则来进行业务发展视图的展示;根据数据信息中的相关应用的性能数据来实时计算API耗时,并根据计算结果来进行应用性能视图的展示;根据数据层中的CMDB配置库信息并结合设备间的拓扑关系来进行应用部署视图的展示;根据CMDB配置库中的拓扑关系信息得到设备在应用中所承担的角色,同时提取角色作为轮询调度主机列表,完成对后台轮询调度任务的分析和统计,并根据统计结果来进行后台轮询调度视图的展示;根据数据信息中的接口服务调用数据来分析和统计应用接口的调用情况,且根据应用接口的调用情况来进行应用接口调用视图的展示;根据数据信息中的用户操作行为数据来分析和统计用户的体验情况,并根据用户的体验情况来进行用户体验视图的展示;通过基于复杂事件处理的事件流引擎来对数据信息中的告警信息进行复杂事件计算,并根据计算结果来进行应用监控视图的展示;同时,在数据层中设置告警阈值,当出现计算结果超过告警阈值的情况时,自动向相关人员发送告警信息。本专利技术要解决的技术问题之二,在于提供一种可视化的分布式系统实时监控运维装置,通过该装置来实现分布式系统应用的可视化管本文档来自技高网
...
一种可视化的分布式系统实时监控运维方法及装置

【技术保护点】
一种可视化的分布式系统实时监控运维方法,其特征在于:所述方法包括如下步骤:步骤1、在各个应用系统上进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;步骤2、将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收到的数据信息存储成HBase或者HDFS格式的文件;步骤3、在ELK框架中的Kibana框架的基础上,结合业界的报表插件来实现在Web页面中展示各种视图,包括获取存储的数据信息,并根据数据信息以及数据层中的CMDB配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示;同时通过分布式缓存来实时推送更新各种视图中的数据。

【技术特征摘要】
1.一种可视化的分布式系统实时监控运维方法,其特征在于:所述方法包括如下步骤:步骤1、在各个应用系统上进行无侵入式埋点,采集各个应用系统的日志信息;在应用的操作系统上部署开源插件,采集操作系统的硬件运行信息和操作日志信息;步骤2、将采集到的各种数据信息通过消息中间件集群传递给流式计算框架集群,流式计算框架集群将接收到的数据信息存储成HBase或者HDFS格式的文件;步骤3、在ELK框架中的Kibana框架的基础上,结合业界的报表插件来实现在Web页面中展示各种视图,包括获取存储的数据信息,并根据数据信息以及数据层中的CMDB配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示;同时通过分布式缓存来实时推送更新各种视图中的数据。2.根据权利要求1所述的一种可视化的分布式系统实时监控运维方法,其特征在于:所述步骤1具体为:使用各类钩子脚本在各个应用系统上进行无侵入式埋点,通过各类钩子脚本来拦截各个应用系统中的应用程序或者内部组件的传递参数,以实现获取各个应用系统的日志信息;在应用的操作系统上部署开源的Flume插件,并通过该Flume插件来采集操作系统上的各种硬件运行信息;同时,在应用的操作系统上部署开源的Logstash或Fluentd插件,并通过该Logstash或Fluentd插件来采集操作系统上的操作日志信息。3.根据权利要求1所述的一种可视化的分布式系统实时监控运维方法,其特征在于:所述步骤2具体为:将采集到的各种数据信息通过socket异步抛给消息中间件集群,并由消息中间件集群将各种数据信息传递给流式计算框架集群;流式计算框架集群将接收到的数据信息直接分类并存储成HBase或者HDFS格式的文件;或者流式计算框架集群先采用Storm技术对接收到的数据信息进行流式计算,以根据预先配置在流式计算库中的拦截规则来对数据信息进行过滤和清洗,然后将过滤和清洗后的数据信息分类并存储成HBase或者HDFS格式的文件。4.根据权利要求1所述的一种可视化的分布式系统实时监控运维方法,其特征在于:在所述步骤3中,所述“根据数据信息以及数据层中的CMDB配置库信息来进行业务发展视图、应用性能视图、应用部署视图、后台轮询调度视图、应用接口调用视图、用户体验视图或者应用监控视图的展示”具体为:通过基于复杂事件处理的事件流引擎来对数据信息中的业务发展数据进行复杂事件计算,并根据计算结果以及配置的相关业务规则来进行业务发展视图的展示;根据数据信息中的相关应用的性能数据来实时计算API耗时,并根据计算结果来进行应用性能视图的展示;根据数据层中的CMDB配置库信息并结合设备间的拓扑关系来进行应用部署视图的展示;根据CMDB配置库中的拓扑关系信息得到设备在应用中所承担的角色,同时提取角色作为轮询调度主机列表,完成对后台轮询调度任务的分析和统计,并根据统计结果来进行后台轮询调度视图的展示;根据数据信息中的接口服务调用数据来分析和统计应用接口的调用情况,且根据应用接口的调用情况来进行应用接口调用视图的展示;根据数据信息中的用户操作行为数据来分析和统计用户的体验情况,并根据用户的体验情况来进行用户体验视图的展示;通过基于复杂事件处理的事件流引擎来对数据信息中的告警信息进行复杂事件计算,并根据计算结果来进行应用监控视图的展示;同时,在数据层中设置告警阈值,当出现计算结果超过告警阈值的情况时,自动向相关人员发送告警信息。5.一种可视化的分布式系统实时监控运维装置,其特征在...

【专利技术属性】
技术研发人员:刘壮飞郑国伟连超
申请(专利权)人:福建富士通信息软件有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1