一种资源监控方法及系统技术方案

技术编号:10527718 阅读:68 留言:0更新日期:2014-10-09 12:37
本发明专利技术公开了一种资源监控方法及系统,包括收集云计算平台中各个节点产生的日志数据;匹配收集到的日志数据和预先设置的异常事件策略,如果匹配成功,则产生异常事件;监听异常事件并进行告警。本发明专利技术方法利用了被监控系统中已有的日志框架,不需要在系统中植入新的执行代码,因此,不会增加被监控应用系统的开发工作量,降低了监控的复杂度,且减小了对系统的运行性能的影响,也避免了监控过程中的轮询。同时,由于云计算平台及大型应用系统的日志数据量巨大,因此,本发明专利技术方法具有充分的数据来源,并且由于日志数据包含的信息丰富,使得本发明专利技术方法适用于包括云计算平台在内的各种大型应用系统。

【技术实现步骤摘要】
一种资源监控方法及系统
本专利技术涉及云计算技术,尤指一种基于云计算平台的资源监控方法及系统。
技术介绍
计算机运行时,需要对资源的运行状况进行实时监控,比如CPU使用率、内存使用 率等。现有监控中,需要在系统中植入代码,这样必然影响系统的性能。特别是在云计算平 台中,涉及的应用、资源众多,部署环境要求高,往往涉及集群,系统运行情况复杂,如果不 能对云计算平台进行准确、有效的监控,则难以对云计算平台的实际运行情况进行掌控及 调度。 监控在云计算系统中扮演着重要的角色。通过监控能够及时发现云计算平台在运 营过程中的资源使用情况,从而及时发现异常情况。 云计算平台监控的一般原理是,在各个分散的云计算节点上运行守护进程,该守 护进程用于收集本云计算节点上的监控信息并发送到汇聚节点,汇聚节点对收集到的监控 信息进行分析与存储并将分析结果以可视化或告警等方式通知给用户。对于云计算平台监 控系统来说,关键是各个云计算节点的守护进程与收集的监控信息的处理方式。 当前,比较流行的监控系统有 Ganglia,InteMon,ClusterProbe,HP OpenView,IBM Tivoli 等。其中,Ganglia,InteMon,ClusterProbe 是开源软件,HP OpenView,IBM Tivoli 是商用软件。 其中,ClusterProbe是现有常用的监控系统。ClusterProbe是由香港大学设计与 开发的一款开放环境的集群监控工具。ClusterProbe的设计初衷在于开发高灵活性与扩展 性的大规模集群监控系统。ClusterProbe主要包括监控服务器、监控代理节点和节点代理 三部分,即代理(agent) +服务器(server)的方式。其中,监控服务器,用于接收用户的请 求以及将用户感兴趣的监控结果反馈给用户,监控服务器通过交互适配器和网络上其它节 点交互信息,该适配器能够支持多种网络交互协议;监控代理节点用于管理该节点及其下 属所有子节点,这些子节点包括不同类型的资源类型,并组成监控域;节点代理,以守护进 程的方式运行在云平台中的每个节点上,用于从监控代理节点接收命令或者根据自身的设 置进行本地监控信息的收集,节点代理与监控代理节点通过Java远程方法调用(RMI)进行 通信。 ClusterProbe的最大优点就是提出了开放式节点守护进程的概念,并且通过Java RMI实现功能的增减。这样,使得各个节点上的守护进程更加轻量级,也降低了监控系统对 集群本身造成的压力。但是,ClusterProbe也存在一些不足之处,比如:系统使用Java RMI 来实现远程方法调用,实现较复杂,当监控代理节点过多时,容易造成系统结构复杂,存在 出现问题不易排查的缺陷。 根据上面的分析可知,现有监控系统通用的架构是代理+服务器的方式。其中, Agent用于收集监控资源的状态信息,server利用这些状态信息。Agent与server之间采 用,在拉模式中,发起者是server,它采用轮询的方式从agent 拉信息。拉模式实现相对 简单,但会消耗较多的资源,实时性也较差。因此,拉模式适用于周期性询问的场景,但是, 如果轮询周期较长,会降低资源的消耗,但可能丢失状态信息;如果轮询周期较短,则对系 统性能影响较大。 现有监控系统往往需要安装agent来收集数据,并将数据传输到server上,以实 现监控。这种监控方式会降低被监控系统性能,且监控数据容量越大,效率越低;同时,由于 各个被监控系统使用的数据格式不统一,导致agent植入代码困难,而且由于需要创建监 控节点,增大了系统的使用复杂度。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种资源监控方法及系统,无需在系统中 植入代码,能够降低监控的复杂度,且减少对系统运行性能的影响。 为了达到本专利技术目的,本专利技术提供了一种资源监控方法,包括:收集云计算平台中 各个节点产生的日志数据; 匹配收集到的日志数据和预先设置的异常事件策略,如果匹配成功,则产生异常 事件; 监听异常事件并进行告警。 所述收集云计算平台中各个节点产生的日志数据包括:将日志系统产生的日志数 据推送至监控容器。 所述匹配收集到的日志数据和预先设置的异常事件策略库之前,该方法还包括: 对所述对收集到的日志数据进行过滤。 所述匹配采用Java中的Java事件处理机制实现。 利用所述Java中的事件处理机制中包括的监听功能实现所述监听异常事件并进 行告警。 本专利技术还提供了一种资源监控系统,至少包括日志适配器、日志数据生成器、一个 或一个以上监控容器,以及事件监听器;其中, 日志适配器,用于存储日志数据与推送目标之间的对应关系; 日志数据生成器,用于根据日志适配器的对应关系,将来自云计算平台各个节点 的应用系统产生的日志数据推送到相应的监控容器; 监控容器,用于匹配收集到的日志数据和预先设置的异常事件策略,如果匹配成 功,则产生异常事件; 事件监听器,用于按照预先设置的事件监听类型,监听异常事件并根据监听的结 果进行告警。 所述监控容器,还用于按照预先设置的过滤策略过滤所述日志数据生成器推送的 日志数据。 所述事件监听器为两个或两个以上,每个事件监听器用于监听一种具体类型的事 件。 该系统还包括:应用日志配置器,用于设置日志配置文件,开启或关闭对资源的监 控。 与现有技术相比,本专利技术包括收集云计算平台中各个节点产生的日志数据;匹配 收集到的日志数据和预先设置的异常事件策略,如果匹配成功,则产生异常事件;监听异常 事件并进行告警。本专利技术方法利用了被监控系统中已有的日志框架,不需要在系统中植入 新的执行代码,因此,不会增加被监控应用系统的开发工作量,降低了监控的复杂度,且减 小了对系统的运行性能的影响,也避免了监控过程中的轮询。同时,由于云计算平台及大型 应用系统的日志数据量巨大,因此,本专利技术方法具有充分的数据来源,并且由于日志数据包 含的信息丰富,使得本专利技术方法适用于包括云计算平台在内的各种大型应用系统。 本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利 要求书以及附图中所特别指出的结构来实现和获得。 【附图说明】 附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本 申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。 图1为本专利技术资源监控方法的流程图; 图2为本专利技术资源监控系统的组成结构示意图。 【具体实施方式】 为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术 的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中 的特征可以相互任意组合。 在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中 执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺 序执行所示出或描述的步骤。 图1为本专利技术资源监本文档来自技高网
...

【技术保护点】
一种资源监控方法,其特征在于,包括:收集云计算平台中各个节点产生的日志数据;匹配收集到的日志数据和预先设置的异常事件策略,如果匹配成功,则产生异常事件;监听异常事件并进行告警。

【技术特征摘要】
1. 一种资源监控方法,其特征在于,包括:收集云计算平台中各个节点产生的日志数 据; 匹配收集到的日志数据和预先设置的异常事件策略,如果匹配成功,则产生异常事 件; 监听异常事件并进行告警。2. 根据权利要求1所述的资源监控方法,其特征在于,所述收集云计算平台中各个节 点产生的日志数据包括:将日志系统产生的日志数据推送至监控容器。3. 根据权利要求2所述的资源监控方法,其特征在于,所述匹配收集到的日志数据和 预先设置的异常事件策略库之前,该方法还包括:对所述对收集到的日志数据进行过滤。4. 根据权利要求1、2或3所述的资源监控方法,其特征在于,所述匹配采用Java中的 Java事件处理机制实现。5. 根据权利要求4所述的资源监控方法,其特征在于,利用所述Java中的事件处理机 制中包括的监听功能实现所述监听异常事件并进行告警。6. -种资源监控系统,其特征在于,至少包括日志适配器、日志数据生成器...

【专利技术属性】
技术研发人员:王少锋张云勇刘明辉
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1