一种云平台监控系统的异常定位方法和装置制造方法及图纸

技术编号:18403609 阅读:41 留言:0更新日期:2018-07-08 22:01
本发明专利技术实施例公开了一种云平台监控系统的异常定位方法和装置。所述方法包括:通过关联检索系统接收指标数据管理系统发送的告警信息;通过所述关联检索系统向所述指标数据管理系统发送指标信息查询请求,且获取所述指标数据管理系统响应所述指标信息查询请求返回的指标信息;通过所述关联检索系统向日志管理系统发送日志信息查询请求,且获取所述日志管理系统响应所述日志信息查询请求返回的日志信息;依据所述指标信息和所述日志信息进行异常定位。本发明专利技术实施例可以提高定位异常问题的效率,方便运维。

An abnormal location method and device for cloud platform monitoring system

The embodiment of the invention discloses an abnormal location method and device for a cloud platform monitoring system. The method includes: receiving the alarm information sent by an index data management system through an association retrieval system, sending an index information query request to the index data management system through the associated retrieval system, and obtaining the index information that the index data management system responds to the return of the query request of the index information. The associated retrieval system sends a log information query request to the log management system, and gets the log information that the log management system responds to the log information query request, and makes the abnormal positioning according to the index information and the log information. The embodiment of the invention can improve the efficiency of locating abnormal problems and facilitate operation and maintenance.

【技术实现步骤摘要】
一种云平台监控系统的异常定位方法和装置
本专利技术实施例涉及数据维护
,尤其涉及一种云平台监控系统的异常定位方法和装置。
技术介绍
近年来,云计算技术迅速发展,云服务作为一种比较新的服务提供方式逐渐被接受并广泛应用。支撑云服务的是其云计算系统,云计算系统(或称云平台)又分私有云、公有云和混合云等多种形态。由于云计算技术的复杂性,云计算系统中经常发生各种故障或异常。这些故障或异常会直接影响资源承载的业务,甚至会导致严重的经济损失,因此快速感知和定位异常信息是云计算系统运维面临的一个主要任务。云平台监控系统是感知异常或告警信息的有效工具。云平台监控系统,一般包含指标采集、指标上报、指标分析和告警处理等多个模块。监控系统通过指标采集模块采集设定的各种指标,通过指标上报模块将采集的数据发送至指标分析模块,指标分析模块根据设定的规则对数据进行检测,当达到某种预先设定的规则时可以通过告警处理模块发出各种告警通知。日志记录了程序或系统的运行历史状态,在软件程序中占有非常重要的地位,通过分析日志中的错误信息或关键日志信息有利于快速排查程序问题。并且,通过实时分析日志也可以达到监控异常并快速定位的目的。然而,云计算系统规模庞大、业务逻辑复杂,日志数据量大且信息记录分散,虽然有各种日志集中管理系统,但真正通过查找日志信息来分析故障或问题仍然比较困难。首先,一个简单服务故障可能的原因有多种多样,可能要同时分析云计算系统各种服务日志、云计算系统各个物理主机系统日志以及云计算系统各种硬件运行信息相关日志的异常信息等,很难快速确定哪个日志中记录的异常相关的信息。其次,某个服务的故障不一定是由于物理资源或云平台服务的故障导致的,系统资源或服务运行状态的波动或不稳定也可能导致对位服务的异常或故障,并且日志中也可能没有记录下明显的错误日志信息。监控系统的异常或故障警报与具体某个日志文件没有必然的联系,这给通过分析日志定位问题带来很大的困难。
技术实现思路
本专利技术提供一种云平台监控系统的异常定位方法和装置,可以提高定位异常问题的效率,方便运维。第一方面,本专利技术实施例提供了一种云平台监控系统的异常定位方法,包括:通过关联检索系统接收指标数据管理系统发送的告警信息;通过所述关联检索系统向所述指标数据管理系统发送指标信息查询请求,且获取所述指标数据管理系统响应所述指标信息查询请求返回的指标信息;通过所述关联检索系统向日志管理系统发送日志信息查询请求,且获取所述日志管理系统响应所述日志信息查询请求返回的日志信息;依据所述指标信息和所述日志信息进行异常定位。第二方面,本专利技术实施例还提供了一种云平台监控系统的异常定位装置,该装置包括:告警接收模块,用于通过关联检索系统接收指标数据管理系统发送的告警信息;指标信息获取模块,用于通过所述关联检索系统向所述指标数据管理系统发送指标信息查询请求,且获取所述指标数据管理系统响应所述指标信息查询请求返回的指标信息;日志信息获取模块,用于通过所述关联检索系统向日志管理系统发送日志信息查询请求,且获取所述日志管理系统响应所述日志信息查询请求返回的日志信息;异常定位模块,用于依据所述指标信息和所述日志信息进行异常定位。本专利技术实施例通过关联检索系统接收到告警信息后,向指标数据管理系统和日志管理系统分别发送指标信息和日志信息查询的请求,并获取返回的指标信息和日志信息,从而依据获取到的指标信息和日志信息进行异常定位。本专利技术实施例提供的技术方案通过关联检索系统可以关联查询并获取到指标信息和日志信息,由于指标信息中包括与异常相关的所有资源信息,将指标信息和日志信息结合分析能快速感知异常并定位异常出现的具体位置,可以提高位异常问题的效率,方便运维。附图说明图1为本专利技术实施例一中的一种云平台监控系统的异常定位方法的流程图;图2为本专利技术实施例一中的一种云平台监控系统的示意图;图3为本专利技术实施例二中的一种云平台监控系统的异常定位方法的流程图;图4为本专利技术实施例三中的一种云平台监控系统的异常定位装置的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一中的一种云平台监控系统的异常定位方法的流程图,本实施例可适用于云平台监控系统的异常定位的情况,该方法可以由云平台监控系统的异常定位装置来执行,该方法具体可以包括:步骤110、通过关联检索系统接收指标数据管理系统发送的告警信息。其中,所述关联检索系统和指标数据管理系统可以配置在云平台监控系统中。所述云平台可以提供云服务,云服务是基于互联网的相关服务的增加、使用和交互模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云服务可以包括基础设施服务(Infrastructureasaservice,IaaS)、平台服务(Platformasaservice,PaaS)和软件服务(Softwareasaservice,SaaS)等等。IaaS可以提供计算基础架构,通常是物理机/虚拟机、网络资源和其他资源,如虚拟机镜像库、基于文件的存储、防火墙、负载均衡、IP地址、虚拟局域网等等。PaaS可以提供计算平台,可以包括操作系统、编程语言的运行环境、数据库和Web服务器等。SaaS可以提供被称为按需支付费用的应用软件,SaaS服务提供商来完成各种应用程序的安装、设置和运行维护,用户只需支付费用,通过一些可视化的客户端来使用它。图2为本专利技术实施例一中的一种云平台监控系统的示意图,云平台监控系统可以嵌入到云平台中,并可以包括指标和日志管理部分和用户界面两个部分。其中指标采集系统和日志采集系统分别可以采集指标数据和日志信息,以记录业务定义的资源信息、业务进程信息、系统服务信息和硬件运行信息等。指标和日志管理部分可以包括指标数据管理系统、日志管理系统和关联检索系统。用户界面可以包括指标查询接口、关联查询接口和日志查询接口,用户界面可以通过调用指标查询接口、关联查询接口和日志查询接口对指标数据管理系统、日志集中管理系统和关联检索系统进行配置或进行交互查询。其中,所述指标数据管理系统可以包括采集指标配置模块,可以向指标采集系统配置要采集的指标及采集规则;包括告警规则配置模块,可以配置各种故障和问题检测的告警匹配规则;包括告警消失判断及发送模块,可以根据实时上报的数据和告警匹配规则自动向关联检索系统发送告警,告警信息中包含资源标示信息及告警匹配规则信息;包括指标数据检索模块,可以存储指标信息,可以接收关联检索系统发送的请求,根据指定的资源信息,查询相关资源及指标信息。所述关联检索系统可以包括告警接收模块,可以接收指标数据管理系统发送的告警信息;包括关联判断模块,可以配置关联检索的规则(如关联检索物理主机信息、进程信息),可以基于关联检索系统与指标数据管理系统的交互,查询相关资源信息;包括日志查询模块,可以基于关联检索系统与日志集中管理系统的交互,查询相关日志信息。具体的,通过关联检索系统的告警接收模块可以接收指标数据管理系统中的告警消息判断及发送模块根据所述指标采集系统发送的实时指标数据和告警匹配规本文档来自技高网
...

【技术保护点】
1.一种云平台监控系统的异常定位方法,其特征在于,包括:通过关联检索系统接收指标数据管理系统发送的告警信息;通过所述关联检索系统向所述指标数据管理系统发送指标信息查询请求,且获取所述指标数据管理系统响应所述指标信息查询请求返回的指标信息;通过所述关联检索系统向日志管理系统发送日志信息查询请求,且获取所述日志管理系统响应所述日志信息查询请求返回的日志信息;依据所述指标信息和所述日志信息进行异常定位。

【技术特征摘要】
1.一种云平台监控系统的异常定位方法,其特征在于,包括:通过关联检索系统接收指标数据管理系统发送的告警信息;通过所述关联检索系统向所述指标数据管理系统发送指标信息查询请求,且获取所述指标数据管理系统响应所述指标信息查询请求返回的指标信息;通过所述关联检索系统向日志管理系统发送日志信息查询请求,且获取所述日志管理系统响应所述日志信息查询请求返回的日志信息;依据所述指标信息和所述日志信息进行异常定位。2.根据权利要求1所述的方法,其特征在于,所述通过关联检索系统接收指标数据管理系统发送的告警信息之前,还包括:通过指标采集系统和日志采集系统依据资源标示信息分别采集同一对象的实时指标数据和日志信息,且将采集的实时指标数据和日志信息分别发送给所述指标数据管理系统和所述日志管理系统。3.根据权利要求1所述的方法,其特征在于,所述告警信息是所述指标数据管理系统中的告警消息判断及发送模块根据所述指标采集系统发送的实时指标数据和告警匹配规则生成的。4.根据权利要求1所述的方法,其特征在于,所述依据所述指标信息和所述日志信息进行异常定位之前,还包括:通过关联查询接口将查询到的指标信息和日志信息展示给用户。...

【专利技术属性】
技术研发人员:江均勇李松
申请(专利权)人:上海有云信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1