一种可靠性能监控系统及方法。所述系统包括:应用服务器,用于运行被监控应用、将所述被监控应用的性能相关信息记录到性能日志存储模块中、并定时发送所述性能日志存储模块中的日志数据;日志传输平台,用于接收从所述应用服务器发送的日志数据、并根据性能分析服务器的订阅将所述日志数据发送到至少两个性能分析服务器;任务管理中心,用于向每个所述性能分析服务器分配需要处理的任务;以及至少两个性能分析服务器,用于执行所分配的任务,以对所述日志数据进行分析处理,获得性能统计结果。
【技术实现步骤摘要】
本专利技术涉及。
技术介绍
目前,主要采用单个性能监控服务器来进行性能监控。然而,当该性能监控服务器宕机时,监控服务中断。如果在性能监控服务器中使用双机集群(HA)方式或者额外的非关系数据库存储性能监控日志数据,会对性能造成巨大影响。因此,期望提供。
技术实现思路
为了解决现有技术中的上述缺点和问题而提出本专利技术。根据一个方面,本专利技术提出一种可靠性能监控系统,包括应用服务器,用于运行被监控应用、将所述被监控应用的性能相关信息记录到性能日志存储模块中、并定时发送所述性能日志存储模块中的日志数据;日志传输平台,用于接收从所述应用服务器发送的日志数据、并根据性能分析服务器的订阅将所述日志数据发送到至少两个性能分析服务器;任务管理中心,用于向每个所述性能分析服务器分配需要处理的任务;以及至少两个性能分析服务器,用于执行所分配的任务,以对所述日志数据进行分析处理,获得性能统计结果。可选地,每个所述性能分析服务器上部署主性能分析模块和辅性能分析模块,在正常情况下,所述主性能分析模块将执行;当主性能分析模块所在的性能分析服务器宕机时,或者由于其他原因造成不能提供服务时,所述辅性能分析模块将被分配所述主性能分析模块承担的所有或一部分任务。可选地,每个所述性能分析服务器上单独部署任务分配模块,并且所述任务管理中心通过所述任务分配模块来向所述性能分析服务器分配需要处理的任务。可选地,所述任务管理模块向所述任务管理中心注册,所述任务管理中心将分配给部署有所述任务管理模块的性能分析服务器的任务返回给所述任务管理模块,所述任务管理模块将所分配的任务写入任务分配文件,性能分析模块每次进行性能分析统计前,读取所述任务分配文件来确定自己要执行的任务。可选地,当一个所述性能分析服务器宕机时,所述任务管理中心根据算法或者配置文件等选择其他所述性能分析服务器来执行宕机的性能分析服务器所执行的任务。可选地,调用所述其他任务分析服务器上部署的任务管理模块分配新任务。可选地,所述应用服务器包括日志提取代理,用于定时从所述性能日志存储模块中读取增量更新并发送。根据本专利技术的另一个方面,本专利技术提出一种可靠性能监控方法,包括被监控应用将性能相关信息记录到性能日志存储模块;所述被监控应用定时将存储在所述性能日志存储模块中的日志数据发送到日志传输平台;所述日志传输平台根据性能分析服务器的订阅将所述日志数据发送到至少两个性能分析服务器;每个所述性能分析服务器执行所述任务管理中心所分配的任务;以及当一个所述性能分析服务器宕机时,所述任务管理中心将宕机的性能分析服务器的任务分配给其他性能分析服务器。可选地,所述任务管理中心通过部署在性能分析服务器上的任务分配模块来向性能分析服务器分配任务。可选地,在性能分析服务器启动后,任务管理模块向任务管理中心注册,任务管理中心将分配给这个性能分析服务器的任务返回给任务管理模块,任务管理模块将所分配的任务写入任务分配文件,性能分析模块每次进行性能分析统计前,读取任务分配文件来确定自己要执行的任务。可选地,当一个性能分析服务器宕机时,所述任务管理中心将根据算法或者配置文件选择其他性能分析服务器来执行宕机性能分析服务器执行的任务,其中,接替执行性能分析任务的性能分析模块所在的性能分析服务器上,必须订阅了要分析应用的性能日O可选地,通过日志提取代理定时从所述性能日志存储模块中读取增量更新并发送。附图说明通过下面结合附图进行的描述,本专利技术一些示范性实施例的上述和其他方面、特征和优点对于本领域技术人员来说将变得显而易见,其中图1是图示根据本专利技术的可靠性能监控系统的框图;以及图2是图示根据本专利技术的可靠性能监控方法的流程图。具体实施例方式提供参考附图的下面描述以帮助全面理解本专利技术的示范性实施例。其包括各种细节以助于理解,而应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识至IJ,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,省略了对公知功能和结构的描述。根据本专利技术的可靠性能监控系统及方法能够解决性能监控的单点问题,当一台性能监控服务器宕机时,可以由其他性能监控服务器继续进行监控,保证监控服务不中断。下面将参考附图详细描述本专利技术。图1是图示根据本专利技术的可靠性能监控系统的框图。如图1中所示,根据本专利技术的可靠性能监控系统包括应用服务器110、日志传输平台120、至少两个性能分析服务器130和任务管理中心140。虽然在图1中示出了两个应用服务器110-1和110-2,但是可以包括更少或更多的应用服务器。每个应用服务器110运行被监控应用112、将被监控应用112的性能相关信息记录到性能日志存储模块114 (例如性能日志)中、并定时发送性能日志存储模块114中的日志数据。可以每当被监控应用112被执行时,通过被监控应用112调用适当的方法或接口来将性能相关信息记录到性能日志存储模块114中。性能相关信息可以包括执行开始时间、执行完成时间等。此外,可以通过日志提取代理116来定时发送性能日志存储模块114中的日志数据。优选地,日志提取代理116定时从性能日志存储模块114中读取增量更新并发送。日志传输平台(或消息中间件)120接收从应用服务器110发送的日志数据、并根据所述至少两个性能分析服务器130的订阅将日志数据发送到性能分析服务器。任务管理中心140向每个性能分析服务器130分配需要处理的任务。例如,任务管理中心140可以从数据库等读取要分配的所有任务,并且在分配任务时保证每一个应用服务器上的所有应用都可以进行性能分析统计,而且在通常情况下保持每个性能分析服务器的负载基本平衡。明显地,任务管理中心140可以根据其他规则来分配任务,例如基于每个性能分析服务器的性能等因素。此外,当一个性能分析服务器宕机时,或者其他原因造成主性能分析模块不能提供服务时,任务管理中心140将该任务分析服务器的任务分配给其他记录有相应日志数据的性能分析服务器。例如,可以通过存活性监控系统来发现一个性能分析服务器出现故障,并通知任务管理中心。性能分析服务器130执行每个所分配的任务,对日志数据进行分析处理,获得性能统计结果。例如,每隔预定时间段(例如每分钟)执行一次性能分析。此外,性能分析服务器130可以将分析结果存储在数据库中,从而能够通过展示系统获取相关信息。例如,性能分析服务器将分析结果存储到外部的存储系统中(数据库、nosql数据库等)中。当分配到新的任务时(例如,当其他性能分析服务器宕机时由任务管理中心分配新的任务),性能分析服务器可以从存储分析结果的存储系统(数据库、nosql数据库等)中找到最后分析结果,根据最后分析结果的时间,继续进行性能统计分析。在图1中示出每个性能分析服务器130上部署两个性能分析模块,即主性能分析模块132和辅性能分析模块134。在正常情况下,主性能分析模块将执行;当另外一台性能分析服务器宕机时,辅性能分析模块134将被分配原来由宕机的性能分析服务器承担的任务或一部分(例如,在包括三个或更多性能分析服务器的情况下)。虽然在图1中每个性能分析服务器上部署两个性能分析模块(针对单线程性能分析模块),但是对于多线程性能分析模块,只需要一个性能分析模块,而且为了增加可靠性,也可以本文档来自技高网...
【技术保护点】
一种可靠性能监控系统,包括:应用服务器,用于运行被监控应用、将所述被监控应用的性能相关信息记录到性能日志存储模块中、并定时发送所述性能日志存储模块中的日志数据;日志传输平台,用于接收从所述应用服务器发送的日志数据、并根据性能分析服务器的订阅将所述日志数据发送到至少两个性能分析服务器;任务管理中心,用于向每个所述性能分析服务器分配需要处理的任务;以及至少两个性能分析服务器,用于执行所分配的任务,以对所述日志数据进行分析处理,获得性能统计结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:张永成,吕鹏,哈维,钟德银,魏建楠,
申请(专利权)人:北京京东世纪贸易有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。