【技术实现步骤摘要】
计算机服务器集群日志监控方法及监控平台
本专利技术涉及计算机
,具体为一种计算机服务器集群日志监控方法及监控平台。
技术介绍
随着信息时代的到来,大数据、云计算和机器学习等技术逐渐成为计算机领域的研究热点。大数据、云计算、机器学习等技术具有一个共同的特点:需要进行复杂而庞大的计算,因此,往往需要使用大量的计算机服务器组成一个或多个集群进行并行计算,合力完成一项或多项计算任务。近年来随着需求日益旺盛,计算机服务器集群规模也从原来的几十台逐渐发展成几百台、几千台,甚至几万台。随着计算机服务器集群的大规模化,如何管控集群性能指标(例如:服务器的CPU、内存、网络的使用情况、磁盘I/O读写情况等)和如何及时发现集群存在的问题并及时处理逐渐成为机房运维人员面临的的大难题。现有技术中,机房运维人员采用的主要方法有:(1)机房定期巡检,查看服务器的指示灯是否有告警;(2)利用互联网上的一些免费的服务器监控软件,进行协助管理。然而,随着服务器数量越来越多,成千上万台的服务器,单凭机房管理人员定期巡检,通过肉眼去判断、查看问题,不仅工作量太大,而且容易造成错检、漏检。即使利用互联网上面的监控软件进行协助管理也存在很大的安全问题,由于这些监控软件的内部结构未知,贸然使用,存在木马病毒攻击或黑客入侵风险,并且这些监控软件通常只适用于计算机服务器集群数量较少的应用场合,当服务器数量为几十台时,软件运行性能良好;但如果服务器达到了几百台,几千台甚至几万台,则软件性能会显著下降,甚至出现软件无法支持的情况。针对上述问题,国内研究人员也开发了一些专门针对计算机服务器集群的日志收集 ...
【技术保护点】
一种计算机服务器集群日志监控方法,具体步骤包括:A.监控计算机服务器集群中的各个服务器在运行过程中主板产生的海量机器码指令,利用大数据技术中的实时流数据采集框架对主板产生的机器码指令数据进行实时采集,所述机器码指令至少包括内存指令、CPU指令、磁盘IO指令、网络流量指令、TCP连接数指令、应用进程参数指令;B.对采集到的机器码指令进行数据分类和转移操作,包括实时地过滤、加工及存储;C.对步骤B处理后的数据进行实时分析和展示,获得实时分析结果并存储;D.结合实时分析结果和存储的历史分析结果进行分析,得出计算机服务器潜在异常结果,并进行预警和通知。
【技术特征摘要】
1.一种计算机服务器集群日志监控方法,具体步骤包括:A.监控计算机服务器集群中的各个服务器在运行过程中主板产生的海量机器码指令,利用大数据技术中的实时流数据采集框架对主板产生的机器码指令数据进行实时采集,所述机器码指令至少包括内存指令、CPU指令、磁盘IO指令、网络流量指令、TCP连接数指令、应用进程参数指令;B.对采集到的机器码指令进行数据分类和转移操作,包括实时地过滤、加工及存储;C.对步骤B处理后的数据进行实时分析和展示,获得实时分析结果并存储;D.结合实时分析结果和存储的历史分析结果进行分析,得出计算机服务器潜在异常结果,并进行预警和通知。2.根据权利要求1所述的计算机服务器集群日志监控方法,其特征在于:步骤A中,通过RHCS技术,在2台服务器上部署主监控节点的监控服务,监控服务自动在计算机服务器集群中的服务器上部署采集代理,以保证监控服务在高可用状态,主监控节点能自动扫描发现并添加集群内新增的服务器至监控列表,自动添加被监控服务器的监控项;2台服务器采用主-从服务器的工作方式:主服务器工作,从服务器处于监控准备状况;当主服务器宕机时,从服务器接管主服务器的一切工作,待主服务器恢复正常后,按使用者的设定以自动或手动方式将服务切换到主服务器上运行。3.根据权利要求2所述的计算机服务器集群日志监控方法,其特征在于:所述流数据采集框架包括N个采集代理模块、采集服务模块、数据过滤模块、动态性能平衡模块和分布式流计算模块,所述N个采集代理模块运行在N个被监控节点上,实时采集被监控节点上的海量机器码指令,所述采集服务模块运行在主监控节点上,实时采集各采集代理模块发送的机器码指令并将其发送至数据过滤模块,所述数据过滤模块运行在主监控节点上,接收采集服务模块发送的机器码指令并将进行初步过滤,并将过滤后的机器码指令发送至分布式流计算模块,所述动态性能平衡模块用于动态平衡采集代理模块与采集服务模块、采集服务模块与数据过滤模块、数据过滤模块与分布式流计算模块之间的服务性能。4.根据权利要求3所述的计算机服务器集群日志监控方法,其特征在于:步骤A中所述的采集代理模块的采集项目可添加和配置,采集项目的相关阈值可设置。5.根据权利要求1所述的计算机服务器集群日志监控方法,其特征在于:步骤B所述的实时地过滤、加工及存储具体包括:通过基于Flueme+Kafka+Strom框架的分布式流计算服务把服务器生成的机器码半结构化数据进行初步的过滤,保留用于分析的数据,再把该部分的数据翻译成可读的、有规律的结构化及半结构化数据,翻译后的数据通过HBase高性能列式数据库进行存储,结合Phoenix对外提供数据的实时读/写,HBase利用HDFS分布式文件系统做持久化数据存储,同时使用Hive提供静态结构化数据的查询,其使用类SQL语言,底层经过编译转位MapReduce程序在Hadoop上...
【专利技术属性】
技术研发人员:尤福宝,汤成辉,徐文渊,黄云辉,
申请(专利权)人:江苏神威云数据科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。