一种服务器集群的自动检测方法和系统技术方案

技术编号:12140383 阅读:73 留言:0更新日期:2015-10-01 19:24
本发明专利技术提供了一种服务器集群的自动检测方法和系统,包括:收集并保存所有运行的所述集群服务器的IP地址;按照收集的IP地址,运行第一脚本,实现无账号密码登陆所有运行的所述集群服务器;运行第二脚本,检测所有运行的所述集群服务器的资源使用情况及状态信息,并归档保存检测结果。其中,第一脚本用于实现无密码登陆集群服务器,是根据SSH的远程登陆认证方式预先编写完成的;第二脚本用于检测运行的所述集群服务器,是使用SHELL预先编写完成的。本发明专利技术无需单独采购服务器进行部署或借助第三方商业软件,以自动化检测代替人工操作,减少了系统管理员的工作量,提高了工作效率,且成本较低。

【技术实现步骤摘要】

本专利技术涉及Linux网络服务器的运营和维护领域,特别是涉及一种基于BashShell的服务器集群自动检测方法。
技术介绍
随着计算机技术的飞速发展和广泛应用,硬件服务器设备的需求也从最初的零星几台的需求方式,发展到至今的大规模、大批量的服务器集群需求方式。随着全世界的计算机服务器数量急剧增加,这就对服务器的日常巡检带来了巨大的挑战。并且,各数据中心、政府机关、企业对大量的Unix/Linux服务器的要求也比较高,因此,日常巡检工作也越来越繁重,针对这类服务器的日常巡检工作量也就越来越多。目前采用的是传统的手动巡检方式:系统管理员逐个对每一个服务器使用登录工具,逐台登录每一个操作系统,手工敲入命令检查Unix/Linux服务器的各项指标(如:CPU、内存、磁盘日志、系统日志等等)ο对于小规模的服务器集群,通过手动巡检这种方式对Unix/Linux服务器集群进行巡检,在时间和工作量上还是可以接受的。但是,如果是面对大规模的Unix/Linux服务器集群,系统管理员仍然采用手动巡检这种方式的话,一方面,会给系统管理员的工作带来极大的困难:需要耗费大量的时间和人力来面对大量的Unix/Linux操作系统日常巡检工作,系统管理员需要逐个登陆操作系统、输入检查命令、查看操作系统日志,这是一项复杂且耗费时间的工作,工作重复性强,效率低下,并且,一个数据中心需要的系统管理员也较多,运维人力成本较高。而另一方面,还会造成Unix/Linux服务器资源供应的延时,从而延误了其他相关工作、业务的正常进行。当然,目前,也有一些专门的主机监控工具,一般需要单独采购专用服务器和第三方软件,这种方式成本较高,且部署和维护复杂。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种服务器集群的自动检测方法和系统,用于解决现有技术中对Unix/Linux服务器集群无法进行自动巡检,且巡检的工作率低下的问题。为实现上述目的及其他相关目的,本专利技术提供一种服务器集群的自动检测方法,所述服务器集群包括多个集群服务器,且所述集群服务器采用Linux/Unix操作系统,所述服务器集群的自动检测方法包括以下步骤:步骤S10,收集并保存所有运行的所述集群服务器的IP地址;步骤S20,按照步骤SlO中收集的IP地址,运行第一脚本,无账号密码的登陆所有运行的所述集群服务器;其中,所述第一脚本用于实现无密码登陆集群服务器;步骤S30 ;运行第二脚本,检测所有运行的所述集群服务器的资源使用情况及状态信息,并归档保存检测结果;其中,所述第二脚本用于检测运行的所述集群服务器。可选地,所述步骤SlO包括:借助于Nmap网络的嗅探工具包自动捕获所有运行的所述集群服务器的信息;通过Linux中的管道及awk工具对所有运行的所述集群服务器的信息进行筛选,从而获取所有运行的所述集群服务器的IP地址。可选地,所述第一脚本是根据SSH的远程登陆认证方式预先编写完成的。可选地,所述步骤S20中,所述第一脚本是通过SSH-KeyGen在本机上生成SSH认证的密钥,从而实现无密码登陆。可选地,所述第二脚本是使用SHELL预先编与完成的。可选地,所述步骤S30中,检测所述集群服务器的资源使用情况及状态信息包括检测CPU信息、检测内存、检测交换分区、检测NTP服务、检测双机服务、检测文件系统占用率和检测操作系统日志。可选地,所述服务器集群的自动检测方法还包括使用crontab自定义检测时间,根据自定义的检测时间按照步骤S30对所述服务器集群进行定时检测。本专利技术还公开了一种服务器集群的自动检测系统,所述服务器集群包括多个集群服务器,且所述集群服务器采用Linux/Unix操作系统,所述服务器集群的自动检测系统包括收集模块、登录模块、检测模块和存储模块;所述收集模块用于收集所有运行的所述集群服务器的IP地址,并将收集的IP地址保存至所述存储模块;所述登录模块用于根据所有运行的所述集群服务器的IP地址通过第一脚本无账号密码的登陆所有运行的所述集群服务器;所述检测模块用于通过第二脚本检测所有运行的所述集群服务器的资源使用情况及状态信息,并归档保存检测结果至所述存储模块;所述存储模块用于存储所述第一脚本、所述第二脚本、所有运行的所述集群服务器的IP地址和所述检测结果。可选地,所述第一脚本和所述第二脚本是预存在所述存储模块内的,且所述第一脚本是根据SSH的远程登陆认证方式编写的;所述第二脚本是使用SHELL编写的,用于检测运行的所述集群服务器的命令。可选地,所述服务器集群的自动检测系统还包括定时模块,所述定时模块用于自定义检测时间,根据自定义的检测时间对所述服务器集群进行定时检测。如上所述,本专利技术的一种服务器集群的自动检测方法和系统,根据SSH协议编写无密码登陆的第一脚本,使用shell变现用于检测集群服务器的第二脚本;并自动调用和执行第一脚本和第二脚本。通过SSH协议,连接到需要检测的服务器,调用主机第二脚本,查看主机CPU、内存、磁盘、日志信息,并把查询结果记录在日志文件中,完成日志收集工作;且最后将日志统一归档。本专利技术的一种服务器集群的自动检测方法,具有以下有益技术效果:I)本专利技术以自动化检测代替人工操作,减少了系统管理员的工作量,提高运维工程师的工作效率,减少了系统管理员数量,降低了数据中心的运维人力成本;并且,进一步地让系统管理员从单调、重复的工作中解脱出来,把更多的精力投入到分析输出日志和问题处理中;2)本专利技术不需要单独采购服务器进行部署,不需要借助第三方商业软件,选择一台压力较低的现有Unix/Linux服务器部署即可;3)本专利技术的检测方式占用了较少的计算资源,成本较低。【附图说明】图1显示为本专利技术实施例公开的一种服务器集群的自动检测方法的流程示意图。图2显示为本专利技术实施例公开的一种服务器集群的自动检测系统的结构示意图。元件标号说明SlO ?S30 步骤200服务器集群的自动检测系统210收集模块220登录模块230检测模块240存储模块250定时模块【具体实施方式】以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的【具体实施方式】加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。请参阅附图。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。本专利技术提供了一种提高工作效率,降低运维人力成本的服务器集群的自动检测方法和系统,以把手动检查变成自动化检查,让系统管理员从单调、重复的工作中解脱出来,把更多的精力投入到分析检查结果和问题处理中。实施例1本实施例公开了一种服务器集群的自动检测方法,用以自动检测集群服务器的资源使用情况和状态信息。其中,服务器集群就是指将很多集群服务器集中起来一起进行同一种服务,在客户端看来就像是只有一个服务器。集群服务器采用Li本文档来自技高网
...

【技术保护点】
一种服务器集群的自动检测方法,所述服务器集群包括多个集群服务器,且所述集群服务器采用Linux/Unix操作系统,其特征在于,所述服务器集群的自动检测方法包括以下步骤:步骤S10,收集并保存所有运行的所述集群服务器的IP地址;步骤S20,按照步骤S10中收集的IP地址,运行第一脚本,无账号密码的登陆所有运行的所述集群服务器;其中,所述第一脚本用于实现无密码登陆集群服务器;步骤S30;运行第二脚本,检测所有运行的所述集群服务器的资源使用情况及状态信息,并归档保存检测结果;其中,所述第二脚本用于检测运行的所述集群服务器。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘琪
申请(专利权)人:上海斐讯数据通信技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1