【技术实现步骤摘要】
监控服务器集群的方法、系统、计算机设备及存储介质
[0001]本申请涉及服务器集群监控
,特别是涉及一种监控服务器集群的方法、系统、计算机设备及存储介质。
技术介绍
[0002]随着互联网的发展,大数据中心的服务器数量越来越多,服务器集群的任务执行趋于批量化,这就需要对服务器集群的集群化管理。然而,由于服务器集群内的服务器数量众多,在服务器集群执行任务时,若某一台服务器出现异常,该异常服务器难以被人或管理平台精准并及时的记录或发现到。除此之外,传统的解决方案往往是直接使用人力去监视服务器集群,采用这样的方式,效率低且人力消耗大。其次,虽然可以通过外设反馈电路的方式来监测服务器的实时工作参数,例如温度和功耗。然而,采用该方式也很难精确定位和反映异常服务器的具体情况。此外,采用上述方案也无法对大批量的服务器集群进行长时间的实时检测,该方案有比较大的局限性。
技术实现思路
[0003]本申请针对上述不足或缺点,提供了一种监控服务器集群的方法、系统、计算机设备及存储介质。上述方法基于服务器管理平台,在服务器管理 ...
【技术保护点】
【技术特征摘要】
1.一种监控服务器集群的方法,其特征在于,包括:定时根据服务器集群中每个服务器的服务器信息向每个所述服务器的BMC下达带外指令,以获取每个所述服务器的实时工作参数;所述BMC是指基板管理控制器;从每个所述服务器的实时工作参数中筛选出多个目标工作参数;将每个所述服务器的各个目标工作参数与对应的预设阈值进行对比;当任一所述服务器的任一目标工作参数高于对应的预设阈值时,向该服务器的所属人账号推送工作信息。2.根据权利要求1所述的方法,其特征在于,在向每个所述服务器的BMC下达带外指令之前,包括:通过PXE对每个所述服务器安装操作系统,使得每个所述服务器在成功安装操作系统后主动上报服务器信息;所述PXE为预启动执行环境;接收每个所述服务器上报的服务器信息;将每个所述服务器的服务器信息录入数据库根据录入所述数据库后的各个所述服务器信息对每个所述服务器进行连通性确认;在确认每个所述服务器的连通性正常后,获取每个所述服务器的MAC地址;根据所述MAC地址判断每个所述服务器的系统版本是否正确。3.根据权利要求1所述的方法,其特征在于,所述定时根据每个所述服务器的服务器信息向每个所述服务器的BMC下达带外指令,以获取每个所述服务器的实时工作参数;服务器信息包括登录信息,所述方法包括:定时从数据库中提取每个所述服务器的服务器信息,所述服务器信息包括登录信息;根据每个所述服务器的登录信息登录每个所述服务器;通过IPMI协议,向每个已登录的服务器的BMC下达带外指令,以获取每个已登录的服务器的实时工作参数。4.根据权利要求1所述的方法,其特征在于,所述将每个所述服务器的各个目标工作参数与对应的预设阈值进行对比,包括:在对每个所述服务器的各个目标工作参数进行排序后得到待测参数列;所述待测参数列包括多个待测参数;将多个所述待测参数逐一与数据库中各个对应的预设阈值进行对比。5.根据权利要...
【专利技术属性】
技术研发人员:刘帅,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。