基于密度聚类算法的服务器故障监测方法及系统技术方案

技术编号:26375623 阅读:41 留言:0更新日期:2020-11-19 23:44
本发明专利技术公开了一种基于密度聚类算法的服务器故障监测方法及系统,属于服务器故障监测技术领域,要解决的技术问题为如何通过基于密度的聚类算法对服务器进行故障监测预警并对宕机故障进行复位。方法包括如下步骤:通过BMC获取服务器的健康信息数据并构建样本;对样本数据进行归一化处理;基于DBSCAN算法构建监测模型,优化监测模型的参数,得到训练后监测模型;通过训练后监测模型对测试样本中样本数据进行分析并输出监测结果;如果监测结果中服务器存在故障,则将监测结果反馈到web页面进行显示,如果服务器宕机,则通过BMC对服务器进行复位操作。该系统包括数据采集模块、数据预处理模块、模型训练模块以及结果输出模块。

【技术实现步骤摘要】
基于密度聚类算法的服务器故障监测方法及系统
本专利技术涉及服务器故障监测
,具体地说是一种基于密度聚类算法的服务器故障监测方法及系统。
技术介绍
服务器是一种运行快、负载高、性能强的计算机,长时间运行是服务器的一个重要性能指标,监测服务器的运行状态是保证服务器长期可靠运行的一个重要方法,一旦服务器发生故障无法正常运行,需要借助服务器远端控制器BMC对服务器进行复位等操,BMC不仅可以对服务器进行控制,还可以获取来自于服务器的电压、温度、风扇转速等健康信息以及进程相关信息,可通过神经网络、聚类等机器学习算法实时分析BMC获取信息预测服务器是否存在故障隐患。目前人工智能算法层出不穷,如基于监督学习的神经网络、基于无监督学习的聚类算法等,其中聚类算法较为轻便快捷,建立聚类中心、通过循环和递减来减小误差达到分类和预测的目的,结合应用场景中的数据特点确定聚类中心对分类和预测结果有至关重要的作用。聚类算法分为划分法、层次法、密度算法、图论聚类法、网格算法、模型算法等,其中基于密度的聚类算法可以克服基于距离的算法只能发现“类圆形”的聚类的缺点。本文档来自技高网...

【技术保护点】
1.基于密度聚类算法的服务器故障监测方法,其特征在于通过密度聚类算法分析服务器的健康信息数据并预测服务器运行状态,对服务器进行故障预警并在服务器宕机时进行复位,所述方法包括如下步骤:/n通过BMC获取服务器的健康信息数据并构建样本,所述样本分为训练样本和测试样本,所述训练样本中的样本数据需要标记当前服务器状态,所述服务器状态包括故障类型以及各类故障类型对应的数值型数据;/n对上述样本数据进行归一化处理;/n基于DBSCAN算法构建监测模型,并以训练样本为输入、优化所述监测模型的参数,得到训练后监测模型;/n将测试样本输入训练后监测模型,通过训练后监测模型对测试样本中样本数据进行分析并输出监测结...

【技术特征摘要】
1.基于密度聚类算法的服务器故障监测方法,其特征在于通过密度聚类算法分析服务器的健康信息数据并预测服务器运行状态,对服务器进行故障预警并在服务器宕机时进行复位,所述方法包括如下步骤:
通过BMC获取服务器的健康信息数据并构建样本,所述样本分为训练样本和测试样本,所述训练样本中的样本数据需要标记当前服务器状态,所述服务器状态包括故障类型以及各类故障类型对应的数值型数据;
对上述样本数据进行归一化处理;
基于DBSCAN算法构建监测模型,并以训练样本为输入、优化所述监测模型的参数,得到训练后监测模型;
将测试样本输入训练后监测模型,通过训练后监测模型对测试样本中样本数据进行分析并输出监测结果,所述监测结果包括是服务器是否存在故障以及故障类型;
如果监测结果中服务器存在故障,则将监测结果反馈到web页面进行显示,并进一步监控服务器是否宕机,如果服务器宕机,则通过BMC对服务器进行复位操作。


2.根据权利要求1所述的基于密度聚类算法的服务器故障监测方法,其特征在于所述BMC通过I2C获取服务器的健康信息数据。


3.根据权利要求1或2所述的基于密度聚类算法的服务器故障监测方法,其特征在于所述健康信息数据为服务器主板中相关部件的健康信息数据,包括但不限于电压、电流、温度值、PCU内存使用率。


4.根据权利要求1所述的基于密度聚类算法的服务器故障监测方法,其特征在于以训练样本为输入、优化所述监测模型的参数,包括如下步骤:
L100、设定领域参数,所述领域参数包括邻域半径eps和簇样本数min_sample;
L200、从训练样本中选取任意一个样本点,判断所述样本点是否分配有簇标签,如果所述样本点未被分配簇标签,执行步骤L300;
L300、计算所述样本点邻域半径eps内所有其它样本点,基于上述所有其它样本点组成邻域样本子集,如果上述邻域样本子集内样本点的个数小于簇样本数min_sample,所述样本点标记为噪声点,如果上述邻域样本子集内样本点的个数大于簇样本数min_sample,所述样本点标记为核心样本点,并为所述核心样本点分配一个簇标签;
L400、遍历所述邻域样本子集,判断所述邻域样本子集内其它样本点是否未被分配簇标签,对于未被分配簇标签的其它样本点,为其分配所述核心样本点对应的簇标签,并执行步骤L500;
L00、对于未被分配簇标签的其它样本点,判断其是否为核心样本点,如果为核心样本点,对于每个为核心样本点的其它样本点依次执行步骤L300-L400;
L600、从训练样本中选取另一个未被访问过的样本点,依次执行上述步骤L200-L500,直至训练样本中所有样本点被访问过;
L600、根据样本分类的准确率,调整领域参数,直至样本分类准确率达到预期要求,最终得到训练后监测模型。


5.根据权利要求4所述的基于密度聚类算法的服务器故障监测方法,其特征在于通过训练后监测模型对测试样本进行分析并输出监测结果,包括如下步骤:
将测试样本输入训练后监测模型;
通过训练监测模型计算邻域半径eps内各类故障类型的样本数量,选取样本数量最多的故障类型为测试样本数据的类型,并输出为预测的故障类型。


6.基于密度聚类算法的服务器...

【专利技术属性】
技术研发人员:杨柳马晓光赖一鹏张永健
申请(专利权)人:山东超越数控电子股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1