一种基于机器学习的数据中心基础设施自动监控方法及系统技术方案

技术编号：42693141 阅读：23 留言：0更新日期：2024-09-10 12:43

本发明专利技术公开一种基于机器学习的数据中心基础设施自动监控方法及系统，涉及机器学习技术领域；步骤1：采集数据中心的数据，包括采集服务器硬件状态信息，根据服务器硬件状态信息形成监控指标，步骤2：利用机器学习方法针对服务器硬件状态信息依据监控指标进行智能分析，并对历史数据进行分析，识别异常行为和潜在的性能问题，同时分析应用程序中的性能瓶颈，识别影响系统性能的关键因素和瓶颈点，根据智能分析的结果，提供优化建议和推荐措施，改进系统性能及用户体验，步骤3：展示服务器硬件状态信息、监控指标、分析数据、优化建议和推荐措施，展示集成告警信息、性能趋势分析、报表统计分析、资源配置信息及业务视图。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术公开一种方法及系统，涉及机器学习,具体地说是一种基于机器学习的数据中心基础设施自动监控方法及系统。

技术介绍

1、随着信息技术的迅猛发展，数据中心作为支撑各类应用的核心基础设施，其设备的稳定性和安全性至关重要。现有的数据中心设备监控方法往往依赖于人工巡检和固定阈值告警，这种方式不仅效率低下，而且容易漏报或误报。

技术实现思路

1、本专利技术针对现有技术的问题，提供一种基于机器学习的数据中心基础设施自动监控方法及系统，方便的扩展模板，并根据模板生成代码。

2、本专利技术提出的具体方案是：

3、本专利技术提供一种基于机器学习的数据中心基础设施自动监控方法，包括：

4、步骤1：采集数据中心的数据，包括采集服务器硬件状态信息，根据服务器硬件状态信息形成监控指标，监控指标包括ping、服务成功率、平均响应时间、系统状态、电源状态、server状态、系统整体描述、日志文件监控、新监控行数、匹配行数、温度、温度监控、电源利用、电压、风扇状态、风扇利用率，

5、步骤2：利用机器学习方法针对服务器硬件状态信息依据监控指标进行智能分析，并对历史数据进行分析，识别异常行为和潜在的性能问题，同时分析应用程序中的性能瓶颈，识别影响系统性能的关键因素和瓶颈点，根据智能分析的结果，提供优化建议和推荐措施，改进系统性能及用户体验，

6、步骤3：展示服务器硬件状态信息、监控指标、分析数据、优化建议和推荐措施，展示集成告警信息、性能趋势分析、报表统

7、进一步，所述的一种基于机器学习的数据中心基础设施自动监控方法中步骤1中根据客户端agent、网管协议、系统接口采集服务器硬件状态信息，通过服务器管理接口对监控指标进行监控。

8、进一步，所述的一种基于机器学习的数据中心基础设施自动监控方法中步骤2中利用dbscan算法识别异常行为和潜在的性能问题，其中dbscan算法基于密度的聚类，寻找数据中的高密度区域，将高密度区域的数据连成一个簇，以一个样本点为圆心，以eps为半径画一个圆，如果圆中样本点的数目大于或者等于圆中样本点的最小数目min_samples,则表示样本点周围的点比较密集，所述样本点是一个核心点，核心点与周围的点形成簇，如果一个样本点不是核心点，远离其他核心点，不能融入其他核心点所在的簇，则将这样的样本点作为离群点，根据离群点识别异常行为，发现潜在的性能问题。

9、进一步，所述的一种基于机器学习的数据中心基础设施自动监控方法中步骤2中利用k-means算法和关联分析识别异常行为和潜在的性能问题，其中通过k-means算法通过迭代寻找k个簇的分组，将远离簇中心的点作为离群点，根据离群点识别出正常模式偏离较大的异常组，从而识别异常行为，发现潜在的性能问题。

10、本专利技术还提供一种基于机器学习的数据中心基础设施自动监控装置，包括采集模块、分析模块和展示模块，

11、采集模块采集数据中心的数据，包括采集服务器硬件状态信息，根据服务器硬件状态信息形成监控指标，监控指标包括ping、服务成功率、平均响应时间、系统状态、电源状态、server状态、系统整体描述、日志文件监控、新监控行数、匹配行数、温度、温度监控、电源利用、电压、风扇状态、风扇利用率，

12、分析模块利用机器学习方法针对服务器硬件状态信息依据监控指标进行智能分析，并对历史数据进行分析，识别异常行为和潜在的性能问题，同时分析应用程序中的性能瓶颈，识别影响系统性能的关键因素和瓶颈点，根据智能分析的结果，提供优化建议和推荐措施，改进系统性能及用户体验，

13、展示模块展示服务器硬件状态信息、监控指标、分析数据、优化建议和推荐措施，展示集成告警信息、性能趋势分析、报表统计分析、资源配置信息及业务视图。

14、进一步，所述的一种基于机器学习的数据中心基础设施自动监控装置中采集模块根据客户端agent、网管协议、系统接口采集服务器硬件状态信息，通过服务器管理接口对监控指标进行监控。

15、进一步，所述的一种基于机器学习的数据中心基础设施自动监控装置中分析模块利用dbscan算法识别异常行为和潜在的性能问题，其中dbscan算法基于密度的聚类，寻找数据中的高密度区域，将高密度区域的数据连成一个簇，以一个样本点为圆心，以eps为半径画一个圆，如果圆中样本点的数目大于或者等于圆中样本点的最小数目min_samples,则表示样本点周围的点比较密集，所述样本点是一个核心点，核心点与周围的点形成簇，如果一个样本点不是核心点，远离其他核心点，不能融入其他核心点所在的簇，则将这样的样本点作为离群点，根据离群点识别异常行为，发现潜在的性能问题。

16、进一步，所述的一种基于机器学习的数据中心基础设施自动监控装置中分析模块利用k-means算法和关联分析识别异常行为和潜在的性能问题，其中通过k-means算法通过迭代寻找k个簇的分组，将远离簇中心的点作为离群点，根据离群点识别出正常模式偏离较大的异常组，从而识别异常行为，发现潜在的性能问题。

17、本专利技术的有益之处是：

18、提高安全性，并减少人力投入：机器学习算法能够更快速地识别出异常行为，并且能够全天候持续工作，大大减少了人力投入和监控员的疲劳程度。同时，机器学习算法能够处理大量的数据，并提供实时报警和追踪功能，使监控系统更加智能化和高效化。

19、提高智能化程度和应对复杂环境：机器学习算法能够通过对大量监控数据的学习和分析，不断优化模型，并适应复杂多变的监控环境，从而提高监控系统的识别准确率。

20、提升运维效率：基于机器学习的异常检测和智能分析技术能够基于资源、告警、性能、拨测、日志等多模态数据，通过人工智能技术，对业务异常事件进行溯源、降噪，第一时间对运维人员展示出异常的根本原因及定位分析，提升运维人员故障处理效率，降低运维成本。

本文档来自技高网...

【技术保护点】

1.一种基于机器学习的数据中心基础设施自动监控方法，其特征是包括：

2.根据权利要求1所述的一种基于机器学习的数据中心基础设施自动监控方法，其特征是步骤1中根据客户端Agent、网管协议、系统接口采集服务器硬件状态信息，通过服务器管理接口对监控指标进行监控。

3.根据权利要求1所述的一种基于机器学习的数据中心基础设施自动监控方法，其特征是步骤2中利用DBSCAN算法识别异常行为和潜在的性能问题，其中DBSCAN算法基于密度的聚类，寻找数据中的高密度区域，将高密度区域的数据连成一个簇，以一个样本点为圆心，以Eps为半径画一个圆，如果圆中样本点的数目大于或者等于圆中样本点的最小数目min_samples,则表示样本点周围的点比较密集，所述样本点是一个核心点，核心点与周围的点形成簇，如果一个样本点不是核心点，远离其他核心点，不能融入其他核心点所在的簇，则将这样的样本点作为离群点，根据离群点识别异常行为，发现潜在的性能问题。

4.根据权利要求1所述的一种基于机器学习的数据中心基础设施自动监控方法，其特征是步骤2中利用K-Means算法和关联分析识别异常

5.一种基于机器学习的数据中心基础设施自动监控装置，其特征是包括采集模块、分析模块和展示模块，

6.根据权利要求5所述的一种基于机器学习的数据中心基础设施自动监控装置，其特征是采集模块根据客户端Agent、网管协议、系统接口采集服务器硬件状态信息，通过服务器管理接口对监控指标进行监控。

7.根据权利要求5所述的一种基于机器学习的数据中心基础设施自动监控装置，其特征是分析模块利用DBSCAN算法识别异常行为和潜在的性能问题，其中DBSCAN算法基于密度的聚类，寻找数据中的高密度区域，将高密度区域的数据连成一个簇，以一个样本点为圆心，以Eps为半径画一个圆，如果圆中样本点的数目大于或者等于圆中样本点的最小数目min_samples,则表示样本点周围的点比较密集，所述样本点是一个核心点，核心点与周围的点形成簇，如果一个样本点不是核心点，远离其他核心点，不能融入其他核心点所在的簇，则将这样的样本点作为离群点，根据离群点识别异常行为，发现潜在的性能问题。

8.根据权利要求5所述的一种基于机器学习的数据中心基础设施自动监控装置，其特征是分析模块利用K-Means算法和关联分析识别异常行为和潜在的性能问题，其中通过K-Means算法通过迭代寻找K个簇的分组，将远离簇中心的点作为离群点，根据离群点识别出正常模式偏离较大的异常组，从而识别异常行为，发现潜在的性能问题。

...

【技术特征摘要】

1.一种基于机器学习的数据中心基础设施自动监控方法，其特征是包括：

2.根据权利要求1所述的一种基于机器学习的数据中心基础设施自动监控方法，其特征是步骤1中根据客户端agent、网管协议、系统接口采集服务器硬件状态信息，通过服务器管理接口对监控指标进行监控。

3.根据权利要求1所述的一种基于机器学习的数据中心基础设施自动监控方法，其特征是步骤2中利用dbscan算法识别异常行为和潜在的性能问题，其中dbscan算法基于密度的聚类，寻找数据中的高密度区域，将高密度区域的数据连成一个簇，以一个样本点为圆心，以eps为半径画一个圆，如果圆中样本点的数目大于或者等于圆中样本点的最小数目min_samples,则表示样本点周围的点比较密集，所述样本点是一个核心点，核心点与周围的点形成簇，如果一个样本点不是核心点，远离其他核心点，不能融入其他核心点所在的簇，则将这样的样本点作为离群点，根据离群点识别异常行为，发现潜在的性能问题。

4.根据权利要求1所述的一种基于机器学习的数据中心基础设施自动监控方法，其特征是步骤2中利用k-means算法和关联分析识别异常行为和潜在的性能问题，其中通过k-means算法通过迭代寻找k个簇的分组，将远离簇中心的点作为离群点，根据离群点识别出正常模式偏离较大的异常组，从而识别异常行为，发现潜在的性能问题。

5.一种...

【专利技术属性】
技术研发人员：郑彬，李萍，成玉，
申请(专利权)人：浪潮通信信息系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人