【技术实现步骤摘要】
一种基于指标数据的智能故障预警方法和装置
[0001]本专利技术涉及数据管理
,具体涉及一种基于指标数据的智能故障预警方法和装置。
技术介绍
[0002]系统故障预警即通过机器算法快速准确的预测故障的发生,并在故障发生时定位故障原因,降低风险,现有技术中心系统故障预警方法包括:采集系统各项指标数据,包括CPU、内存、磁盘、故障情况等;取其中一部分数据作为样本,采用机器学习算法训练异常检测模型;取剩余的数据套入模型中进行验证并调整;取真实数据填入故障预警模型中,判断是否有异常指标,有则进行告警;上述传统的故障预警方法分析的指标数据较为简单,无需考虑系统架构和产品特性,适用性较广,但存在着以下问题:由于分析的指标数据太过单一,预测精准度较低,存在误报率,影响运维人员的判断;将上述故障预警方法应用到较为复杂的云平台时,海量指标数据的训练分析对计算准确率和计算速率有着较高要求,对云平台负载过大。
技术实现思路
[0003]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于 ...
【技术保护点】
【技术特征摘要】
1.一种基于指标数据的智能故障预警方法,其特征在于,包括:提取云平台历史指标数据,将所述历史指标数据进行预处理后通过训练得到业务故障预测模型;将所述历史指标数据通过K最近邻分类器进行训练得到指标故障预测模型;获取云平台中当前指标数据,将所述当前指标数据输入至所述业务故障预测模型中进行预测,输出故障业务的指标数据;将所述故障业务的指标数据输入至所述指标故障预测模型中进行预测,得到预测结果;根据预测结果确定所述当前指标数据是否发生故障;其中,所述历史指标数据和所述当前指标数据分别包括多维度的业务日志数据。2.根据权利要求1所述的方法,其特征在于,所述将所述历史指标数据进行预处理后通过训练得到业务故障预测模型进一步包括:将所述历史指标数据依据预设规则进行归一化处理,得到历史数据集;对所述历史数据集进行数据采样,对采样数据进行特征提取得到第一特征数据,将所述第一特征数据输入至LightGBM模型得到第二特征数据;将所述第一特征数据和所述第二特征数据通过逻辑回归算法模型进行训练,得到业务故障预测模型。3.根据权利要求1所述的方法,其特征在于,其中,所述历史指标数据包括正常业务的第一历史指标数据和故障业务的第二历史指标数据,所述第一历史指标数据的业务标签为第一标签,所述第二历史指标数据的业务标签为第二标签;所述将所述历史指标数据通过K最近邻分类器进行训练得到指标故障预测模型进一步包括:将所述第一历史指标数据和所述第二历史指标数据通过K最近邻分类器进行训练得到各个历史指标数据在正常类别和故障类别中的分布情况以及属于同一类别的任两个历史指标数据之间的欧氏距离;依据所述分布情况、所述欧氏距离以及各个历史指标数据对应的业务标签调整K最近邻分类器的参数,得到训练后的指标故障预测模型。4.根据权利要求3所述的方法,其特征在于,所述将所述故障业务的指标数据输入至所述指标故障预测模型中进行预测,得到预测结果进一步包括:将所述故障业务的指标数据输入至所述指标故障预测模型中进行预测,计算所述故障业务的指标数据与各个历史指标数据之间的欧氏距离;依据欧氏距离最小的历史指标数据的业务标签,确定预测结果。5.根据权利要求4所述的方法,其特征在于,所述根据预测结果确定所述当前指标数据是否发生故障进一步包括:若所述预测结果中的业务标签为正常业务对应的标签,则确定当前指标数据未发生故障;若所述预测结果中的业务标签为故障业务对应...
【专利技术属性】
技术研发人员:吴杰,陈豪,许乐静,管益文,赵春阳,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。