一种应用进程故障预测方法、装置、设备及可读存储介质制造方法及图纸

技术编号:31161967 阅读:18 留言:0更新日期:2021-12-04 10:31
本发明专利技术涉及模型架构领域,具体而言,涉及一种应用进程故障预测方法、装置、设备及可读存储介质,所述方法包括将监控数据和应用故障特征信息输入到第一处理模型进行处理,得到第一特征数据;将所述第一特征数据输入GRU循环神经网络模型进行模型训练,得到第一预测模型;将所述第一特征数据输入到单层感知器进行训练,得到单进程的单层感知器模型;将所述监控数据输入所述第一预测模型进行预测,得到预测时间段的监控数据;将所述预测时间段的监控数据输入所述单层感知器模型进行处理,得到所述预测时间段的监控数据中每个进程发生故障的概率。本发明专利技术通过循环神经网络和单层感知器进行建模对应用监控数据进行分析处理并预测将要出现的应用故障。将要出现的应用故障。将要出现的应用故障。

【技术实现步骤摘要】
一种应用进程故障预测方法、装置、设备及可读存储介质


[0001]本专利技术涉及模型架构领域,具体而言,涉及一种应用进程故障预测方法、装置、设备及可读存储介质。

技术介绍

[0002]数据中心运维管理工作是确保主数据中心各项业务应用平稳可靠、安全高效的重要支撑,在云架构体系下,如果仍旧依靠传统运维方式将使运维成本大幅增加但运维效果却难以达到预期要求,因此推动数据中心智能化运维已成为必然所趋,传统应用故障监控方式只能在故障发生后,由运维人员根据故障现象逐层溯源排查,难以短时间内精准定位故障,容易出现故障修复时间较长、故障影响范围和程度不能及时有效控制等问题。

技术实现思路

[0003]本专利技术的目的在于提供一种应用进程故障预测方法、装置、设备及可读存储介质,以改善上述问题。为了实现上述目的,本专利技术采取的技术方案如下:一方面,本申请提供了一种应用进程故障预测方法,所述方法包括:获取云中心服务器的监控数据、云中心应用进程的监控数据和云中心应用故障特征信息;将所述云中心服务器的监控数据、所述云中心应用进程的监控数据和所述云中心应用故障特征信息输入到第一处理模型进行处理,得到第一特征数据,所述第一处理模型为特征工程处理模型,所述第一特征数据为每个云中心应用进程的故障特征数据;将所述第一特征数据输入GRU循环神经网络模型进行模型训练,得到第一预测模型;将所述第一特征数据输入到单层感知器进行训练,得到单进程的单层感知器模型;将所述云中心服务器的监控数据和云中心应用进程的监控数据输入所述第一预测模型进行预测,得到预测时间段的监控数据;将所述预测时间段的监控数据输入所述单层感知器模型进行处理,得到所述预测时间段的监控数据中每个进程发生故障的概率。
[0004]可选地,所述将所述云中心服务器的监控数据、所述云中心应用进程的监控数据和所述云中心应用故障特征信息输入到第一处理模型进行处理,得到第一特征数据,包括:找出所述云中心服务器的监控数据和所述云中心应用进程的监控数据中存在缺失数据或错误数据,调用所述缺失数据相邻数据的均值或错误数据相邻数据的均值进行补充或替换;将所述云中心服务器的监控数据和所述云中心应用进程的监控数据中数值区间较大的数据进行归一化处理,得到预处理数据;按照所述云中心应用故障特征提取所述预处理数据内的故障特征数据,得到第一特征数据。
[0005]可选地,所述将所述云中心服务器的监控数据、所述云中心应用进程的监控数据和所述云中心应用故障特征信息输入到第一处理模型进行处理,得到第一特征数据,还包括:
根据Borderline SMOTE算法将所述第一特征数据中出现故障次数较少的云中心应用进程的监控数据进行处理,得到模拟故障数据;将所述模拟故障数据和第一特征数据输入GRU循环神经网络模型进行训练,得到第二预测模型。
[0006]可选地,所述将所述第一特征数据输入GRU循环神经网络模型进行模型训练,得到第一预测模型,包括:将所述第一特征数据进行分割,分为第一特征训练数据和第一特征测试数据;将所述第一特征训练数据输入到GRU循环神经网络模型内进行训练,确定所述GRU循环神经网络模型的激活函数和优化算法,将所述第一特征测试数据输入确定了激活函数和优化算法的GRU循环神经网络模型进行测试,根据所述测试结果调整所述确定了激活函数和优化算法的GRU循环神经网络模型,得到第一预测模型。
[0007]第二方面,本申请实施例提供了一种应用进程故障预测装置,所述装置包括:第一获取单元,用于获取云中心服务器的监控数据、云中心应用进程的监控数据和云中心应用故障特征信息;第一处理单元,用于将所述云中心服务器的监控数据、所述云中心应用进程的监控数据和所述云中心应用故障特征信息输入到第一处理模型进行处理,得到第一特征数据,所述第一处理模型为特征工程处理模型,所述第一特征数据为每个云中心应用进程的故障特征数据;第二处理单元,用于将所述第一特征数据输入GRU循环神经网络模型进行模型训练,得到第一预测模型;第三处理单元,用于将所述第一特征数据输入到单层感知器进行训练,得到单进程的单层感知器模型;第四处理单元,用于将所述云中心服务器的监控数据和云中心应用进程的监控数据输入所述第一预测模型进行预测,得到预测时间段的监控数据;第五处理单元,用于将所述预测时间段的监控数据输入所述单层感知器模型进行处理,得到所述预测时间段的监控数据中每个进程发生故障的概率。
[0008]可选地,所述装置包括:第一处理子单元,用于找出所述云中心服务器的监控数据和所述云中心应用进程的监控数据中存在缺失数据或错误数据,调用所述缺失数据相邻数据的均值或错误数据相邻数据的均值进行补充或替换;第二处理子单元,用于将所述云中心服务器的监控数据和所述云中心应用进程的监控数据中数值区间较大的数据进行归一化处理,得到预处理数据;第三处理子单元,用于按照所述云中心应用故障特征提取所述预处理数据内的故障特征数据,得到第一特征数据。
[0009]可选地,所述装置还包括:第六处理单元,用于根据Borderline SMOTE算法将所述第一特征数据中出现故障次数较少的云中心应用进程的监控数据进行处理,得到模拟故障数据;第七处理单元,用于将所述模拟故障数据和第一特征数据输入GRU循环神经网络模型进行训练,得到第二预测模型。
[0010]可选地,所述装置包括:第四处理子单元,用于将所述第一特征数据进行分割,分为第一特征训练数据和第一特征测试数据;第五处理子单元,用于将所述第一特征训练数据输入到GRU循环神经网络模型内进行训练,确定所述GRU循环神经网络模型的激活函数和优化算法,将所述第一特征测试数据输入确定了激活函数和优化算法的GRU循环神经网络模型进行测试,根据所述测试结果调整所述确定了激活函数和优化算法的GRU循环神经网络模型,得到第一预测模型。
[0011]第三方面,本申请实施例提供了一种应用进程故障预测设备,所述设备包括存储器和处理器。存储器用于存储计算机程序;处理器用于执行所述计算机程序时实现上述应用进程故障预测方法的步骤。
[0012]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述应用进程故障预测方法的步骤。
[0013]本专利技术的有益效果为:1、本专利技术通过循环神经网络和单层感知器进行建模对云数据中心的应用监控数据进行分析处理并预测将要出现的应用故障。
[0014]2、本专利技术利用Borderline SMOTE算法,模拟生成含多个故障点的特征数据,解决因训练数据故障点偏少影响预测精确率的问题。
[0015]3、本专利技术利用GRU循环神经网络模型,获得更高的精确率的预测数据,并使用单层感知器进行加权处理,提高预测故障的准确率。
[0016]本专利技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术实施例了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用进程故障预测方法,其特征在于,包括:获取云中心服务器的监控数据、云中心应用进程的监控数据和云中心应用故障特征信息;将所述云中心服务器的监控数据、所述云中心应用进程的监控数据和所述云中心应用故障特征信息输入到第一处理模型进行处理,得到第一特征数据,所述第一处理模型为特征工程处理模型,所述第一特征数据为每个云中心应用进程的故障特征数据;将所述第一特征数据输入GRU循环神经网络模型进行模型训练,得到第一预测模型;将所述第一特征数据输入到单层感知器进行训练,得到单进程的单层感知器模型;将所述云中心服务器的监控数据和云中心应用进程的监控数据输入所述第一预测模型进行预测,得到预测时间段的监控数据;将所述预测时间段的监控数据输入所述单层感知器模型进行处理,得到所述预测时间段的监控数据中每个进程发生故障的概率。2.据权利要求1所述的应用进程故障预测方法,其特征在于,所述将所述云中心服务器的监控数据、所述云中心应用进程的监控数据和所述云中心应用故障特征信息输入到第一处理模型进行处理,得到第一特征数据,包括:找出所述云中心服务器的监控数据和所述云中心应用进程的监控数据中存在缺失数据或错误数据,调用所述缺失数据相邻数据的均值或错误数据相邻数据的均值进行补充或替换;将所述云中心服务器的监控数据和所述云中心应用进程的监控数据中数值区间较大的数据进行归一化处理,得到预处理数据;按照所述云中心应用故障特征提取所述预处理数据内的故障特征数据,得到第一特征数据。3.据权利要求1所述的应用进程故障预测方法,其特征在于,所述将所述云中心服务器的监控数据、所述云中心应用进程的监控数据和所述云中心应用故障特征信息输入到第一处理模型进行处理,得到第一特征数据,还包括:根据Borderline SMOTE算法将所述第一特征数据中出现故障次数较少的云中心应用进程的监控数据进行处理,得到模拟故障数据;将所述模拟故障数据和第一特征数据输入GRU循环神经网络模型进行训练,得到第二预测模型。4.据权利要求1所述的应用进程故障预测方法,其特征在于,所述将所述第一特征数据输入GRU循环神经网络模型进行模型训练,得到第一预测模型,包括:将所述第一特征数据进行分割,分为第一特征训练数据和第一特征测试数据;将所述第一特征训练数据输入到GRU循环神经网络模型内进行训练,确定所述GRU循环神经网络模型的激活函数和优化算法,将所述第一特征测试数据输入确定了激活函数和优化算法的GRU循环神经网络模型进行测试,根据所述测试结果调整所述确定了激活函数和优化算法的GRU循环神经网络模型,得到第一预测模型。5.一种应用进程故障预测装置,其特征在于,包括:第一获取单元,用于获取云中心服务器的监控数据、云中心应用进程的监控数据和云中心应用故障...

【专利技术属性】
技术研发人员:胡小宁边静郭刚王敏红饶伟邹长云刘彦宁赵龙杜雅红李井鑫张毅徐克佳
申请(专利权)人:中铁信弘远北京软件科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1