一种基于机器学习的数据库健康度打分方法和打分系统技术方案

技术编号:20221651 阅读:54 留言:0更新日期:2019-01-28 20:11
本发明专利技术公开了一种基于机器学习的数据库健康度打分方法和打分系统,其中打分方法包括如下步骤:1、采集数据库监控指标,通过专家模型得到健康度打分;采集到的原始数据和打分作为样本集;2、对样本集中的数据进行去噪、归一化等预处理,并将其分为训练数据、验证数据和测试数据;3、采用回归预测算法建立回归预测模型,利用训练数据训练模型参数,利用验证数据调整模型参数,利用测试数据测试模型的效果;4、读取数据库一段时间内的监控指标并进行预处理,作为回归预测模型的输入,模型的输出即为当前或未来一段时间数据库健康度打分结果。该方法可以对大量的数据库监控指标进行分析,通过建立回归预测模型,得到当前或未来时刻的数据库健康度打分结果。

【技术实现步骤摘要】
一种基于机器学习的数据库健康度打分方法和打分系统
本专利技术属于数据库的运维领域,具体涉及一种采用人工智能方法对数据库健康度进行打分和预测的方法和系统。
技术介绍
目前大型数据库系统的运维主要靠高端DBA(DatabaseAdministrator,数据库管理员)来维护,DBA通过查看数据库的各项指标,可以对数据库的整体运行情况进行健康度打分,这种方法被称为“专家模型”。专家模型是依赖具有多年数据库运维经验的专家,人工选取对数据库健康程度影响最大的指标,采用人工设定的阈值,对各项指标进行打分,最终将各项得分总和起来,得到最终的健康得分。但是只依赖专家DBA的经验,难以应对数据库运维的各项困境。数据库的监控指标数量十分庞大,靠人工分析成本太高;不同的指标之间的关联关系很复杂,人工分析很难找到规律;依赖人工容易发现问题,但是很难定位问题;不同数据库软件的监控指标各不相同;系统复杂程度不断增加,关联关系更加复杂。总结起来,专家模型的主要缺点有:1、指标是由专家依靠经验选取的,还有大量的指标未被选取,这些未被选取的指标是否对数据库健康重要,专家也无法给出答案,未被选取的指标分析工作量十分巨大本文档来自技高网...

【技术保护点】
1.一种基于机器学习的数据库健康度打分方法,其特征在于,包括如下步骤:(1)采集数据库监控指标,并通过专家模型得到健康度打分;采集到的原始数据和打分作为样本集;(2)对样本集中的数据进行去噪、归一化等预处理,并将样本集中的数据分为训练数据、验证数据和测试数据;(3)采用回归预测算法建立回归预测模型,利用训练数据训练模型参数,利用验证数据调整模型参数,利用测试数据测试模型的效果;(4)读取数据库一段时间内的监控指标,采用与步骤(2)相同的方法进行预处理,预处理后的数据作为回归预测模型的输入,模型的输出即为当前或未来一段时间数据库健康度打分结果。

【技术特征摘要】
1.一种基于机器学习的数据库健康度打分方法,其特征在于,包括如下步骤:(1)采集数据库监控指标,并通过专家模型得到健康度打分;采集到的原始数据和打分作为样本集;(2)对样本集中的数据进行去噪、归一化等预处理,并将样本集中的数据分为训练数据、验证数据和测试数据;(3)采用回归预测算法建立回归预测模型,利用训练数据训练模型参数,利用验证数据调整模型参数,利用测试数据测试模型的效果;(4)读取数据库一段时间内的监控指标,采用与步骤(2)相同的方法进行预处理,预处理后的数据作为回归预测模型的输入,模型的输出即为当前或未来一段时间数据库健康度打分结果。2.根据权利要求1所述的基于机器学习的数据库健康度打分方法,其特征在于,步骤(2)中对样本集中的数据进行去噪后还包括特征选取,之后再进行归一化处理;所述特征选取为计算监控指标的重要度,删除样本集中重要度最小的前N个监控指标;具体包括如下步骤:(2.1)建立GBM回归模型,设置提升树个数m和学习率ρ,损失函数为均方误差;(2.2)将去噪后的样本集分为GBM训练集和GBM测试集,用GBM训练集训练GBM回归模型;训练过程中如果n轮训练的损失函数不再减少,则训练停止;否则继续训练直到损失函数不再减少;训练停止后得到样本集中每个监控指标的重要度值;(2.3)重复步骤(2.1)和(2.2)W次,每个监控指标得到W个重要度值,取其平均值作为所述监控指标的重要度值;(2.4)对每个监控指标的重要度值进行排序,将重要度值最小的前N个监控指标删除。3.根据权利要求1所述的基于机器学习的数据库健康度打分方法,其特征在于,步骤(3)中采用LSTMRNN算法构建LSTMRNN回归预测模型,所述LSTMRNN回归预测模型包括1个输入层,3个LSTM层,1个全连接层和1个输出层,所述3个LSTM层均包括32个LSTM单元;所述全连接层包括32个单元,采用relu激活函数;所述输出层包括4个单元,采...

【专利技术属性】
技术研发人员:王会羽钱琳俞俊朱广新李凡
申请(专利权)人:国网江苏省电力有限公司信息通信分公司南瑞集团有限公司国电南瑞科技股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1