数据异常检测方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号:21201090 阅读:27 留言:0更新日期:2019-05-25 01:35
本公开涉及一种数据异常检测方法、装置、可读存储介质及电子设备。方法包括:获取第一时刻的指标数据;若第一时刻的指标数据正常,则根据第一时刻的指标预测值、第一时刻的指标数据和包括第一时刻的指标数据的第一时间序列,更新第一RNN‑LSTM预测模型的隐藏层状态;根据更新后的隐藏层状态,确定第三时刻的指标预测值;当获取到第三时刻的指标数据时,根据第三时刻的指标数据与第三时刻的指标预测值,确定第三时刻的指标数据是否异常。由此,可减小因上一时刻的实际输出或上一时刻的指标预测值出现较大偏差对第一RNN‑LSTM预测模型的预测输出造成的影响,从而提高第一RNN‑LSTM预测模型的预测精度、后续数据异常检测的准确率,并保证数据异常检测的可靠性和稳定性。

Data anomaly detection methods, devices, readable storage media and electronic devices

The present disclosure relates to a data anomaly detection method, a device, a readable storage medium and an electronic device. The methods include: obtaining the index data of the first time; if the index data of the first time is normal, updating the hidden layer state of the first RNN LSTM prediction model according to the index prediction value of the first time, the index data of the first time and the first time series including the index data of the first time; and determining the index prediction value of the third time according to the updated hidden layer state; When the index data of the third time is acquired, according to the index data of the third time and the index predicted value of the third time, it is determined whether the index data of the third time is abnormal. As a result, the influence of large deviation of the actual output of the previous moment or the predicted value of the previous moment on the predicted output of the first RNN LSTM prediction model can be reduced, and the prediction accuracy of the first RNN LSTM prediction model and the accuracy of subsequent data anomaly detection can be improved, and the reliability and stability of data anomaly detection can be guaranteed.

【技术实现步骤摘要】
数据异常检测方法、装置、可读存储介质及电子设备
本公开涉及异常检测领域,具体地,涉及一种数据异常检测方法、装置、可读存储介质及电子设备。
技术介绍
数据异常检测技术在各行各业中都发挥着极其重要的作用,例如,发现病人心跳、血压、呼吸等指标的微小变化,定位关键系统管理员的可疑操作行为,探查股票市场的异常股价变化,检测应用系统的CPU、内存、HTTP响应时间等关键指标的不稳定情况,监控设备异常等等。这些功能的实现均离不开准确的数据异常检测方法。因此,找到一种较优的数据异常检测方法对于提升数据异常检测的准确率具有重要的意义。
技术实现思路
为了克服相关技术中存在的问题,本公开提供一种数据异常检测方法、装置、可读存储介质及电子设备。为了实现上述目的,根据本公开实施例的第一方面,提供一种数据异常检测方法,包括:获取第一时刻的指标数据;在确定所述第一时刻的指标数据正常时,根据在第二时刻获得的所述第一时刻的指标预测值、所述第一时刻的所述指标数据和包括所述第一时刻的指标数据在内的第一时间序列,更新第一RNN-LSTM预测模型的隐藏层状态,其中,所述第二时刻为所述第一时刻的上一时刻,所述第一时间序列的最后一个数据为所述第一时刻的指标数据;根据更新后的第一RNN-LSTM预测模型的隐藏层状态,确定第三时刻的指标预测值,其中,所述第三时刻为所述第一时刻的下一时刻;当获取到所述第三时刻的指标数据时,根据所述第三时刻的所述指标数据与所述第三时刻的指标预测值,确定所述第三时刻的所述指标数据是否异常。可选地,所述根据在第二时刻获得的所述第一时刻的指标预测值、所述第一时刻的所述指标数据和包括所述第一时刻的指标数据在内的第一时间序列,更新第一RNN-LSTM预测模型的隐藏层状态,包括:根据在第二时刻获得的所述第一时刻的指标预测值、所述第一时刻的所述指标数据和包括所述第一时刻的指标数据在内的第一时间序列,通过以下公式,更新第一RNN-LSTM预测模型的隐藏层状态:h(t)=φ(U·x(t)+W·[ky(t-1)+(1-k)o(t-1)]+b)其中,h(t)为更新后的第一RNN-LSTM预测模型的隐藏层状态;t为所述第一时刻;φ()为激活函数;x(t)为所述第一时间序列;y(t-1)为所述第一时刻的所述指标数据;o(t-1)为所述第一时刻的指标预测值;U、W为所述第一RNN-LSTM预测模型的参数矩阵;b为所述第一RNN-LSTM预测模型的隐藏层状态偏置;k为所述第一时刻的所述指标数据y(t-1)的权重;(1-k)为所述第一时刻的指标预测值o(t-1)的权重。可选地,通过包括以下步骤的模型构建方法构建所述第一RNN-LSTM预测模型:获取第一预设历史时段内的多个第一历史指标数据,得到第二时间序列,其中,所述第二时间序列与所述第一时间序列对应于同一指标;将所述第二时间序列作为训练样本输入到初始的RNN-LSTM模型中进行训练,得到第二RNN-LSTM预测模型;将所述第二RNN-LSTM预测模型确定为所述第一RNN-LSTM预测模型,或者对所述第二RNN-LSTM预测模型进行更新,获得所述第一RNN-LSTM预测模型。可选地,所述对所述第二RNN-LSTM预测模型进行更新,获得所述第一RNN-LSTM预测模型,包括:获取第二预设历史时段内的多个第二历史指标数据,得到第三时间序列,其中,所述第三时间序列与所述第二时间序列对应于同一指标,所述第二预设历史时段与所述第一预设历史时段不同;将所述第三时间序列中的第一个指标数据确定为测试指标数据;获取第五时刻的指标数据,其中,所述第五时刻为第四时刻的上一时刻,所述第四时刻为所述测试指标数据对应的时刻;在确定所述第五时刻的指标数据正常时,根据在第六时刻获得的所述第五时刻的指标预测值、所述第五时刻的所述指标数据和包括所述第五时刻的指标数据在内的第四时间序列,通过以下公式,更新所述第二RNN-LSTM预测模型的隐藏层状态,其中,所述第六时刻为所述第五时刻的上一时刻,所述第四时间序列的最后一个数据为所述第五时刻的指标数据:h'(T)=φ'(U'·x'(T)+W'·[k'y(T-1)+(1-k')o'(T-1)]+b')其中,h'(T)为更新后的第二RNN-LSTM预测模型的隐藏层状态;T为所述第五时刻;φ'()为激活函数;x'(T)为所述第四时间序列;y'(T-1)为所述第五时刻的所述指标数据;o'(T-1)为所述第五时刻的指标预测值;U'、W'为所述第二RNN-LSTM预测模型的参数矩阵;b'为所述第二RNN-LSTM预测模型的隐藏层状态偏置;k'为所述第五时刻的所述指标数据y'(T-1)的权重;(1-k')为所述第五时刻的指标预测值o'(T-1)的权重;根据更新后的第二RNN-LSTM预测模型的隐藏层状态,确定所述第四时刻的指标预测值;根据所述测试指标数据与所述第四时刻的指标预测值,确定所述测试指标数据是否异常;若确定所述测试指标数据异常,则根据所述测试指标数据和所述第三时间序列中的第二个指标数据,更新所述k';从所述第三时间序列中删除所述测试指标数据,返回所述将所述第三时间序列中的第一个指标数据确定为测试指标数据的步骤,直到所述第三时间序列的长度等于零时为止,并将当前获得的所述第二RNN-LSTM预测模型确定为所述第一RNN-LSTM预测模型。可选地,所述根据所述测试指标数据和所述第三时间序列中的第二个指标数据,更新所述k',包括:若所述测试指标数据和所述第三时间序列中的第二个指标数据的差值的绝对值小于第一预设阈值,则增大所述k';若根据所述测试指标数据和所述第三时间序列中的第二个指标数据的差值的绝对值大于或等于所述第一预设阈值,则减小所述k'。可选地,所述增大所述k',包括:根据所述第四时间序列中各指标数据的标准差,确定增长量;按照所述增长量增大所述k';所述减小所述k',包括:根据所述第四时间序列中各指标数据的标准差,确定减小量;按照所述减小量减小所述k'。可选地,所述根据所述第三时刻的所述指标数据与所述第三时刻的指标预测值,确定所述第三时刻的所述指标数据是否异常,包括:若所述第三时刻的所述指标数据与所述第三时刻的指标预测值之间的差值的绝对值大于第二预设阈值,则确定所述第三时刻的所述指标数据异常。根据本公开实施例的第二方面,提供一种数据异常检测装置,包括:第一获取模块,用于获取第一时刻的指标数据;更新模块,用于在确定所述第一时刻的指标数据正常时,根据在第二时刻获得的所述第一时刻的指标预测值、所述第一获取模块获取到的所述第一时刻的所述指标数据和包括所述第一时刻的指标数据在内的第一时间序列,更新第一RNN-LSTM预测模型的隐藏层状态,其中,所述第二时刻为所述第一时刻的上一时刻,所述第一时间序列的最后一个数据为所述第一时刻的指标数据;第一确定模块,用于根据所述更新模块更新后的第一RNN-LSTM预测模型的隐藏层状态,确定第三时刻的指标预测值,其中,所述第三时刻为所述第一时刻的下一时刻;第二确定模块,用于当获取到所述第三时刻的指标数据时,根据所述第三时刻的所述指标数据与所述第一确定模块确定出的所述第三时刻的指标预测值,确定所述第三时刻的所述指标数据是否异常。根据本公开实施例的第三方面,提供一种计算机本文档来自技高网...

【技术保护点】
1.一种数据异常检测方法,其特征在于,包括:获取第一时刻的指标数据;在确定所述第一时刻的指标数据正常时,根据在第二时刻获得的所述第一时刻的指标预测值、所述第一时刻的所述指标数据和包括所述第一时刻的指标数据在内的第一时间序列,更新第一RNN‑LSTM预测模型的隐藏层状态,其中,所述第二时刻为所述第一时刻的上一时刻,所述第一时间序列的最后一个数据为所述第一时刻的指标数据;根据更新后的第一RNN‑LSTM预测模型的隐藏层状态,确定第三时刻的指标预测值,其中,所述第三时刻为所述第一时刻的下一时刻;当获取到所述第三时刻的指标数据时,根据所述第三时刻的所述指标数据与所述第三时刻的指标预测值,确定所述第三时刻的所述指标数据是否异常。

【技术特征摘要】
1.一种数据异常检测方法,其特征在于,包括:获取第一时刻的指标数据;在确定所述第一时刻的指标数据正常时,根据在第二时刻获得的所述第一时刻的指标预测值、所述第一时刻的所述指标数据和包括所述第一时刻的指标数据在内的第一时间序列,更新第一RNN-LSTM预测模型的隐藏层状态,其中,所述第二时刻为所述第一时刻的上一时刻,所述第一时间序列的最后一个数据为所述第一时刻的指标数据;根据更新后的第一RNN-LSTM预测模型的隐藏层状态,确定第三时刻的指标预测值,其中,所述第三时刻为所述第一时刻的下一时刻;当获取到所述第三时刻的指标数据时,根据所述第三时刻的所述指标数据与所述第三时刻的指标预测值,确定所述第三时刻的所述指标数据是否异常。2.根据权利要求1所述的方法,其特征在于,所述根据在第二时刻获得的所述第一时刻的指标预测值、所述第一时刻的所述指标数据和包括所述第一时刻的指标数据在内的第一时间序列,更新第一RNN-LSTM预测模型的隐藏层状态,包括:根据在第二时刻获得的所述第一时刻的指标预测值、所述第一时刻的所述指标数据和包括所述第一时刻的指标数据在内的第一时间序列,通过以下公式,更新第一RNN-LSTM预测模型的隐藏层状态:h(t)=φ(U·x(t)+W·[ky(t-1)+(1-k)o(t-1)]+b)其中,h(t)为更新后的第一RNN-LSTM预测模型的隐藏层状态;t为所述第一时刻;φ()为激活函数;x(t)为所述第一时间序列;y(t-1)为所述第一时刻的所述指标数据;o(t-1)为所述第一时刻的指标预测值;U、W为所述第一RNN-LSTM预测模型的参数矩阵;b为所述第一RNN-LSTM预测模型的隐藏层状态偏置;k为所述第一时刻的所述指标数据y(t-1)的权重;(1-k)为所述第一时刻的指标预测值o(t-1)的权重。3.根据权利要求1所述的方法,其特征在于,通过包括以下步骤的模型构建方法构建所述第一RNN-LSTM预测模型:获取第一预设历史时段内的多个第一历史指标数据,得到第二时间序列,其中,所述第二时间序列与所述第一时间序列对应于同一指标;将所述第二时间序列作为训练样本输入到初始的RNN-LSTM模型中进行训练,得到第二RNN-LSTM预测模型;将所述第二RNN-LSTM预测模型确定为所述第一RNN-LSTM预测模型,或者对所述第二RNN-LSTM预测模型进行更新,获得所述第一RNN-LSTM预测模型。4.根据权利要求3所述的方法,其特征在于,所述对所述第二RNN-LSTM预测模型进行更新,获得所述第一RNN-LSTM预测模型,包括:获取第二预设历史时段内的多个第二历史指标数据,得到第三时间序列,其中,所述第三时间序列与所述第二时间序列对应于同一指标,所述第二预设历史时段与所述第一预设历史时段不同;将所述第三时间序列中的第一个指标数据确定为测试指标数据;获取第五时刻的指标数据,其中,所述第五时刻为第四时刻的上一时刻,所述第四时刻为所述测试指标数据对应的时刻;在确定所述第五时刻的指标数据正常时,根据在第六时刻获得的所述第五时刻的指标预测值、所述第五时刻的所述指标数据和包括所述第五时刻的指标数据在内的第四时间序列,通过以下公式,更新所述第二RNN-LSTM预测模型的隐藏层状态,其中,所述第六时刻为所述第五时刻的上一时刻,所述第四时间序列的最后一个数据为所述第五时刻的指标数据:h'(T)=φ'(U'·x'(T)+W'·[k'y(T-1)+(1-k')o'(...

【专利技术属性】
技术研发人员:刘颜鹏
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1