时序数据趋势告警方法、系统及趋势告警模型训练方法技术方案

技术编号:36191270 阅读:19 留言:0更新日期:2022-12-31 21:07
本发明专利技术公开了一种时序数据趋势告警方法、系统及趋势告警模型训练方法,其中,训练方法包括:准备样本源数据,包括监测值及对应的时间戳;以第一时间间隔为窗口宽度切割样本源数据,得到多个原始样本;对每一个原始样本进行以第二时间间隔为组距的分组处理,得到中间样本;为每个中间样本标注多个标签,得到训练样本;利用完成标签标注的训练样本对基于卷积神经网络的基础模型进行训练,直至模型收敛,得到趋势告警模型。本发明专利技术采用多标签学习的方式训练得到的工业时序数据趋势告警方法及系统能更多地提取由趋势产生的特征,进而提高模型的泛化性和告警准确率。的泛化性和告警准确率。的泛化性和告警准确率。

【技术实现步骤摘要】
时序数据趋势告警方法、系统及趋势告警模型训练方法


[0001]本专利技术涉及趋势告警领域,尤其涉及一种时序数据趋势告警方法、系统及趋势告警模型训练方法。

技术介绍

[0002]时序数据是指同一统一指标按时间顺序记录的数据列,其数据元素一般会经历采集、存储、查询、处理和分析等过程。工业时序数据分析场景涉及故障分析、产能分析、能耗分析、安全隐患分析等,用户较为关注的往往是数据过去一段时间的趋势,比如能耗值在过去一段时间内如果有趋势变化,不管是上升的趋势还是下降的趋势,都会引起管理者足够的重视。但在多数情况下,采集到的时序数据种类繁多,工程师或者管理者不会时刻盯着所有时序数据,因此时序数据在产生异常时,要主动地抛出告警来引起相关人员的注意。
[0003]工业时序数据告警方式一般有阈值告警和趋势告警,阈值告警的工作方式一般是对所监测数据设置阈值上限或阈值下限,当监测量超过所设阈值上限或低于所设阈值下限,就会主动触发告警;趋势告警一般是通过建立对趋势进行衡量的规则,当符合所设告警规则时,则抛出告警。
[0004]基于设置阈值来告警的方式一般操作简单,阈值可以结合历史数据并通过统计学的方式来设定。在公开号为CN110057406A的中国专利申请中,提出了一种基于最小二乘算法变步长查找最大趋势增长率的方法,最大增长率超过所设阈值则判断为告警。但是,在该方案中,最小二乘算法得到的拟合参数是由参与运算的所有点数所决定的,其中不乏值忽大忽小的数据点,特别是在工况不稳定时,极易受到干扰产生漏报或误报。
[0005]基于趋势的告警方法则较为复杂。在公开号为CN114237128A的中国专利申请中,提出了一种基于卷积神经网络的趋势报警方法,该方案通过提取原始数据的特征,利用报警数据集训练模型调整参数,然后将历史数据输入至模型,根据输出结果评估并得到报警阈值。但是,在该方案中,存在以下问题:仅利用报警数据集进行训练,很难去除不报警数据集对结果产生的不利影响;不是端到端的神经网络模型,阈值的设定仍然需要人工参与,且可能存在告警与不告警最终的输出特征难以区分的情况;没有设法提取到由趋势产生的特征,很容易导致模型的过拟合、泛化能力差。
[0006]基于趋势的告警方法很难开发、应用及推广,还因为尽管不同人对“趋势”的主观感受可能大致相同,但这些主观感受却很难描述,难以转换为人人认可的衡量趋势是否应该告警的准则。
[0007]以上
技术介绍
内容的公开仅用于辅助理解本专利技术的专利技术构思及技术方案,其并不必然属于本专利申请的现有技术,也不必然会给出技术教导;在没有明确的证据表明上述内容在本专利申请的申请日之前已经公开的情况下,上述
技术介绍
不应当用于评价本申请的新颖性和创造性。

技术实现思路

[0008]本专利技术的目的是提供一种时序数据趋势告警方法、系统及趋势告警模型训练方法,提供结果可靠、适用性广泛的趋势告警解决方案。
[0009]为达到上述目的,本专利技术采用的技术方案如下:
[0010]一种工业时序数据趋势告警模型的多标签学习训练方法,包括以下步骤:
[0011]准备样本源数据,包括获取各类工业时序数据,每一类工业时序数据包括监测值及对应的时间戳;
[0012]以第一时间间隔为窗口宽度步进切割所述样本源数据,以所述第一时间间隔内的数据作为原始样本;
[0013]对每一个原始样本进行以第二时间间隔为组距的分组处理,得到N个分组单元,根据所述N个分组单元得到中间样本,其中,N为大于200的正整数;;
[0014]为每个中间样本标注多个标签,得到训练样本,所述标签类型包括趋势是否告警、是否有上升趋势、是否有下降趋势、是否缓慢上升或下降、是否突然上升或下降、是否阶段性上升或下降中的多种;
[0015]利用完成标签标注的训练样本对基于卷积神经网络的基础模型进行训练,直至模型收敛,得到趋势告警模型。
[0016]进一步地,所述分组处理包括以下步骤:
[0017]按照一原始样本内的时间戳,以第二时间间隔为窗口宽度对该原始样本内的监测值进行分组,得到N个分组单元;
[0018]按照预设的规则确定每个分组单元内的第一监测代表值和第二监测代表值;
[0019]将各个分组单元的第一监测代表值按照时序排列,得到所述中间样本的第一行数据,将各个分组单元的第二监测代表值按照时序排列,得到所述中间样本的第二行数据。
[0020]进一步地,所述多标签学习训练方法还包括对分组处理得到的中间样本进行标准化处理,包括对所述中间样本的第一行数据和第二行数据进行归一化处理,以避免数据值的量纲或数量级出现差异。
[0021]进一步地,用于确定所述第一监测代表值和第二监测代表值的规则包括以下规则中的任一条:
[0022]对同一分组单元内的监测值进行大小排序,取第i个监测值作为第一监测代表值,取倒数第j个监测值作为第二监测代表值,其中,1≤i≤8,1≤j≤8;或者,
[0023]对同一分组单元内的监测值进行大小排序,取前i个监测值中的部分或全部的平均值作为第一监测代表值,取倒数j个监测值中的部分或全部的平均值作为第二监测代表值,其中,1≤i≤8,1≤j≤8;或者,
[0024]对同一分组单元内的监测值进行大小排序,若分组单元内监测值的数量达到20个,取第i个监测值作为第一监测代表值,取倒数第j个监测值作为第二监测代表值,其中,i、j为正整数,n为该分组单元内监测值的数量,或者,
[0025]对同一分组单元内的监测值进行大小排序,若分组单元内监测值的数量达到20个,取前i个监测值中的部分或全部的平均值作为第一监测代表值,取倒数j个监测值中的部分或全部的平均值作为第二监测代表值,其中,i、j为正整数,n为该
分组单元内监测值的数量;或者,
[0026]若同一分组单元内的监测值的数量为一个,则该监测值同时为所述第一监测代表值和第二监测代表值;或者,
[0027]若同一分组单元内的监测值的数量为零,则所述第一监测代表值和第二监测代表值均赋值为0。
[0028]进一步地,为每个标签类型预设一个阈值,以作为判断该标签类型对应的输出结果是否为阳性的临界值;和/或,使用K折交叉验证确定训练集和测试集,以训练所述基础模型并验证得到所述趋势告警模型。
[0029]进一步地,所述基于卷积神经网络的基础模型的输入层为卷积层,其接收尺寸为(N,2,1);所述基础模型的中间层包括卷积层、池化层、Dropout层、Dense层,所述基础模型的输出层为Dense层,其配置有与所述标签类型一一对应的输出节点,所述输出层采用Sigmoid或Softmax为激活函数;所述基础模型采用交叉熵损失函数对梯度进行反向传播。
[0030]进一步地,所述基础模型的第一层为卷积层,并采用relu为激活函数;所述基础模型的第二层为池化层;所述基础模型的第三层为卷积层,并采用relu为激活函数;所述基础模型的第四层为池化层;所述基础模型的第五层为Dropout层;所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工业时序数据趋势告警模型的多标签学习训练方法,其特征在于,包括以下步骤:准备样本源数据,包括获取各类工业时序数据,每一类工业时序数据包括监测值及对应的时间戳;以第一时间间隔为窗口宽度步进切割所述样本源数据,以所述第一时间间隔内的数据作为原始样本;对每一个原始样本进行以第二时间间隔为组距的分组处理,得到N个分组单元,根据所述N个分组单元得到中间样本,其中,N为大于200的正整数;为每个中间样本标注多个标签,得到训练样本,所述标签类型包括趋势是否告警、是否有上升趋势、是否有下降趋势、是否缓慢上升或下降、是否突然上升或下降、是否阶段性上升或下降中的多种;利用完成标签标注的训练样本对基于卷积神经网络的基础模型进行训练,直至模型收敛,得到趋势告警模型。2.根据权利要求1所述的工业时序数据趋势告警模型的多标签学习训练方法,其特征在于,所述分组处理包括以下步骤:按照一原始样本内的时间戳,以第二时间间隔为窗口宽度对该原始样本内的监测值进行分组,得到N个分组单元;按照预设的规则确定每个分组单元内的第一监测代表值和第二监测代表值;将各个分组单元的第一监测代表值按照时序排列,得到所述中间样本的第一行数据,将各个分组单元的第二监测代表值按照时序排列,得到所述中间样本的第二行数据。3.根据权利要求2所述的工业时序数据趋势告警模型的多标签学习训练方法,其特征在于,还包括对分组处理得到的中间样本进行标准化处理,包括对所述中间样本的第一行数据和第二行数据进行归一化处理,以避免数据值的量纲或数量级出现差异。4.根据权利要求2所述的工业时序数据趋势告警模型的多标签学习训练方法,其特征在于,用于确定所述第一监测代表值和第二监测代表值的规则包括以下规则中的任一条:对同一分组单元内的监测值进行大小排序,取第i个监测值作为第一监测代表值,取倒数第j个监测值作为第二监测代表值,其中,1≤i≤8,1≤j≤8;或者,对同一分组单元内的监测值进行大小排序,取前i个监测值中的部分或全部的平均值作为第一监测代表值,取倒数j个监测值中的部分或全部的平均值作为第二监测代表值,其中,1≤i≤8,1≤j≤8;或者,对同一分组单元内的监测值进行大小排序,若分组单元内监测值的数量达到20个,取第i个监测值作为第一监测代表值,取倒数第j个监测值作为第二监测代表值,其中,i、j为正整数,n为该分组单元内监测值的数量,或者,对同一分组单元内的监测值进行大小排序,若分组单元内监测值的数量达到20个,取前i个监测值中的部分或全部的平均值作为第一监测代表值,取倒数j个监测值中的部分或全部的平均值作为第二监测代表值,其中,i、j为正整数,n为该分组单元内监测值的数量;或者,若同一分组单元内的监测值的数量为一个,则该监测值同时为所述第一监测代表值和
第二监测代表值;或者,若同一分组单元内的监测值的数量为零,则所述第一监测代表值和第二监测代表值均赋值为0。5.根据权利要求1所述的工业时序数据趋势告警模型的多标签学习训练方法,其特征在于,为每个标签类型预设一个阈值,以作为判断该标签类型对应的输出结果是否为阳性的临界值;和/或,...

【专利技术属性】
技术研发人员:邓刚张玉斌
申请(专利权)人:苏州德姆斯信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1