设备健康阶段检测的自适应收集方法、系统、装置和介质制造方法及图纸

技术编号:29404858 阅读:58 留言:0更新日期:2021-07-23 22:43
本发明专利技术公开了一种设备健康阶段检测的自适应收集方法、系统、装置和介质,其中方法包括以下步骤:获取设备的数据流,采用基于滑动窗口及蓄水池采样对数据流进行状态提取,获得概念表示;根据概念表示对数据流进行自适应健康阶段检测,获得健康阶段数据;对健康阶段数据进行融合处理,以增大各健康阶段的训练数据。本发明专利技术基于滑动窗口及蓄水池采样的状态提取,基于概念漂移检测的自适应健康阶段检测,实现健康阶段划分,多数据流的阶段融合处理,当存在多组健康数据流时,如多台设备分别采集而来的数据,分别进行阶段划分后,将多组阶段数据融合为单组阶段数据,增大各个健康阶段的数据量,提高训练效果,可广泛应用于智能制造以及数据挖掘领域。

【技术实现步骤摘要】
设备健康阶段检测的自适应收集方法、系统、装置和介质
本专利技术涉及智能制造以及数据挖掘领域,尤其涉及一种设备健康阶段检测的自适应收集方法、系统、装置和介质。
技术介绍
在智能制造背景下,大量设备数据时刻由传感器收集,以数据流的形式呈现,数据流形式的健康数据具有速度快、容量大、特征分析困难、时序相关性高、分布变化点模糊等特点,在使用传统机器学习框架时,无法处理数据流中存在的概念漂移现象,即数据的分布并非稳定不变的,而是随着时间发生变化。概念漂移发生时,数据分布发生变化,使得模型性能下降,在设备健康预测任务上,存在明显的概念漂移现象,因此利用概念漂移理论对设备进行健康阶段检测是可行的,可通过概念漂移检测技术对健康数据流进行健康阶段检测及划分。其中,健康阶段指,对一个设备而言存在磨合期、平稳运行期、快速损坏期等阶段分期,在不同的阶段设备的损耗值有所不同,设备健康变化的规律也有随不同,因此根据阶段的不同,算法的参数也要做相应的调整,这便是检测的目的。当前的设备健康检测手段,没有考虑对健康数据进行阶段划分,而是直接处理整个数据集,尽管采取了增量学习、剪枝等手段,但仍存在训练压力大、模型精度不高、预测速度慢等局限性,未充分考虑设备随着运行时间增大及工作环境的不同,其设备健康呈现阶段性,不同设备健康阶段存在差异性的特点。当前的方法使用整个数据集而不加以划分地进行训练,存在特征提取困难、可解释不佳的问题。主动检测并适应是较为流行的概念漂移处理方法,其中以监控模型性能的方法具有模型无关性,有着更好的泛用能力,其中的典型方法包括DDM、EDDM、ADWIN、HDDM、McDDM等算法,但上述算法仅考虑了漂移检测的灵敏性,并未充分考虑漂移检测对漂移适应的指导作用,在告警机制中仅是简单地调整检测机制的系数,无法平衡延迟与再训练集大小以取得较好的性能,从而使得对健康阶段的划分造成偏移,导致划分的阶段过多,模型训练压力增大等问题。
技术实现思路
为至少一定程度上解决现有技术中存在的技术问题之一,本专利技术的目的在于提供一种设备健康阶段检测的自适应收集方法、系统、装置和介质。本专利技术所采用的技术方案是:一种设备健康阶段检测的自适应收集方法,包括以下步骤:获取设备的数据流,采用基于滑动窗口及蓄水池采样对数据流进行状态提取,获得概念表示;根据概念表示对数据流进行自适应健康阶段检测,获得健康阶段数据;对健康阶段数据进行融合处理,以增大各健康阶段的训练数据。进一步,所述采用基于滑动窗口及蓄水池采样对数据流进行状态提取,包括:采用预设模型对数据流进行长期状态Et与短期状态SGVt提取;根据短期状态SGVt,使用滑动窗口获得短期波动σc,t,使用蓄水池采样获得长期波动σr,t。进一步,所述采用预设模型对数据流进行长期状态Et与短期状态SGVt提取,包括:使用新样本权值衰减的统计量表示长期状态,即统计自模型训练以来的累计平均误差率:其中,εt为当前健康阶段第t次推理的误差,若为分类模型则为0或1,若为回归模型则为实数值,t指当前健康阶段中处理的样本/实例计数器;设定旧样本权值衰减模式,采用Savitzky-Golay滤波作为短期状态估计器;确定拟合多项式的阶数order和拟合区间宽度width,计算出衰减系数cm,m=-(width-1)/2,-(width-1)/2+1,…,0,1,…,(width-1)/2;对最新的width个样本使用衰减系数加权求和获得短期状态SGVt。进一步,所述根据短期状态SGVt,使用滑动窗口获得短期波动σc,t,使用蓄水池采样获得长期波动σr,t,包括:为了评估短期状态SGVt的长期波动σr,t,使用蓄水池采样对短期状态SGVt采样,计算采样池内的方差,为了快速计算蓄水池方差,如果当前值SGVnew被蓄水池采样算法选中,可通过下式更新:其中,Nr是蓄水池大小,Sumt是蓄水池中SGV之和,SGVrm是被替换的值,Sumrm是替换前的和,Sumnew是替换后的值;为了评估短期状态SGVt的短期波动σc,t,使用滑动窗口计算近期方差,更新的方式如下:其中,Nc是滑动窗口的大小。进一步,所述根据概念表示对数据流进行自适应健康阶段检测,获得健康阶段数据,包括:通过检测长期状态Et与短期状态SGVt的差异,判断是否发生概念漂移,若差异大于阈值则判定发生概念漂移:SGVt-Et>kd·σr,t其中,σr,t是蓄水池内的方差,kd是设定的敏感度;检测到概念漂移发生时,认为数据流转移到了新的阶段,使用Bretrain的数据重新训练模型,并新建一个阶段缓冲区Bi+1,将保存训练数据的缓冲区Bretrain保存至对应的阶段数据缓冲区Bi+1,随后清空Bretrain;重复上述检测,直至整个数据流处理完毕,得到n个阶段的数据S={B1,B2,…,Bn}。进一步,当短期波动σc,t呈现先增大再减小的趋势时,表明存在一个潜在的概念转移区间;故当短期波动σc,t的局部最小值时,将保存训练数据的缓冲区Bretrain保存至对应的阶段数据缓冲区Bi,随后清空Bretrain,重新收集数据:σc,t-2>σc,t-1<σc,t其中,σc,t为由滑动窗口提取的最新的短期波动水平,即处理第t个样本后提取的短期波动水平,σc,t-1则为处理第t-1个样本后提取的短期波动水平,σc,t-2则为处理第t-2个样本后提取的短期波动水平。进一步,所述对健康阶段数据进行融合处理,以增大各健康阶段的训练数据,包括:对于M批设备的数据流,获得M个对应的健康阶段数据,组成待融合集合Strain={S1,S2,…,Sm};对不同批次的数据进行相似阶段融合,具体如下:从待融合集合中选取两个批次的数据Si、Sj,计算数据中各健康阶段与的均值的W%置信区间、方差的W%置信区间;依次对区间进行区间融合:若两区间的执行区间杰卡德距离大于或等于P,则将两区间样本合并;若两区间的执行区间杰卡德距离小于P,分别计算和和之间的杰卡德距离,若和之间的杰卡德距离大于或等于P,且大于和之间的杰卡德距离,则将与合并;若和之间的杰卡德距离大于或等于P,且大于和之间的杰卡德距离,则将与合并;若无区间对的杰卡德距离大于P,则不进行两区间样本合并;重复区间融合操作,直至两集合Si、Sj中所有阶段被处理完毕,完成对两批次相似健康阶段的合并;将融合后的健康阶段集合Si,j加入待融合集合中,重复上述步骤,直至待融合集合中仅有一个健康阶段集合。本专利技术所采用的另一技术方案是:一种设备健康阶段检测的自适应收集系统,包括:特征提取模块,用于获取设备的数据流,采用基于滑动窗口及蓄水池采样对数据流进行状态提取,获得概念表示;阶段检测模块,用于根据概念表示对数据流进本文档来自技高网
...

【技术保护点】
1.一种设备健康阶段检测的自适应收集方法,其特征在于,包括以下步骤:/n获取设备的数据流,采用基于滑动窗口及蓄水池采样对数据流进行状态提取,获得概念表示;/n根据概念表示对数据流进行自适应健康阶段检测,获得健康阶段数据;/n对健康阶段数据进行融合处理,以增大各健康阶段的训练数据。/n

【技术特征摘要】
1.一种设备健康阶段检测的自适应收集方法,其特征在于,包括以下步骤:
获取设备的数据流,采用基于滑动窗口及蓄水池采样对数据流进行状态提取,获得概念表示;
根据概念表示对数据流进行自适应健康阶段检测,获得健康阶段数据;
对健康阶段数据进行融合处理,以增大各健康阶段的训练数据。


2.根据权利要求1所述的一种设备健康阶段检测的自适应收集方法,其特征在于,所述采用基于滑动窗口及蓄水池采样对数据流进行状态提取,包括:
采用预设模型对数据流进行长期状态Et与短期状态SGVt提取;
根据短期状态SGVt,使用滑动窗口获得短期波动σc,t,使用蓄水池采样获得长期波动σr,t。


3.根据权利要求2所述的一种设备健康阶段检测的自适应收集方法,其特征在于,所述采用预设模型对数据流进行长期状态Et与短期状态SGVt提取,包括:
使用新样本权值衰减的统计量表示长期状态,即统计自模型训练以来的累计平均误差率:



其中,εt为当前健康阶段第t次推理的误差,t指当前健康阶段中处理的样本/实例计数器;
设定旧样本权值衰减模式,采用Savitzky-Golay滤波作为短期状态估计器;
确定拟合多项式的阶数order和拟合区间宽度width,计算出衰减系数cm,m=-(width-1)/2,-(width-1)/2+1,...,0,1,...,(width-1)/2;
对最新的width个样本使用衰减系数加权求和获得短期状态SGVt。


4.根据权利要求3所述的一种设备健康阶段检测的自适应收集方法,其特征在于,所述根据短期状态SGVt,使用滑动窗口获得短期波动σc,t,使用蓄水池采样获得长期波动σr,t,包括:
为了评估短期状态SGVt的长期波动σr,t,使用蓄水池采样对短期状态SGVt采样,计算采样池内的方差,为了快速计算蓄水池方差,如果当前值SGVnew被蓄水池采样算法选中,通过下式更新:



其中,Nr是蓄水池大小,Sumt是蓄水池中SGV之和,SGVrm是被替换的值,Sumrm是替换前的和,Sumnew是替换后的值;
为了评估短期状态SGVt的短期波动σc,t,使用滑动窗口计算近期方差,更新的方式如下:



其中,Nc是滑动窗口的大小。


5.根据权利要求2所述的一种设备健康阶段检测的自适应收集方法,其特征在于,所述根据概念表示对数据流进行自适应健康阶段检测,获得健康阶段数据,包括:
通过检测长期状态Et与短期状态SGVt的差异,判断是否发生概念漂移,若差异大于阈值则判定发生概念漂移:
SGVt-Et>kd·σr,t
其中,σr,t是蓄水池内的方差,kd是设定的敏感度;
检测到概念漂移发生时,认为数据流转移到了新的阶段,使用Bretrain的数据重新训练模型,并新建一个阶段缓冲区Bi+1,将保存训练数据的缓冲区Br...

【专利技术属性】
技术研发人员:张平蓝曦李方郭炜森
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1