一种基于自适应策略的含噪数据异常检测方法技术

技术编号:38679599 阅读:17 留言:0更新日期:2023-09-02 22:53
本发明专利技术涉及一种基于自适应策略的含噪数据异常检测方法,包括以下步骤:获得振动信号,构建数据样本;进行训练集、测试集划分;从训练集无标签数据集中随机采样K个样本生成无标签子集Ut,合并正例集合P和无标签子集Ut当做训练子集D;使用网格搜索算法寻找最优初始模型参数,根据结果设置批处理大小、学习率、迭代次数N;训练集对神经网络进行训练,通过FCN模型提取频域特征信息、LSTM模块学习时序关系状态特征,对训练集无标签数据预测类别除以n取得最终预测结果,计算评价指标,输出训练集计算结果。该方法能够降低标签噪声的影响,同时还能进行信号降噪,解决了信号噪声对异常检测结果造成干扰的问题。果造成干扰的问题。果造成干扰的问题。

【技术实现步骤摘要】
一种基于自适应策略的含噪数据异常检测方法


[0001]本专利技术涉及智能数据监测
,具体涉及一种基于自适应策略的含噪数据异常检测方法。

技术介绍

[0002]机械设备故障往往会导致工厂停产,产生较大经济损失,甚至导致人员伤亡、环境污染等重大事故。因此,机械设备异常检测技术研究是保障设备安全可靠运行的关键,同时具有保障财产生命安全及社会安定的现实意义。
[0003]目前工业现场监测数据具有数据量大、维度高、产生速度快、价值密度低等特点。例如,特高压换流站的一套冷却设备上就安装有402个测点,每分钟产生约3GB的监测数据,人工判读数据工作量大,现场无法实施。因而如何甄别这些大量监测数据的数据状态就成为设备运行维护的难点和热点。
[0004]监测数据的数据状态标识本质就是异常检测,面对工业现场数据存在大量信号噪声对异常检测结果造成干扰的情况,传统异常检测方法一般分为两大步骤,首先对信号进行预处理,包括信号降噪、特征表示、特征降维等操作,之后将处理后的信号特征输入到决策模型,决策模型给出最终结果。然而,未能提出将信号降噪结构嵌入到网络结构中的端到端的异常检测算法,导致各阶段目标函数不同使得异常检测模型效果不佳。且预处理的具体方法需要有专业的技术人员进行设计,再结合有效的异常判别算法才能表现出显著效果。即便如此,工程师也难以在各种噪声条件下提出始终保持良好性能的算法流程。
[0005]半监督学习异常检测方法易受到两方面因素的影响。(1)每次从无标签数据集中随机均匀采样,获得正例样本和负例样本的概率由污染率决定,然而在训练过程中,都会将其作为负样本训练,本专利技术中将其称为标签噪声,必定会对基学习器的分类准确度造成影响;(2)工业现场机械设备状态监测数据本身易受噪声影响,本专利技术中将其称为信号噪声,会使得学习器不能正确学习到监测信号的特征表示。因此可以针对异常检测过程中出现的两类噪声条件标签噪声和信号噪声提出一种基于自适应策略的含噪数据异常检测。

技术实现思路

[0006]本专利技术的目的是提供一种基于自适应策略的含噪数据异常检测方法,以能实现含噪数据的自适应监测,降低了对使用者自身经验的要求,减少了对人力资源和时间成本的消耗。
[0007]为实现上述目的,本专利技术采用如下技术方案:
[0008]一种基于自适应策略的含噪数据异常检测方法,包括以下步骤:
[0009](1)获得振动信号,整理、标准化并分割成固定段,构建数据样本;
[0010](2)对步骤(1)顺次采集到的振动信号进行训练集、测试集划分;
[0011](3)从训练集无标签数据集中随机采样K个样本生成无标签子集Ut,其中K为无标签子集大小;
[0012](4)合并正例集合P和无标签子集Ut当做训练子集D;
[0013](5)使用网格搜索算法寻找最优初始模型参数,根据结果设置批处理大小、学习率、迭代次数N;
[0014](6)训练集对神经网络进行训练,通过FCN模型提取频域特征信息、LSTM模块学习时序关系状态特征,进行softmax分类后,利用反向传播算法更新模型参数;
[0015](7)判断网络训练次数m是否达到预先设定的迭代次数N,如果是,进行下一步,否则重复步骤(5);
[0016](8)对所有无标签数据U进行预测,生成类别概率P,并保存该数据对应的预测类别s(x),计数器n加1;
[0017](9)判断前后两次预测概率之差是否到达设定阈值δ,如果是,进行下一步,否则以1

P作为无标签集合采样概率生成无标签子集,重复步骤(4);
[0018](10)对训练集无标签数据预测类别除以n取得最终预测结果,计算评价指标,输出训练集计算结果;
[0019](11)测试集测试已经训练好的模型性能,计算评价指标,输出测试集计算结果。
[0020]进一步地,通过加速度传感器实时采集振动信号,得到若干个周期内的振动信号;具体包括以下步骤:
[0021]1)将含加速度振动传感器的硬件系统安装到电机外壳的驱动端,并利用磁性底座将其固定到外壳上,利用该硬件系统采集振动信号;
[0022]2)系统开始周期性采集、存储整个轴承转动过程的振动信号。
[0023]进一步地,步骤(5)中,自适应采样方法最初以均匀概率1/n从无标签数据集D进行采样来,并训练给定的分类模型h
θ,0
(D,0),然后通过以每个样本的误标记概率更新D中的样本的采样概率,迭代更新训练数据集(D,k),k是迭代的次数,无标签样本中正类和负类实例的采样概率经过标准化
[0024][0025]式中:n+为D中的正实例数目;n

为D中的负实例数目。
[0026]进一步地,步骤(8)中,根据上一分类器给出的预测概率,给无标签数据集施加不同的采样概率,预测概率越大表明该样本越可能为正样本,因此需要给予越小的采样概率,防止再次被选中;预测概率越小,表明该样本很可能不是正样本,给予越大的采样概率,使得下一次的无标签子集中负样本的概率增大,缓解标签噪声问题。
[0027]进一步地,步骤(9)中,分别对LSTM模块、FCN模块添加注意力层。
[0028]进一步地,在FCN模块添加注意力层的同时,设计了自适应软阈值模块,对所提取的数据特征进行降噪处理。
[0029]本专利技术的有益效果:
[0030]本专利技术的基于自适应策略的含噪数据异常检测方法,面对工业现场数据存在大量信号噪声对异常检测结果造成干扰的情况,针对噪声环境下的无标签数据异常检测情况,提出自适应采样的方法可以有效降低无标签子集的污染率,从而克服无标签数据集中标签
噪声的影响。
[0031]提出基于自适应软阈值降噪的方法可以自动学习不同通道信号的降噪阈值,并且将该降噪模块嵌入到网络架构中完成信号降噪。填补了将信号降噪结构嵌入到网络结构中的端到端的异常检测算法的空白,相较于当前研究通常采用预处理、降噪和异常判别等分阶段的异常检测方法,该方法具有较高的便捷性和显著的经济性,同时操作方便,安全可靠。
附图说明
[0032]图1是本专利技术基于自适应策略的含噪数据异常检测方法。
具体实施方式
[0033]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。
[0034]实施例:
[0035]如图1所示,一种基于自适应策略的含噪数据异常检测方法,包括以下步骤:
[0036](1)获得振动信号,整理、标准化并分割成固定段,构建数据样本;
[0037](2)对步骤(1)顺次采集到的振动信号进行训练集、测试集划分;
[0038](3)从训练集无标签数据集中随机采样K个样本生成无标签子集Ut,其中为K无标签子集大小;
[0039](4)合并正例集合P和无标签子集当做训练子集D;
[0040](5)使用网格搜索算法寻找最优初始模型参数,根据结果设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自适应策略的含噪数据异常检测方法,其特征在于:包括以下步骤:(1)获得振动信号,整理、标准化并分割成固定段,构建数据样本;(2)对步骤(1)顺次采集到的振动信号进行训练集、测试集划分;(3)从训练集无标签数据集中随机采样K个样本生成无标签子集Ut,其中K为无标签子集大小;(4)合并正例集合P和无标签子集Ut当做训练子集D;(5)使用网格搜索算法寻找最优初始模型参数,根据结果设置批处理大小、学习率、迭代次数N;(6)训练集对神经网络进行训练,通过FCN模型提取频域特征信息、LSTM模块学习时序关系状态特征,进行softmax分类后,利用反向传播算法更新模型参数;(7)判断网络训练次数m是否达到预先设定的迭代次数N,如果是,进行下一步,否则重复步骤(5);(8)对所有无标签数据U进行预测,生成类别概率P,并保存该数据对应的预测类别s(x),计数器n加1;(9)判断前后两次预测概率之差是否到达设定阈值δ,如果是,进行下一步,否则以1

P作为无标签集合采样概率生成无标签子集,重复步骤(4);(10)对训练集无标签数据预测类别除以n取得最终预测结果,计算评价指标,输出训练集计算结果;(11)测试集测试已经训练好的模型性能,计算评价指标,输出测试集计算结果。2.根据权利要求1所述的含噪数据异常检测方法,其特征在于:通过加速度传感器实时采集振动信号,得到若干个周期内的振动信号;具体包括以下...

【专利技术属性】
技术研发人员:付兵非王强罗浩江龙雷亚州宋超锋韩兴震张新伟
申请(专利权)人:河南晶锐冷却技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1