当前位置: 首页 > 专利查询>浙江大学专利>正文

面向噪声标签场景的步进式鲁棒半监督燃机异常检测方法及系统技术方案

技术编号:39285049 阅读:8 留言:0更新日期:2023-11-07 10:56
本发明专利技术公开了一种面向噪声标签场景的步进式鲁棒半监督燃机异常检测方法及系统。本发明专利技术基于对称损失理论设计了反正切支持向量机模型和平均绝对误差神经网络模型构建互补式鲁棒基分类器,对噪声标签具有较强的鲁棒特性;其次,提出了一种互补式的噪声滤除机制,步进地滤除噪声标签并更新互补式鲁棒基分类器,进一步降低对噪声标签的过拟合风险;此外,本发明专利技术还设计了一种自适应数据补充策略,通过利用高置信度伪标签样本实现有标签数据集的扩充,克服燃机数据标签稀少的问题。本发明专利技术能够有效地在样本标签稀少且存在标签噪声的情况下完成对燃机运行的异常检测任务,为燃机发电机组的异常检测和安全运维提供了新的方法。机组的异常检测和安全运维提供了新的方法。机组的异常检测和安全运维提供了新的方法。

【技术实现步骤摘要】
面向噪声标签场景的步进式鲁棒半监督燃机异常检测方法及系统


[0001]本专利技术公开一种面向噪声标签场景的步进式鲁棒半监督燃机异常检测方法及系统。本专利技术属于工业异常检测领域,特别是针对标签数量稀缺、标签存在噪声的工业过程数据的异常检测。

技术介绍

[0002]燃机发电机组是一种典型的大型工业设备,其往往具有规模庞大、人工巡检困难、运行负荷变化频繁等特点。随着现代工业加速向高端化、复杂化和智能化方向转变,实现燃机发电机组的高效运维变得更加困难。异常检测是燃机运维中的一项重要任务,具体包括评估燃机运行过程的状态,以及确定燃气轮机、汽轮机、发电机等设备是否存在异常。可靠的异常检测对确保燃机发电过程的安全性具有重要意义。因此,如何在燃机发电机组运行过程中对其实现及时、准确的异常检测,一直是技术人员研究的热点。
[0003]随着物联网(Internet of Things,IoT)技术和人工智能(Artificial Intelligence,AI)的兴起,人们可以方便地存储大量的工业过程数据,从这些数据中探索更有效的信息,并最终理解工业过程的潜在运行规则。在过去的三十年里,许多模式识别方法已被应用于工业过程中的异常检测任务,并取得了令人满意的结果。现有的基于模式识别的异常检测方法大多使用一些监督学习算法来建立分类模型,利用这些分类模型,可以从工业过程样本和标签中提取指示潜在操作行为的有效信息,最终完成异常识别。然而,上述方法需要大量有标签样本作为支持,这在实际应用中具有明显的局限性。在实际的燃机运行过程中,获得未标记的过程数据相对容易,对成千上万的过程数据的运行状态进行逐一判别,获得充足的明确指示有设备运行状态数据却是耗时且昂贵的。有标签样本的缺失,严重限制了深度有监督学习模型在燃机异常检测任务的应用性能。此外,由于专家知识的缺乏、操作员的偶然错误等原因,在给燃机数据进行手动标记的过程中,一些数据可能存在着标记错误的情况,即携带有噪声标签。这些不准确的标签信息可能会给模型的训练带来错误的引导,最终导致异常检测的准确性下降。在实际对燃机运行的异常检测任务中,上述两个问题往往同时发生,给传统的监督异常检测带来了巨大挑战。

技术实现思路

[0004]本专利技术的目的在于针对燃机数据标签稀少且存在噪声的问题,设计了一种步进式迭代互补的噪声滤除策略,并进一步建立异常检测方法。首先,本专利技术基于对称损失理论设计了反正切支持向量机模型和平均绝对误差神经网络模型构建互补式鲁棒基分类器,对噪声标签具有较强的鲁棒特性;其次,提出了一种互补式的噪声滤除机制,步进地滤除噪声标签并更新互补式鲁棒基分类器,进一步降低系统对噪声标签的过拟合风险;此外,本专利技术设计了一种自适应数据补充策略,通过利用高置信度伪标签样本实现有标签数据集的扩充,克服燃机数据标签稀少的问题。
[0005]本专利技术的目的是通过以下技术方案来实现的:
[0006]一种面向噪声标签场景的步进式鲁棒半监督燃机异常检测方法,获取燃机运行数据,将燃机运行数据输入至训练好的互补式鲁棒基分类器获得异常检测结果;其中所述互补式鲁棒基分类器通过如下步骤训练获得:
[0007]步骤1:基于收集的燃机运行数据构建训练集,所述训练集包括有标签训练集和无标签训练集;
[0008]步骤2:构建互补式鲁棒基分类器,所述互补式鲁棒基分类器模型包括并行的反正切支持向量机模型和平均绝对误差神经网络模型;所述反正切支持向量机模型训练时采用的损失函数为:
[0009][0010]其中,w1和b1表示反正切支持向量机模型需要优化的参数,ξ表示惩罚系数,|L|表示有标签样本的数量,||
·
||2表示二范数的平方,为第i个有标签样本的标签,为第i个有标签样本的燃机运行数据;所述平均绝对误差神经网络模型训练时采用的损失函数为平均绝对误差;利用有标签训练集对互补式鲁棒基分类器进行训练,获得第一互补式鲁棒基分类器;
[0011]步骤3:利用第一互补式鲁棒基分类器对有标签训练集每一样本进行预测,依据预测结果的风险评价值判断对应样本是否为噪声标签,滤除噪声标签的样本;利用去除噪声后的有标签训练集重新训练互补式鲁棒基分类器获得第二互补式鲁棒基分类器;
[0012]步骤4:随机选取无标签训练集中的样本构成无标签子集,利用第二互补式鲁棒基分类器对无标签子集每一样本进行预测获得相应的伪标签,依据伪标签的置信度进行排序,选取其中置信度最大的一个或多个样本从无标签训练集中删除并与对应的伪标签构成有标签样本加入至有标签训练集;
[0013]按照步骤2

4交替执行互补式噪声标签滤除和自适应数据补充,直至达到设定的轮数T获得最终训练好的互补式鲁棒基分类器。
[0014]进一步地,所述收集的燃机运行数据为标准化后的燃机运行数据。
[0015]进一步地,所述步骤3中,利用第一互补式鲁棒基分类器对有标签训练集每一样本进行预测,依据预测结果的风险评价值判断对应样本是否为噪声标签,滤除噪声标签的样本,具体为:
[0016]利用第一互补式鲁棒基分类器对有标签训练集每一样本进行预测,并计算预测结果的风险评价值;其中基于反正切支持向量机模型计算的预测结果的风险评价值为反正切支持向量机模型对应于每一样本的预测标签与该样本携带的标签乘积的负值;基于平均绝对误差神经网络模型计算的预测结果的风险评价值为平均绝对误差神经网络模型对应于每一样本的预测标签线性变换并映射到[

1,1]区间后与该样本携带的标签差值的绝对值;
[0017]根据预测结果的风险评价值,将所有的有标签样本划分成4个类别,包括:
[0018]安全样本L
c
:基于反正切支持向量机模型计算的预测结果的风险评价值未超过第一阈值μ1,且基于平均绝对误差神经网络模型计算的预测结果的风险评价值未超过第二阈值μ2的样本;
[0019]一类风险样本L
d1
:基于反正切支持向量机模型计算的预测结果的风险评价值超过第一阈值μ1,而基于平均绝对误差神经网络模型计算的预测结果的风险评价值未超过第二阈值μ2的样本;
[0020]二类风险样本L
d2
:基于平均绝对误差神经网络模型计算的预测结果的风险评价值超过第二阈值μ2,而基于反正切支持向量机模型计算的预测结果的风险评价值未超过第一阈值μ1的样本;
[0021]危险样本L
e
:基于反正切支持向量机模型计算的预测结果的风险评价值超过第一阈值μ1,且基于平均绝对误差神经网络模型计算的预测结果的风险评价值超过第二阈值μ2的样本;
[0022]其中,危险样本判断为含噪声标签的样本,滤除噪声标签的样本。
[0023]进一步地,还包括:
[0024]利用滤除危险样本后的有标签训练集重新训练互补式鲁棒基分类器,获得第三互补式鲁棒基分类器;
[0025]利用第三互补式鲁棒基分类器对滤除危险样本后的有标签训练集每一样本进行预测,并计算预测结果的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向噪声标签场景的步进式鲁棒半监督燃机异常检测方法,其特征在于,获取燃机运行数据,将燃机运行数据输入至训练好的互补式鲁棒基分类器获得异常检测结果;其中所述互补式鲁棒基分类器通过如下步骤训练获得:步骤1:基于收集的燃机运行数据构建训练集,所述训练集包括有标签训练集和无标签训练集;步骤2:构建互补式鲁棒基分类器,所述互补式鲁棒基分类器模型包括并行的反正切支持向量机模型和平均绝对误差神经网络模型;所述反正切支持向量机模型训练时采用的损失函数为:其中,w1和b1表示反正切支持向量机模型需要优化的参数,ξ表示惩罚系数,|L|表示有标签样本的数量,||
·
||2表示二范数的平方,为第i个有标签样本的标签,为第i个有标签样本的燃机运行数据;所述平均绝对误差神经网络模型训练时采用的损失函数为平均绝对误差;利用有标签训练集对互补式鲁棒基分类器进行训练,获得第一互补式鲁棒基分类器;步骤3:利用第一互补式鲁棒基分类器对有标签训练集每一样本进行预测,依据预测结果的风险评价值判断对应样本是否为噪声标签,滤除噪声标签的样本;利用去除噪声后的有标签训练集重新训练互补式鲁棒基分类器获得第二互补式鲁棒基分类器;步骤4:随机选取无标签训练集中的样本构成无标签子集,利用第二互补式鲁棒基分类器对无标签子集每一样本进行预测获得相应的伪标签,依据伪标签的置信度进行排序,选取其中置信度最大的一个或多个样本从无标签训练集中删除并与对应的伪标签构成有标签样本加入至有标签训练集;按照步骤2

4交替执行互补式噪声标签滤除和自适应数据补充,直至达到设定的轮数T获得最终训练好的互补式鲁棒基分类器。2.根据权利要求1所述的方法,其特征在于,所述收集的燃机运行数据为标准化后的燃机运行数据。3.根据权利要求1所述的方法,其特征在于,所述步骤3中,利用第一互补式鲁棒基分类器对有标签训练集每一样本进行预测,依据预测结果的风险评价值判断对应样本是否为噪声标签,滤除噪声标签的样本,具体为:利用第一互补式鲁棒基分类器对有标签训练集每一样本进行预测,并计算预测结果的风险评价值;其中基于反正切支持向量机模型计算的预测结果的风险评价值为反正切支持向量机模型对应于每一样本的预测标签与该样本携带的标签乘积的负值;基于平均绝对误差神经网络模型计算的预测结果的风险评价值为平均绝对误差神经网络模型对应于每一样本的预测标签线性变换并映射到[

1,1]区间后与该样本携带的标签差值的绝对值;根据预测结果的风险评价值,将所有的有标签样本划分成4个类别,包括:安全样本L
c
:基于反正切支持向量机模型计算的预测结果的风险评价值未超过第一阈值μ1,且基于平均绝对误差神经网络模型计算的预测结果的风险评价值未超过第二阈值μ2的样本;
一类风险样本L
d1
:基于反正切支持向量机模型计算的预测结果的风险评价值超过...

【专利技术属性】
技术研发人员:叶建君沈晓兵车斌滕昊真孙健张铁汉赵春晖杨佳阳陈旭宋鹏宇
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1