齿轮箱错误类别标签修正系统及方法技术方案

技术编号:26343276 阅读:47 留言:0更新日期:2020-11-13 20:43
一种齿轮箱错误类别标签修正系统及方法,该系统包括:时域特征提取融合模块、样本权重赋予模块、错误标签筛选模块和错误标签修正模块,时域特征提取融合模块提取并拼接齿轮箱振动信号不同模态分量的时域统计特征,样本权重赋予模块通过堆栈自编码获得时域统计特征的降维特征后,使用孤立森林改变不同样本在堆栈自编码训练中的权重,并估计出错误标签的比例,错误标签筛选模块对降维特征通过聚类方法挑选出错误标签率低的样本,错误标签修正模块根据错误标签率低的样本以及权重进行分类器训练,获取所有样本的信息熵,根据信息熵阈值实现样本标签的修正。降低错误的标签对分类器训练的不良影响,提高错误标签修正的正确率。本发明专利技术能够将错误标签样本的比例降低到2.5%以内。

Correction system and method of gearbox error category label

【技术实现步骤摘要】
齿轮箱错误类别标签修正系统及方法
本专利技术涉及的是一种信息处理领域的技术,具体是一种基于堆栈自编码和孤立森林的错误类别标签修正系统及方法。
技术介绍
随着物联网发展和机械检测设备的密布,利用大数据进行故障诊断成为现代工业发展的方向。监督学习中,正确的标签样本是诊断的基础,但标记错误的标签会对故障的诊断预测结果造成干扰,降低目标分类的精度和泛化能力。在实际工程中,错误标签的情况难以避免。齿轮箱数据采集后,实验工作人员会根据需要给采集的数据设置类别标签以便于存储和使用,而类别标签依赖于操作人员水平以及过程数据的准确性。齿轮箱健康类别包括故障的种类,故障的程度,这两部分的诊断会因为标准不同而造成标签不够准确,甚至错误。数据本身也会存在限制条件,如多故障的齿轮箱,因为裂纹而忽视其他故障;缓慢变化的故障在前期被认为是正常标本等。另外,在信号转换,通信传输,预处理中的程序错误也会造成错误标签的产生。这些现实存在的困难会导致齿轮箱类别标签出现错误,从而影响研究人员在数据分析中的准确性。因此对齿轮箱的类别标签进行修正是十分有必要的。>现有研究多认为具有本文档来自技高网...

【技术保护点】
1.一种基于堆栈自编码和孤立森林的错误类别标签修正系统,其特征在于,包括:时域特征提取融合模块、样本权重赋予模块、错误标签筛选模块和错误标签修正模块,其中:时域特征提取融合模块提取并拼接齿轮箱振动信号不同模态分量的时域统计特征,样本权重赋予模块通过堆栈自编码获得时域统计特征的降维特征后,使用孤立森林改变不同样本在堆栈自编码训练中的权重,并估计出错误标签的比例,错误标签筛选模块对降维特征通过聚类方法挑选出错误标签率低的样本,错误标签修正模块根据错误标签率低的样本以及权重进行分类器训练,获取所有样本的信息熵,根据信息熵阈值实现样本标签的修正;/n所述的样本权重赋予模块包括:特征向量缩减单元、伪标签...

【技术特征摘要】
1.一种基于堆栈自编码和孤立森林的错误类别标签修正系统,其特征在于,包括:时域特征提取融合模块、样本权重赋予模块、错误标签筛选模块和错误标签修正模块,其中:时域特征提取融合模块提取并拼接齿轮箱振动信号不同模态分量的时域统计特征,样本权重赋予模块通过堆栈自编码获得时域统计特征的降维特征后,使用孤立森林改变不同样本在堆栈自编码训练中的权重,并估计出错误标签的比例,错误标签筛选模块对降维特征通过聚类方法挑选出错误标签率低的样本,错误标签修正模块根据错误标签率低的样本以及权重进行分类器训练,获取所有样本的信息熵,根据信息熵阈值实现样本标签的修正;
所述的样本权重赋予模块包括:特征向量缩减单元、伪标签赋予单元和样本权重更改单元,其中:特征向量缩减单元通过堆栈自编码中的编码器对样本的特征向量进行维度缩减,伪标签赋予单元通过孤立森林和错误标签比例估计方法对维度缩减后向量进行异常点检测,给样本赋予正确和错误的伪标签,样本权重更改单元根据伪标签调整解码器对样本的关注程度,从而实现堆栈自编码训练。


2.根据权利要求1所述的错误类别标签修正系统,其特征是,所述的时域特征提取融合模块包括:信号分解单元和时域特征融合单元,其中:信号分解单元通过经验模态分解的方法获取振动信号的模态分量,时域特征融合单元计算所有内涵模态分量的均值、最大值、最小值、整流平均值、峰峰值、均方根、方差、标准差、峭度、偏度、冲击因子、脉冲因子、波形因子、峰值因子、根均方值、对数比、绝对冲击因子,将计算结果形成一维向量,作为样本的特征向量。


3.根据权利要求2所述的错误类别标签修正系统,其特征是,所述的经验模态分解是指:通过信号包络线和信号均值作差的方式将频率不规则的信号转为多个单一频率的信号与残波相结合的形式,分解出来的单一频率信号被称为内涵模态分量。


4.根据权利要求1所述的错误类别标签修正系统,其特征是,所述的错误标签筛选模块包括:样本聚类单元和标签判断单元,其中:样本聚类单元将孤立森林作为聚类方法,通过样本特征之间的欧式距离对堆栈自编码获得的缩减向量进行聚类,获得各个类别的样本个数及分布,标签判断单元利用聚类结果对样本的标签进行判断,将样本分为标记为正确的样本,和标记为错误的样本两类。


5.根据权利要求1所述的错误类别标签修正系统,其特征是,所述的错误标签比例估计方法是指:第一次对样本进行异常点检测时,设置孤立森林的异常点比例为0.05,之后计算前后两轮训练中伪标签为True样本的方差,若方差有增大,则异常点比例应根据前后方差的比例增加一定百分比;若方差有减少,则异常点比例应根据...

【专利技术属性】
技术研发人员:黄亦翔张旭
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1