基于自适应邻域选择与流形边距的多流形特征约简方法技术

技术编号:38345998 阅读:29 留言:0更新日期:2023-08-02 09:26
本发明专利技术具体涉及基于自适应邻域选择与流形边距的多流形特征约简方法,包括:通过密度缩放因子算法计算每个样本点的密度缩放因子;通过样本点的密度缩放因子自适应调节其邻域值,得到每个样本点的理想邻域值;计算其最小线性表示权重,以此自适应的构建流形内图和流形间图;采用流形图最小线性表示误差计算对应的流形内图散度矩阵和流形间图散度矩阵;通过流形内图散度矩阵和流形间图散度矩阵计算对应的流形边距;通过最大化流形边距和最小化类内差异对原始数据进行降维提取,得到对应的降维数据。本发明专利技术能够通过密度缩放因子自适应调整每个样本点的邻域值至理想邻域大小,同时能够更好的适应现实数据多流形分布的特性。够更好的适应现实数据多流形分布的特性。够更好的适应现实数据多流形分布的特性。

【技术实现步骤摘要】
基于自适应邻域选择与流形边距的多流形特征约简方法


[0001]本专利技术涉及大数据处理
,具体涉及基于自适应邻域选择与流形边距的多流形特征约简方法。

技术介绍

[0002]近年来,借助先进的传感器技术、数据采集设备和计算机储存设备,可以积累海量的工业大数据。若能够有效处理和分析多传感器的大数据,及早发现潜在的故障,并定位故障的位置和程度,便可以及早给出合理的运行和维修方案,以确保旋转机械的安全运行。大规模的工业监测数据包含了丰富的设备运行信息,有助于了解内部零件的运行情况,进而确定设备运行状况。但是大规模的数据分析为开展旋转机械故障诊断研究带来了新的挑战,使用高维数据进行数据挖掘和模式识别的过程中往往出现“数据爆炸”和“维数灾难”等问题,如何准确、高效地挖掘有价值的信息成为旋转机械故障诊断技术研究的难题。
[0003]特征约简是对上述问题行之有效的分析和处理方法,其本质是通过删选冗余不重要的特征或将原始特征变化组合为较少的特征,降低原高维空间的复杂度和特征数目以提高数据挖掘系统的性能。由于大多数据都是非线性的,线性降维算法例如主成本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于自适应邻域选择与流形边距的多流形特征约简方法,其特征在于,包括:S1:针对包含若干个样本点的原始数据,通过密度缩放因子算法计算每个样本点的密度缩放因子;S2:通过样本点的密度缩放因子自适应调节其邻域值,得到每个样本点的理想邻域值;S3:通过各个样本点的理想邻域值计算其最小线性表示权重,以自适应构建对应的流形内图和流形间图;S4:基于各个样本点的流形内图和流形间图,采用流形图最小线性表示误差计算对应的流形内图散度矩阵和流形间图散度矩阵;S5:通过流形内图散度矩阵和流形间图散度矩阵计算对应的流形边距;S6:通过最大化流形边距和最小化类内差异对原始数据进行降维提取,得到对应的降维数据作为多流形特征约简结果。2.如权利要求1所述的基于自适应邻域选择与流形边距的多流形特征约简方法,其特征在于,步骤S1中,通过如下步骤计算样本点的密度缩放因子:S101:通过样本点之间的距离计算每个样本点的局部密度;公式描述如下:若d
ij

d
c
≤0,则η(x)=1;若d
ij

d
c
>0,则η(x)=0;式中:ρ
i
表示样本点x
i
的局部密度;d
ij
表示样本点x
i
和x
j
之间的欧式距离;d
c
表示设定的截断距离;S102:基于样本点的局部密度计算其密度缩放因子;公式描述如下:公式描述如下:公式描述如下:式中:α
i
表示样本点x
i
的密度缩放因子;表示样本点的平均密度;s表示样本点的方差;n表示原始数据中的样本点数量。3.如权利要求2所述的基于自适应邻域选择与流形边距的多流形特征约简方法,其特征在于,步骤S2中,通过如下步骤自适应调节样本点的邻域值:S201:通过样本点的局部密度和邻域值计算其β值;公式描述如下:式中:表示样本点的平均密度;k
i
表示样本点x
i
的邻域值;β
i
表示样本点x
i
的β值;
S202:通过β
i
判断样本点x
i
的邻域值是否存在极值情况,并进行对应调整;公式描述如下:满足则不存在极值情况,否则,存在极值情况;表示密度缩放因子的平均值;存在极值情况时:若则k
ij
=k
i(j

1)
*2;若则k
ij
=k
i(j

1)
/2;S203:当样本点的邻域值不存在极值情况后,根据样本点的密度缩放因子自适应调整其邻域值,以实现高密度样本点的邻域值参数增大、低密度样本点的邻域值参数减小;公式描述如下:k
ij
=k
i(j

1)
*a
i
,i=1,2,

,n;式中:k
i(j

1)
表示极值调整j

1次的结果;k
ij
表示经过密度调节因子与不存在极值情况下的初始邻域值k
i(j

1)
调整后的最终理想邻域值;δ表示判断自适应调整后的邻域值是否为理想邻域值的限制条件;α
i
表示样本点x
i
的密度缩放因子。4.如权利要求1所述的基于自适应邻域选择与流形边距的多流形特征约简方法,其特征在于,步骤S4中,首先计算各个样本点的流形内图最小线性表示误差权重矩阵W
ib
和流形间图最小线性表示误差权重矩阵W
iw
;然后根据每一个样本点的最小线性表示误差权重矩阵,构成对应的流形内图最小线性表示权重矩阵W
b
和流形间图最小线性表示权重矩阵W
w
;最后通过流形内图最小线性表示权重矩阵W
b
和流形间图最小线性表示权重矩阵W
w
计算流形内图...

【专利技术属性】
技术研发人员:赵玲丁嘉伟李攀池鑫
申请(专利权)人:重庆交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1