In the DBSCAN method of quayside bridge state classification based on principal component analysis, sensors are installed everywhere in quayside bridge, and the data from sensors are extracted every set time. After data centralization, the characteristic covariance matrix and its eigenvalues and eigenvectors are obtained by principal component analysis, and the contribution degree of each component is calculated, and the first principal components are selected to proceed. Line matrix transformation, initialization density threshold and density radius are used for data point clustering. The classification of quayside bridge state is realized according to the clustering results, and the monitoring of quayside bridge state is realized. The method realizes accurate and fast clustering of quayside bridge state, can cluster non-circular distributed data and achieve good results. Compared with the general DBSCAN algorithm, the method reduces the time complexity, improves the clustering efficiency and accuracy, and can also identify abnormal data well.
【技术实现步骤摘要】
一种基于主成分分析的DBSCAN算法岸桥状态分类方法
本专利技术涉及港口机械领域,具体地说,涉及一种基于主成分分析的具有噪音的基于密度的空间聚类算法的岸桥状态分类方法。
技术介绍
使用聚类算法对岸桥状态分类能够提高分类的效率和准确度,能从大量数据中筛选出有用信息,有助于全面系统的了解设备信息,实现对设备状态的监测并提供了设备维护保养的依据。由于数据的分布具有不规则、较离散的特点,一般的基于距离的聚类方法仅对分布在近似圆形区域的数据聚类效果较好。因此,寻找一种行之有效的聚类方法成为提升数据聚类效果的关键。具有噪音的基于密度的空间聚类算法(density-basedspatialclusteringofapplicationwithnoise,DBSCAN)是一个比较有代表性的基于密度的聚类算法,DBSCAN算法可以在数据集中发现任意形状的类并发现其他类型算法难以发现的噪声数据,这些数据可以反映设备工作中的异常状态。主成分分析(Principalcomponentsanalysis,PCA)是一种分析、简化数据集的技术,直接对数据进行聚类往往效率不高,对数据进行主成分分析,减少数据集的维数,同时保持数据集中的对方差贡献最大的特征,可以提高岸桥状态分类的效率和准确度。国内外学者对DBSCAN聚类算法进行了研究并取得了一些进展。但是,在DBSCAN算法中仍存在参数值Eps的选取对聚类结果影响较大、改进的DBSCAN算法时间复杂度提高的问题。
技术实现思路
为解决现有技术中存在的诸多不足之处,本专利技术提供一种基于主成分分析的DBSCAN算法岸桥状态分类方法,实现岸桥状 ...
【技术保护点】
1.一种基于主成分分析和具有噪音的基于密度的空间聚类的岸桥状态分类方法,其特征在于,岸桥各处安装有传感器,每隔设定时间提取传感器传来的数据;通过主成分分析,进行数据中心化后求得特征协方差矩阵及其特征值和特征向量,计算每个成分的贡献度,取其中在前的若干阶主成分进行矩阵变换;初始化密度阈值和密度半径,用于数据点聚类,根据聚类结果实现岸桥状态的分类,实现对岸桥状态的监测。
【技术特征摘要】
1.一种基于主成分分析和具有噪音的基于密度的空间聚类的岸桥状态分类方法,其特征在于,岸桥各处安装有传感器,每隔设定时间提取传感器传来的数据;通过主成分分析,进行数据中心化后求得特征协方差矩阵及其特征值和特征向量,计算每个成分的贡献度,取其中在前的若干阶主成分进行矩阵变换;初始化密度阈值和密度半径,用于数据点聚类,根据聚类结果实现岸桥状态的分类,实现对岸桥状态的监测。2.如权利要求1所述基于主成分分析和具有噪音的基于密度的空间聚类的岸桥状态分类方法,其特征在于,提取传感器传来的数据储存于数据库,数据库中的数据用向量集合表示为:D={Dj|j∈N}其中的第j个数据表示如下:Dj=[xj,1,xj,2,...,xj,n]每个测点的数据表示为:Bi=[x1,i,x2,i,...,xm,i]T从数据库中获取岸桥在一段时间内n个测点测得的m个数据点共m×n个数据。3.如权利要求2所述基于主成分分析和具有噪音的基于密度的空间聚类的岸桥状态分类方法,其特征在于,主成分分析时,第i个测点的均值表示为:计算第i个测点中心化后的数据如下:中的数据组成的集合作为样本空间Si;Xi是样本空间Si上的随机变量,求得特征协方差矩阵C求协方差矩阵的特征值和特征向量,作|λE-C|=0求诸λi,i=1,2,...,n-1,n;解(λiE-C)x=0,得基础解析计算每个成分的贡献度:取其中的前k阶主成分,经矩阵变换后得:4.如权利要求3所述基于主成分分析和具有噪音的基于密度的空间聚类的岸桥状态分类方法,其特征在于,用k-dist图法初始化密度阈...
【专利技术属性】
技术研发人员:唐刚,施皓正,胡雄,
申请(专利权)人:上海海事大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。