The invention belongs to the field of steel quality testing, and specifically relates to a steel quality detection method based on interval shadow set and density peak clustering. The method includes obtaining raw steel data sets, calculating its distance matrix by using Euclidean distance formula, obtaining local density matrix and relative distance matrix by computing formula in density peak clustering, and output density peak clustering. Decision maps of data sets in class and M clustering centers are selected to classify non-clustering centers into m clusters; the membership values of each object in M clusters are calculated; the optimal threshold sequence of M clusters is determined by minimizing the difference of fuzzy entropy; based on the optimal threshold sequence, non-central objects in M clusters are classified according to their membership values by using classification rules. The interval shadow set is classified into three branches to determine the quality test results of each object, that is, to obtain the quality test results of the original steel data set. The invention can effectively and rapidly detect the quality of steel products.
【技术实现步骤摘要】
基于区间阴影集和密度峰值聚类的钢材质量检测方法
本专利技术属于钢材质量测试领域,具体涉及一种基于区间阴影集和密度峰值聚类的钢材质量检测方法。
技术介绍
冶金工厂生产各种钢材,出厂时都要按照相应标准及技术文件的规定进行各项检测。检测过程将会产生大量数据,且随着生产的进行,数据呈现爆炸式增长,人工比对各项数据在此大数据背景下不仅耗费人力成本,同时效率低下,甚至无法完成质量检测工作。其次,钢材大数据信息系统的属性不仅多样化,而且属性之间往往具有一定的关联性。因此,诸如粒计算理论、聚类分析等数据挖掘方法大量应用于工业大数据中,快速有效提升知识发现的效果。钢材质量检测中,检测结果通常可分为m种不同等级,该m类分别对应聚类分析算法中的m个类簇。但此分类形成的是一个初步检测结果。2014年,AlexRodriguez在《Science》上发表的密度峰值聚类(DensityPeaksClustering,DPC)引起了业界广泛关注。大量密度峰值聚类相关算法得到广泛研究。算法能够快速、有效地发现任意形状的簇。该算法同时具有K中心点聚类(K-medoids)算法、基于密度的空间聚类(Density-BasedSpatialClusteringofApplicationswithNoise,DBSCAN)算法和均值漂移聚类(Mean-Shift)算法的特点,简洁新颖。该算法的中心点同时具有以下两个特点:本身的密度大,即它被密度均不超过它的邻居包围;与其他密度更大的数据点之间的“距离”相对更大。类簇中心点找到后,剩余的每个点被决策归类到它的有更高密度的最近邻所属类簇,此过程只需一 ...
【技术保护点】
1.一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,其特征在于,所述方法包括以下步骤:S1、获取原始钢材数据集,采用欧式距离公式计算得到其距离矩阵;S2、通过密度峰值聚类中的计算公式,获取距离矩阵中的局部密度矩阵以及相对距离矩阵;S3、输出密度峰值聚类中钢材数据集的决策图,并选取m个聚类中心;将非聚类中心进行归类得到m个类簇,分别代表数据集中初分类的m个等级钢材,即一等钢材,二等钢材,…,m等钢材。S4、计算出m个类簇中各个对象的隶属度值;S5、通过最小化模糊熵差异,确定出所述m个类簇的最优阈值序列;S6、基于最优阈值序列,采用分类规则分别对m个类簇中的非中心对象按照其隶属度值采用区间阴影集进行三支分类,从而确定出每个类簇中对象的进一步质量检测结果,即获得原始钢材数据集的最终质量检测结果。
【技术特征摘要】
1.一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,其特征在于,所述方法包括以下步骤:S1、获取原始钢材数据集,采用欧式距离公式计算得到其距离矩阵;S2、通过密度峰值聚类中的计算公式,获取距离矩阵中的局部密度矩阵以及相对距离矩阵;S3、输出密度峰值聚类中钢材数据集的决策图,并选取m个聚类中心;将非聚类中心进行归类得到m个类簇,分别代表数据集中初分类的m个等级钢材,即一等钢材,二等钢材,…,m等钢材。S4、计算出m个类簇中各个对象的隶属度值;S5、通过最小化模糊熵差异,确定出所述m个类簇的最优阈值序列;S6、基于最优阈值序列,采用分类规则分别对m个类簇中的非中心对象按照其隶属度值采用区间阴影集进行三支分类,从而确定出每个类簇中对象的进一步质量检测结果,即获得原始钢材数据集的最终质量检测结果。2.根据权利要求1所述的一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,其特征在于,步骤S2中,所述局部密度矩阵的计算公式包括或中任意一种方式;所述相对距离矩阵的计算公式包括其中,ρi表示第i个对象的局部密度;δi表示第i个对象的相对距离;dij表示xi与xj之间的距离,dc为截断距离;xi表示钢铁数据集S中的第i个对象;S={x1,x2,…,xn};n表示钢铁数据集的对象总数;IS表示对象指标集,IS={k∈IS|ρk>ρi},当时,即对象指标集为空集。3.根据权利要求1所述的一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,其特征在于,所述隶属度的计算公式包括:其中,ω表示权重阈值因子,0.5<ω<1,μ(xi)表示第i个对象xi的隶属度值;xi∈Ck,Ck表示第k个类簇,k=1,2,…,m;dic表示第i个对象xi到该类簇中心点xc的距离;ρi表示第i个对象的局部密度;ρmin该类簇中对象局部密度的最小值;ρmax...
【专利技术属性】
技术研发人员:张清华,陈玉洪,刘学颖,杨洁,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。