【技术实现步骤摘要】
本专利技术属于数据处理
,尤其是涉及。
技术介绍
在自然科学和社会科学中,存在着大量的分类问题,聚类方法是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法,应用领域非常广泛。模糊C-均值(FCM)聚类算法是常用的无监督模式识别方法,有很多对FCM算法的改进,其中基于特征加权的FCM(WFCM)聚类算法考虑了样本各特征参数对聚类中心的影响,改善了噪声、异常数据影响等情况。但是,这些基于FCM的聚类算法,实质都只考虑了样本的类内紧致性(类内散度),而忽略了样本类间散布性(类间散度)。Kuo-Lung Wu等人提出的FCS (Fuzzy Compactness and Separation)算法考虑了类内紧致和类间散布,并兼容了样本的硬划分和模糊划分,这更符合实际情况;国内有宋风溪等人提出了最大散度差判别准则的分类方法,该准则综合考虑类间散度和类内散度来求最优投影向量以对样本进行分类;皋军等人将模糊度引入了最大散度差判别准则提出了 FMSDC(fuzzy maximum scatterdifference discriminant criterion)算法,在模糊聚类的同时进行了降维;支晓斌等人指出皋军等人的算法中的错误,提出FMSDC-FCS聚类算法,该算法是皋军等人算法的正确版本,利用FCM算 法初始化隶属度和样本均值,再用FMSDC算法进行降维,用FCS算法对降维数据进行聚类,其聚类实质还是采用FCS算法。而在利用上述算法进行数据分类的过程中,我们发现,实际数据有些处于某类硬划分区域和硬划分边界上,这些数据的 ...
【技术保护点】
一种特征加权的模糊紧致散布聚类方法,其特征在于,包括如下步骤:步骤一:设置隶属度指数m、特征加权指数α∈[‑10,‑1]∪(1,10]、β∈{0.005,0.05,0.5,1},初始迭代次数p=0以及迭代误差ε>0,随机生成初始聚类中心ai,(c为类别数);步骤二:根据下式计算系数ηi:ηi=β4mini≠i′||ai-ai′||2maxt||at-X‾||2]]>其中,为样本均值;步骤三:根据下式更新样本隶属度μij:μij=(Σk=1sωkα(||xij-aik||2-ηi||aik-Xk‾||2))11-mΣt=1c(Σk=1sωkα(||xjk-atk||2-ηt||atk-Xk‾||2))11-m]]>记Δij=Σk=1sωkα(||xij-aik||2-ηi||aik-Xk‾||2)]]>当样 ...
【技术特征摘要】
1.一种特征加权的模糊紧致散布聚类方法,其特征在于,包括如下步骤: 步骤一:设置隶属度指数m、特征加权指数a e [-10, -1] U (I, 10]、β e {0.005, 0.05,0.5,1},初始迭代次数P = O以及迭代误差ε > O,随机生成初始聚类中心Bi,6?=! (C为类别数); 步骤二:根据下式计算系数Hi: 2.根据权利要求1所述的特征加权的模糊紧致散布聚类方法,其特征在于:所述样本隶属度μ ij和...
【专利技术属性】
技术研发人员:周媛,何军,夏景明,
申请(专利权)人:南京信息工程大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。