【技术实现步骤摘要】
一种融合特征学习的自适应快速K-means聚类方法
本专利技术属于机器学习
,特别涉及一种融合特征学习的自适应快速K-means聚类方法。
技术介绍
聚类方法是在机器学习领域应用非常广泛的一项技术,其中以K-means方法应用最为广泛,其在数据挖掘、医疗、教育等多种领域取得了很好的效果。然而,随着多媒体技术和互联网技术高速发展,高维数据呈现爆发式增长,给传统K-means方法带来了巨大挑战。由于高维数据中往往存在冗余特征和噪声特征,直接对这类数据应用K-means聚类不但需要消耗大量计算资源此外,而且也会影响其聚类准确度。最新研究表明,若预先对数据特征进行降维处理,K-means的聚类效率将得到有效提升。近年来,有一些研究已经将降维方法(如线性判别分析(LinearDiscriminantAnalysis,LDA)、正交质心法(OrthogonalCentroidMethod,OCM)等方法)与K-means进行结合,利用前者为后者提供最优子空间,而将后者在子空间上聚类结果作为前者的“标签”信息。虽然,此类方法能有效提高K-means的聚类准确度,但其均需借 ...
【技术保护点】
1.一种融合特征学习的自适应快速K‑means聚类方法,其特征在于包括如下步骤:步骤1,对待处理数据进行预处理,并对各数据属性进行归一化处理,进而获得n组包括D个特征的无标签数据X=[x1,x2,…,xn]∈R
【技术特征摘要】
1.一种融合特征学习的自适应快速K-means聚类方法,其特征在于包括如下步骤:步骤1,对待处理数据进行预处理,并对各数据属性进行归一化处理,进而获得n组包括D个特征的无标签数据X=[x1,x2,…,xn]∈RD×n,其中xi∈RD×1表示第i个数据样本,i=1,2,…,n;计算数据总散度矩阵St;步骤2,设定待选择的子特征数d,类别数c,平衡因子λ和自适应因子σ,初始化权重矩阵Δ为单位矩阵,并随机初始化特征选择矩阵W和聚类中心矩阵G,其中G=[g1,g2,…,gc]∈Rd×c,gk表示第k个聚类中心向量,k=1,2,…,c;步骤3,建立聚类模型如下:其中,F=[f1,f2,…,fn]T∈{0,1}n×c为类别标签矩阵,fi表示第i个数据样本的类别标签,i=1,2,…,n;以上模型的最优解等同于:其中,设定Δ=diag(τ1,τ2,…,τn)为一个对角矩阵,且U=[u1,u2,…,un]T=XTW-FGT,则最终目标函数转化为:步骤4,求解以上目标函数,直至满足结束条件,输出特征选择矩阵W,聚类中心矩阵G及类别标签矩阵F。2.如权利要求1所述的方法,其特征在于:所述步骤1中,对待处理数据进行预处理,包括解决待处理数据中属性缺失及数据重复的问题。3.如权利要求1所述的方法,其特征在于:所述步骤1中,数据总散度矩阵St的计算公式...
【专利技术属性】
技术研发人员:王晓栋,严菲,曾志强,陈玉明,洪朝群,
申请(专利权)人:厦门理工学院,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。