【技术实现步骤摘要】
一种面向高维数据基于自适应鲁棒特征表示的K
‑
means聚类算法
[0001]本专利技术属于
,具体涉及一种面向高维数据基于自适应鲁棒特征表示的K
‑
means聚类算法。
技术介绍
[0002]互联网刚刚出现不久,移动互联网就紧随其后,移动互联网才崭露头角,大数据早已后来居上。半个世纪以来,随着计算机技术全面融入社会生活,世界充斥着更多的、增长速度也在不断加快的信息,信息爆炸已经累积到了引发变革的程度。然而,现实世界中产生的这些海量数据通常样本量非常少,但数据维度都很高,其中包含了大量冗余、嘈杂和不相关的数据特征,在解决实际问题时,大大提高了处理问题的难度。如何从现实世界中产生的海量数据截取、管理、处理并整理成为更易解读的信息,一直是数据挖掘领域关注的热点研究课题,聚类分析是一种重要的技术手段。其中,K
‑
means聚类算法因其原理简单且易执行,是应用最广泛的聚类算法。
[0003]然而,受现实世界中数据的维度灾难影响,K
‑
means聚类 ...
【技术保护点】
【技术特征摘要】
1.一种面向高维数据基于自适应鲁棒特征表示的K
‑
means聚类算法,包括如下步骤:A)、建立算法模型,且该算法模型的第一、二项定义学习原始高维数据X的表示数据Z,第三项表示用K
‑
means聚类算法对学习得到的表示数据Z做K
‑
means聚类应用,得到公式(1);B)、使用增广拉格朗日乘子法去求解提出的算法模型,公式(1)可以等价写成公式(2);C)、通过固定E和C,去掉不相关项,优化变量Z,即解决公式(2)如下的子问题:对公式(3)进行运算,得到Z的解如公式(4)所示:Z=Umax(S
‑
θI,0)V
T
ꢀꢀꢀꢀꢀ
(4)D)、通过固定Z和C,去掉不相关项,优化变量E,得到关于变量E的优化问题。即解决公式(2)如下的子问题:对公式(5)运算,可以得到E的解为:在公式(6)中,E)、固定Z和E,解质心C,在解出的Z上做K
‑
means聚类得到质心C;F)、更新提出算法模型中的参数μ和Λ,在增广拉格朗日乘子法的每次迭代中,当获得变量Z、C和E的解后,参数μ和Λ的更新如下所示:μ=μρ(8)。2.根据权利要求1所述的一种面向高维数据基于自适应鲁棒特征表示的K
‑
means聚类算法,其特征在于:公式(1)中,
∝
是非负正则化参数,||
·
||
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。