当前位置: 首页 > 专利查询>安徽大学专利>正文

一种面向高维数据基于自适应鲁棒特征表示的K-means聚类算法制造技术

技术编号:28498528 阅读:46 留言:0更新日期:2021-05-19 22:36
本发明专利技术公开了一种面向高维数据基于自适应鲁棒特征表示的K

【技术实现步骤摘要】
一种面向高维数据基于自适应鲁棒特征表示的K

means聚类算法


[0001]本专利技术属于
,具体涉及一种面向高维数据基于自适应鲁棒特征表示的K

means聚类算法。

技术介绍

[0002]互联网刚刚出现不久,移动互联网就紧随其后,移动互联网才崭露头角,大数据早已后来居上。半个世纪以来,随着计算机技术全面融入社会生活,世界充斥着更多的、增长速度也在不断加快的信息,信息爆炸已经累积到了引发变革的程度。然而,现实世界中产生的这些海量数据通常样本量非常少,但数据维度都很高,其中包含了大量冗余、嘈杂和不相关的数据特征,在解决实际问题时,大大提高了处理问题的难度。如何从现实世界中产生的海量数据截取、管理、处理并整理成为更易解读的信息,一直是数据挖掘领域关注的热点研究课题,聚类分析是一种重要的技术手段。其中,K

means聚类算法因其原理简单且易执行,是应用最广泛的聚类算法。
[0003]然而,受现实世界中数据的维度灾难影响,K

means聚类算法在低维数据空间中本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向高维数据基于自适应鲁棒特征表示的K

means聚类算法,包括如下步骤:A)、建立算法模型,且该算法模型的第一、二项定义学习原始高维数据X的表示数据Z,第三项表示用K

means聚类算法对学习得到的表示数据Z做K

means聚类应用,得到公式(1);B)、使用增广拉格朗日乘子法去求解提出的算法模型,公式(1)可以等价写成公式(2);C)、通过固定E和C,去掉不相关项,优化变量Z,即解决公式(2)如下的子问题:对公式(3)进行运算,得到Z的解如公式(4)所示:Z=Umax(S

θI,0)V
T
ꢀꢀꢀꢀꢀ
(4)D)、通过固定Z和C,去掉不相关项,优化变量E,得到关于变量E的优化问题。即解决公式(2)如下的子问题:对公式(5)运算,可以得到E的解为:在公式(6)中,E)、固定Z和E,解质心C,在解出的Z上做K

means聚类得到质心C;F)、更新提出算法模型中的参数μ和Λ,在增广拉格朗日乘子法的每次迭代中,当获得变量Z、C和E的解后,参数μ和Λ的更新如下所示:μ=μρ(8)。2.根据权利要求1所述的一种面向高维数据基于自适应鲁棒特征表示的K

means聚类算法,其特征在于:公式(1)中,

是非负正则化参数,||
·
||
...

【专利技术属性】
技术研发人员:张娜丁宏强王妍
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1