【技术实现步骤摘要】
一种利用簇内散度和簇间散度的数据聚类框架
本专利技术涉及数据处理,尤其是一种利用簇内散度和簇间散度的数据聚类框架。
技术介绍
在如今快速发展的时代,人们为了研究找出某些事情发生的原因并对其进行相应的预判,从而预防不好的事情的再次发生或对好的事情加以改进,都会进行相应的监测,通过监测每天都会产生数量庞大的不同的数据,若不能对其进行归纳整理,那么这些数据就会对我们无用,只有对其进行有效的归纳整理来区分出噪音,以及对未来事项的预判,从而进行有效的监控。聚类算法就是一种用于归纳整理的方法,其目标是把数据对象划分成不同的簇,使得簇内散度尽可能小,而簇间散度尽可能大,通过聚类算法,就能够划分不同大类的数据类型,从而找出问题的所在。在现有kmeans算法的聚类过程中会平等利用所有的特征进行聚类,其初始聚类中心是随机选择的,不同的聚类中心会获得不同的聚类结构,使得聚类结果不稳定,精度也不高,对于高维数据中的噪音、稀疏性的特征也不能精确的予以区分出来,而且其计算也比较复杂,不利于应用。
技术实现思路
针对现有的不足,本专利 ...
【技术保护点】
1.一种利用簇内散度和簇间散度的数据聚类框架,其特征在于:包括多个数据对象,多个所述数据对象通过聚类算法被分类形成以簇为单元的数据聚类框架,每个簇内含有多个具有相似特性的数据对象,不同簇内的数据对象具有不同的特性;所述聚类算法是无特征加权的扩展简单Kmeans、矩阵特征加权的扩展AWA算法中的任意一种;/n所述无特征加权的扩展简单Kmeans是通过如下扩展目标函数来计算分类数据对象,/n
【技术特征摘要】
1.一种利用簇内散度和簇间散度的数据聚类框架,其特征在于:包括多个数据对象,多个所述数据对象通过聚类算法被分类形成以簇为单元的数据聚类框架,每个簇内含有多个具有相似特性的数据对象,不同簇内的数据对象具有不同的特性;所述聚类算法是无特征加权的扩展简单Kmeans、矩阵特征加权的扩展AWA算法中的任意一种;
所述无特征加权的扩展简单Kmeans是通过如下扩展目标函数来计算分类数据对象,
并满足约束条件
其中:zoj表示数据集的全局质心,并通过计算得来;Zpj表示随机初始质心;U表示分配矩阵;
所述矩阵特征加权的扩展AWA算法是通过如下扩展目标函数来计算分类数据对象,并满足约束条件
其中:W为权重。
2.根据权利要求1所述利...
【专利技术属性】
技术研发人员:詹爱军,单君忆,张婷,黄文博,
申请(专利权)人:扬州千代科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。