【技术实现步骤摘要】
本专利技术涉及数据挖掘中数据聚类
,具体涉及一种基于权重策略的K-Means聚类方法。技术背景处于信息爆炸的今日,数据不断的大量增加,因此如何将大量数据作快速的数据挖掘及知识获取,已成为现代信息管理领域中最重要的议题之一。而在这些数据挖掘的议题中,数据聚类是最常被使用的方法之一。因为数据聚类不仅是一个单独的数据挖掘程序,而且它也是数据获取的预先处理步骤。因为数据聚类可以先分出不同的群体,然后再针对个别的群体去做进一步的分析,以便获得有用的信息。数据聚类(Data Clustering)是数据挖掘领域中非常热门而且重要的研究主题。数据聚类能让数据更简化、建立分类规范以及挖掘未知的假设,使用范围十分广泛。由于数据的特质不尽相同,因此,到目前为止,并没有一种数据聚类算法能够对所有种类的数据产生最佳的聚类效果。数据聚类运作时会遇到一些问题,例如群组分布图的倾向、群组数的选定、噪声数据及高维度的大量数据等问题,也使得数据聚类的应用受到限制,数据聚类的结果也发生误差。近几年来许多研究都是把重点放在解决数据聚类的问题上,让数据聚类的结果更有效能、效率,应用层面更广。 ...
【技术保护点】
本专利技术所述的基于权重策略的K‑Means聚类方法,包括以下步骤:Step1:执行K‑Means数据聚类算法五次。分别执行K‑Means数据聚类算法五次,并记录执行K‑Means数据聚类算法的平方差、各群组中心点。平方差SE的计算如公式(1)所示:SE=Σj=1KΣXi∈Cj(Xi-Zj)2,i=1,2,...N,j=1,2,...,K---(1)]]>其中,Xi为所有数据点,N为数据点总数,Cj为群组,K为群组数,Zj属于该Cj群的中心点。Step2:求最小平方差的中心点。根据Step1求取最小平方差的最佳分群组合,让数据聚类的各 ...
【技术特征摘要】
1.本发明所述的基于权重策略的K-Means聚类方法,包括以下步骤:Step1:执行K-Means数据聚类算法五次。分别执行K-Means数据聚类算法五次,并记录执行K-Means数据聚类算法的平方差、各群组中心点。平方差SE的计算如公式(1)所示:SE=Σj=1KΣXi∈Cj...
【专利技术属性】
技术研发人员:周玉强,陈岩,
申请(专利权)人:杭州熙浪信息技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。