一种基于马尔科夫聚类算法的动态聚类方法技术

技术编号:37878056 阅读:41 留言:0更新日期:2023-06-15 21:06
本发明专利技术涉及一种基于马尔科夫聚类算法的动态聚类方法,将数据集按照适合改进后的马尔科夫聚类算法的数据规模P进行批量聚类,即每次从数据集选取数据规模为P的数据集进行聚类,使用代表点算法在有新增数据时快速完成聚类更新,用相对较少的数据点来描述数据集的特点,对于新增数据和原有数据分别利用代表类簇的代表点进行聚类,并根据聚类结果进行类别合并从而完成聚类更新,从而减少每次参与聚类的数据量,提高聚类的效率。提高聚类的效率。

【技术实现步骤摘要】
一种基于马尔科夫聚类算法的动态聚类方法


[0001]本专利技术属于大数据技术中的数据挖掘
,涉及一种基于马尔科夫聚类算法的动态 聚类方法,主要应用于监控视频下类别数量未知的大规模人脸聚类。

技术介绍

[0002]传统的聚类算法主要有基于划分聚类的K

Means算法和K

Medoids算法,基于层次聚 类的CURE算法和BIRCH算法,基于密度的DBSCAN算法,基于网格算法的STING算法 以及基于模型的COBWEB算法等。其中K

Means算法因其实现原理简单、收敛速度快、计 算结果为全局最优等优点成为最为经典同时也是应用最为广泛的聚类算法之一。但是该算法 的参数K需要预先设定,而K值的设定需要对数据集有一定的认识。另外,该算法对于聚 类类簇个数较大的数据集难以收敛得到较好的结果。层次聚类算法和密度聚类算法虽然不需 要预先设定聚类类簇的数目,但是层次聚类算法聚类和分解的条件设置比较复杂且聚类结果 非全局最优,密度聚类算法的时间复杂度较高;网格聚类算法虽然聚类效率较高但是聚类效 本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于马尔科夫聚类算法的动态聚类方法,其特征在于:(1)实验数据集选择:采用的人脸数据集分别为MS

celeb

1M、LFW、VGGFace2、CASIA

Webface;对于数据集MS

celeb

1M,由于数据集噪声较大,存在一些错误的样本,对其进行数据清洗;对于数据集LFW,由于数据集数据分布不均匀,只选用每人包含2张以上图像的数据集;对于数据集VGGFace2和CASIA

Webface,数据规...

【专利技术属性】
技术研发人员:张陈欢
申请(专利权)人:北京航天长峰科技工业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1