一种基于贝叶斯混合和相似互近邻的多密度谱聚类方法技术

技术编号:42702981 阅读:16 留言:0更新日期:2024-09-13 11:57
本发明专利技术提供一种基于贝叶斯混合和相似互近邻的多密度谱聚类方法,包括:使用贝叶斯高斯混合模型拟合数据,找到数据点的密度差异之间的临界值,并计算每个实例的密度,以进行密度分层;使用相互最近邻并引入相似性kMNN找到邻居并区分不同簇的边界;构造带有密度层信息以及距离信息的邻接矩阵;配合密度区分值,赋予谱聚类每个数据点以不同的权重,将数据处理为最终簇。本发明专利技术使用变分贝叶斯高斯混合模型对数据进行拟合,根据数据的局部特性调整密度估计,以更好地适应不同密度层次的数据分布,使用相似性相互最近邻,构建具有更加丰富信息的邻接矩阵,开发能够有效建模密度层次结构的谱聚类算法,能够解决谱聚类在密度不均匀的数据中表现不佳的问题。

【技术实现步骤摘要】

本专利技术涉及谱聚类,具体而言,尤其涉及一种基于贝叶斯混合和相似互近邻的多密度谱聚类方法


技术介绍

1、谱聚类在处理高维数据聚类时的复杂度比传统聚类算法好但也无法处理密度不均匀的数据等等。大多数聚类方法可能无法很好地处理与所做假设不同的数据分布模式以及不同分布模式的混合。而强自适应贝叶斯高斯混合模型和谱聚类融合的多密度聚类,使用贝叶斯高斯混合模型来拟合点的局部密度分布,再根据点的密度差异之间的临界值,来区分数据集中数据点所处的密度区域;然后定义一个密度区分值,来赋予处于不同密度层的数据以不同的权重值,使得之后使用了谱聚类能更好的区分数据点之间的密度差异,最后使得谱聚类既能处理具有密度差异的数据类又能处理只有单一密度的谱聚类,便能较好的处理与所做假设不同的数据分布模式以及不同分布模式的混合。

2、在许多聚类解决方案中,谱聚类算法很容易实现,并且在非线性可分离数据中表现出强大的性能。虽然谱聚类在任意形状的聚类中都做的很好,尤其在重叠的数据中,但它在密度不均匀的数据中表现不佳,尤其是在两个不同密度的数据靠的较近时。

/>

技术本文档来自技高网...

【技术保护点】

1.一种基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,包括:

2.根据权利要求1所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤S1,具体包括:

3.根据权利要求2所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤S11中,使用kNN计算局部密度ρ的具体计算公式如下:

4.根据权利要求2所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤S12中,使用贝叶斯高斯混合模型拟合数据,并得到拟合数据的概率密度函数的具体计算公式如下:

5.根据权利要求1所述的基于贝叶斯混...

【技术特征摘要】

1.一种基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,包括:

2.根据权利要求1所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤s1,具体包括:

3.根据权利要求2所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤s11中,使用knn计算局部密度ρ的具体计算公式如下:

4.根据权利要求2所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步...

【专利技术属性】
技术研发人员:邓安生曹永霆
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1