【技术实现步骤摘要】
本专利技术涉及谱聚类,具体而言,尤其涉及一种基于贝叶斯混合和相似互近邻的多密度谱聚类方法。
技术介绍
1、谱聚类在处理高维数据聚类时的复杂度比传统聚类算法好但也无法处理密度不均匀的数据等等。大多数聚类方法可能无法很好地处理与所做假设不同的数据分布模式以及不同分布模式的混合。而强自适应贝叶斯高斯混合模型和谱聚类融合的多密度聚类,使用贝叶斯高斯混合模型来拟合点的局部密度分布,再根据点的密度差异之间的临界值,来区分数据集中数据点所处的密度区域;然后定义一个密度区分值,来赋予处于不同密度层的数据以不同的权重值,使得之后使用了谱聚类能更好的区分数据点之间的密度差异,最后使得谱聚类既能处理具有密度差异的数据类又能处理只有单一密度的谱聚类,便能较好的处理与所做假设不同的数据分布模式以及不同分布模式的混合。
2、在许多聚类解决方案中,谱聚类算法很容易实现,并且在非线性可分离数据中表现出强大的性能。虽然谱聚类在任意形状的聚类中都做的很好,尤其在重叠的数据中,但它在密度不均匀的数据中表现不佳,尤其是在两个不同密度的数据靠的较近时。
/>技术本文档来自技高网...
【技术保护点】
1.一种基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,包括:
2.根据权利要求1所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤S1,具体包括:
3.根据权利要求2所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤S11中,使用kNN计算局部密度ρ的具体计算公式如下:
4.根据权利要求2所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤S12中,使用贝叶斯高斯混合模型拟合数据,并得到拟合数据的概率密度函数的具体计算公式如下:
5.根据权利要求
...【技术特征摘要】
1.一种基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,包括:
2.根据权利要求1所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤s1,具体包括:
3.根据权利要求2所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步骤s11中,使用knn计算局部密度ρ的具体计算公式如下:
4.根据权利要求2所述的基于贝叶斯混合和相似互近邻的多密度谱聚类方法,其特征在于,所述步...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。