一种面向行为识别的密度适应性聚类方法技术

技术编号：15059185 阅读：128 留言：0更新日期：2017-04-06 08:57

本发明专利技术公开了一种面向行为识别的密度适应性聚类方法，涉及聚类分析技术领域，包括按照由高到低的次序，从最高密度阈值到最低密度阈值以此对给定数据集进行聚类分析。上一次的聚类过程产生的结果可以直接作为下一次的聚类过程的输入，并在当前密度阈值下对上一次的聚类结果进行必要的修正，从而实现了对不同密度数据簇的聚类。由于基本聚类算子采用基于密度的聚类方法，其聚类过程为典型的迭代扩展过程，因此可以克服基于距离算法只能发现类圆形的聚类簇的缺点，因此该方法对噪音数据不敏感，可自动排除噪音数据对聚类过程的影响，并且能发现任意形状的簇。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据识别
，尤其涉及一种面向行为识别的密度适应性聚类方法。
技术介绍
基于密度的聚类方法是基于聚类方法的一个重要分支，其主要通过度量区域中所包含的点的数量来进行聚类。经典的基于密度的聚类方法主要有DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)和OPSTICS(OrderingPointstoIdentifytheClusteringStructure)。传统的基于密度的算法的主要优点有以下三个方面。1.对噪音数据不敏感，可自动排除噪音数据对聚类过程的影响。2.能发现任意形状的簇。由于其聚类过程为典型的迭代扩展过程，因此可以克服基于距离算法只能发现类圆形的聚类簇的缺点。3.能发现任意数量的聚类簇，事先不需要知道聚类簇的个数。较为优良的聚类性能使其在科学研究及工程实践中均具有重要的应用意义。传统的基于密度的聚类算法使用全局唯一的密度参数(ε，MinPts)，因此当数据分布不均匀，即聚类簇间密度差异较大便可能出现一下两种状况：1.当密度参数设置的过低时可能会导致离的较近的多个簇被合并成一个簇。2.当密度参数设置的过高时，密度较低的簇则会被视为噪音数据。其上述不足限制了其应用范围。
技术实现思路
针对上述缺陷或不足，本专利技术提供一种面向行为识别的密度适应性聚类方法，能够通过输入最的最高密度阈值、最低密度阈值和密度...

【技术保护点】
一种面向行为识别的密度适应性聚类方法，其特征在于，包括以下步骤：1)设定密度层次及最高、最低密度阈值，并根据所设定的密度层次及最高、最低密度阈值计算各个层次上的密度阈值；2)将密度阈值从高到低进行排列，选取密度阈值中最高密度阈值对数据进行第一次聚类，产生聚类族；3)将剩余密度阈值重新从高到底进行排列，选取密度阈值中最高密度阈值对数据进行第i次聚类，产生聚类族；其中，第i次聚类过程产生的聚类簇，在后续聚类过程中只能被扩展而不能被分割或者合并到其他簇；满足当前密度阈值的新簇应该被优先提取以避免与被已存在的簇合并；4)重复步骤3)，直到根据所有的密度阈值将数据聚类完成，将所聚类的数据进行行为识别。

【技术特征摘要】
1.一种面向行为识别的密度适应性聚类方法，其特征在于，包括以下步
骤：
1)设定密度层次及最高、最低密度阈值，并根据所设定的密度层次及最
高、最低密度阈值计算各个层次上的密度阈值；
2)将密度阈值从高到低进行排列，选取密度阈值中最高密度阈值对数据
进行第一次聚类，产生聚类族；
3)将剩余密度阈值重新从高到底进行排列，选取密度阈值中最高密度阈
值对数据进行第i次聚类，产生聚类族；其中，第i次聚类过程产生的聚类
簇，在后续聚类过程中只能被扩展而不能被分割或者合并到其他簇；满足当
前密度阈值的新簇应该被优先提取以避免与被已存在的簇合并；
4)重复步骤3)，直到根据所有的密度阈值将数据聚类完成，将所聚类
的数据进行行为识别。
2.根据权利要求1所述的面向行为识别的密度适应性聚类方法，其特征
在于，所述步骤1)具体为：
设定密度层次DensityLevel、最低密度阈值(Epsl，MinPtsl)，最高密度
阈值(Epsh，MinP...

【专利技术属性】
技术研发人员：倪红波，王天本，周兴社，张大庆，王柱，贾江波，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人