一种基于GACUC和Delaunay三角网的空间聚类方法技术

技术编号：10423344 阅读：81 留言：0更新日期：2014-09-12 14:04

本发明专利技术公开了一种基于GACUC和Delaunay三角网的空间聚类方法，空间聚类方法从空间数据的空间属性和非空间属性两种特性进行聚类，使每个聚类簇内的空间要素之间具有非空间属性的最大相似性，且具有空间要素的空间可达性。采用GACUC（贪心凝聚分类效用聚类方法）进行非空间属性聚类，支持非数字类型属性项的非空间属性聚类，扩大了聚类方法的应用范围，同时，基于Delaunay三角网来进行空间属性的聚类，实现了空间数据的非空间属性和空间属性这两个固有属性的聚类，更为准确地挖掘出各空间要素之间的关联关系和分布规律。本发明专利技术技术实现方法简单，采用计算机自动处理，节约了数据处理分析时间，提高了聚类结果的准确性和可用性，在空间数据挖掘领域应用前景非常广泛。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GACUC和Delaunay三角网的空间聚类方法
本专利技术属于空间数据挖掘研究领域。尤其涉及一种基于GACUC和Delaunay三角网的空间聚类方法。
技术介绍
空间聚类方法是空间数据挖掘研究领域一种最为活跃的技术方法，目前已被广泛应用于地理信息科学、传染病学、生物学以及经济学等诸多研究领域，并产生了良好的社会效益和经济效益。空间聚类就是根据一定的划分规则，将空间数据库中的空间要素划分为若干个具有现实意义的聚类簇，使得每一个聚类簇内的空间要素之间具有最大的相似度，而聚类簇之间具有最大的区别。目前，常用的聚类方法包括基于划分的聚类方法、基于层次的聚类方法、基于密度的聚类方法、基于网格的聚类方法以及基于模型的聚类方法。对上述几种空间聚类方法分析可知，这些方法基本都只采用空间属性之间的欧式距离或非空间属性之间的闵氏距离进行相似度计算。前者忽略了空间要素之间非空间属性的相似性，而后者则忽略了空间要素之间的空间可达性。近年来，为了克服上述聚类方法的不足，也有不少学者从空间要素的空间属性和非空间属性进行综合考虑，提出了不同的聚类方法。李光强等学者从空间要素之间空间欧式距离和非空间闵氏距离的可达性这两个方面对聚类进行约束，提出了一种基于双重距离的空间聚类方法，方法虽然解决了上述聚类方法的不足，但该方法只能支持属性值为数字类型非空间属性，实际应用范围不大。焦利民等学者对空间和属性双重约束下的空间要素聚类进行了研究，通过设置属性距离和空间距离的阈值来对空间要素进行划分，但不同的阈值对聚类结果将产生重要的影响，且该方法也无法对聚类结果的聚类效用进行评价，因此，该方法...
一种基于GACUC和Delaunay三角网的空间聚类方法

【技术保护点】
一种基于GACUC和Delaunay三角网的空间聚类方法，其特征在于包括如下步骤： 1)设置分类效用函数CU，初始化属性聚类的个数为k；多次重复选择k个初始中心，分别计算分类效用函数CU的值，根据“分类效用函数CU的值越大，聚类效果越好”的原则，确定k个属性聚类初始中心； 2)计算每个空间要素归入各个属性聚类初始中心时其分类效用函数CU的值，对这些分类效用函数CU的值进行比较，将该空间要素与分类效用函数CU值最大的初始中心聚为一类；遍历所有待聚类的空间要素，直至每个空间要素都完成聚类； 3)优化步骤2)的属性聚类结果，对聚类簇中的空间要素进行调整，使得最终形成的空间要素属性聚类结果其分类效用函数CU的值最大； 4)根据聚类簇中每一个空间要素的空间坐标位置，利用逐点插入法构建Delaunay三角网，并生成每一个空间要素的空间可达性关系表；根据各个空间要素的空间可达性关系表确定空间要素之间的空间可达性和连续空间可达性； 5)基于深度优先算法对步骤3)生成的每个聚类簇进行遍历，将每个聚类簇中具有连续空间可达性的空间要素聚为一类，即完成属性聚类基础上的二次空间聚类，确保最终生成的每一个聚类簇中...

【技术特征摘要】
1.一种基于GACUC和Delaunay三角网的空间聚类方法，其特征在于包括如下步骤：1)设置分类效用函数CU，初始化属性聚类的个数为k；多次重复选择k个初始中心，分别计算分类效用函数CU的值，根据“分类效用函数CU的值越大，聚类效果越好”的原则，确定k个属性聚类初始中心；2)计算每个空间要素归入各个属性聚类初始中心时其分类效用函数CU的值，对这些分类效用函数CU的值进行比较，将该空间要素与分类效用函数CU值最大的初始中心聚为一类；遍历所有待聚类的空间要素，直至每个空间要素都完成聚类；3)优化步骤2)的属性聚类结果，对聚类簇中的空间要素进行调整，使得最终形成的空间要素属性聚类结果其分类效用函数CU的值最大；4)根据聚类簇中每一个空间要素的空间坐标位置，利用逐点插入法构建Delaunay三角网，并生成每一个空间要素的空间可达性关系表；根据各个空间要素的空间可达性关系表确定空间要素之间的空间可达性和连续空间可达性；5)基于深度优先算法对步骤3)生成的每个聚类簇进行遍历，将每个聚类簇中具有连续空间可达性的空间要素聚为一类，即完成属性聚类基础上的二次空间聚类，确保最终生成的每一个聚类簇中各个空间要素之间均具有最大属性相似性和空间可达性。2.根据权利要求1所述的一种基于GACUC和Delaunay三角网的空间聚类方法，其特征在于所述的步骤1)包括：2.1设置属性聚类的个数为k，循环次数为m，初始化索引i＝0；设置分类效用函数CU，并初始化bestCU＝0.0；2.2随机选择k个初始聚类中心，计算分类效用函数CU的值，得到newCU，i增加1；2.3比较分类效用函数CU的值newCU和bestCU，如果newCU>bestCU，则将这k个初始中心设置为初始聚类中心，并且bestCU＝newCU，否则初始中心保持不变；2.4比较i和m，如果i<m，返回步骤2.2；否则，循环结束，返回k个属性聚类的初始中心。3.根据权利要求1所述的一种基于GACUC和Delaunay三角网的空间聚类方法，其特征在于所述的步骤2)包括：3.1遍历所有空间要素，选择尚未进行聚类的空间要素a；3.2判断空间要素a是否存在，如果存在，使用公式(1)，计算该空间要素归入每个聚类簇后的分类效用函数CU的值，比较这k个分类效用函数CU的值，将该空间要素归入产生最大分类效用函数CU值的聚类簇中，返回步骤3.1；否则，进入步骤3.3；3.3得到初始聚类结果。4.根据权利要求1所述...

【专利技术属性】
技术研发人员：刘仁义，杜震洪，张丰，张逸然，徐聪，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人