当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于GACUC和Delaunay三角网的空间聚类方法技术

技术编号:10423344 阅读:81 留言:0更新日期:2014-09-12 14:04
本发明专利技术公开了一种基于GACUC和Delaunay三角网的空间聚类方法,空间聚类方法从空间数据的空间属性和非空间属性两种特性进行聚类,使每个聚类簇内的空间要素之间具有非空间属性的最大相似性,且具有空间要素的空间可达性。采用GACUC(贪心凝聚分类效用聚类方法)进行非空间属性聚类,支持非数字类型属性项的非空间属性聚类,扩大了聚类方法的应用范围,同时,基于Delaunay三角网来进行空间属性的聚类,实现了空间数据的非空间属性和空间属性这两个固有属性的聚类,更为准确地挖掘出各空间要素之间的关联关系和分布规律。本发明专利技术技术实现方法简单,采用计算机自动处理,节约了数据处理分析时间,提高了聚类结果的准确性和可用性,在空间数据挖掘领域应用前景非常广泛。

【技术实现步骤摘要】
一种基于GACUC和Delaunay三角网的空间聚类方法
本专利技术属于空间数据挖掘研究领域。尤其涉及一种基于GACUC和Delaunay三角网的空间聚类方法。
技术介绍
空间聚类方法是空间数据挖掘研究领域一种最为活跃的技术方法,目前已被广泛应用于地理信息科学、传染病学、生物学以及经济学等诸多研究领域,并产生了良好的社会效益和经济效益。空间聚类就是根据一定的划分规则,将空间数据库中的空间要素划分为若干个具有现实意义的聚类簇,使得每一个聚类簇内的空间要素之间具有最大的相似度,而聚类簇之间具有最大的区别。目前,常用的聚类方法包括基于划分的聚类方法、基于层次的聚类方法、基于密度的聚类方法、基于网格的聚类方法以及基于模型的聚类方法。对上述几种空间聚类方法分析可知,这些方法基本都只采用空间属性之间的欧式距离或非空间属性之间的闵氏距离进行相似度计算。前者忽略了空间要素之间非空间属性的相似性,而后者则忽略了空间要素之间的空间可达性。近年来,为了克服上述聚类方法的不足,也有不少学者从空间要素的空间属性和非空间属性进行综合考虑,提出了不同的聚类方法。李光强等学者从空间要素之间空间欧式距离和非空间闵氏距离的可达性这两个方面对聚类进行约束,提出了一种基于双重距离的空间聚类方法,方法虽然解决了上述聚类方法的不足,但该方法只能支持属性值为数字类型非空间属性,实际应用范围不大。焦利民等学者对空间和属性双重约束下的空间要素聚类进行了研究,通过设置属性距离和空间距离的阈值来对空间要素进行划分,但不同的阈值对聚类结果将产生重要的影响,且该方法也无法对聚类结果的聚类效用进行评价,因此,该方法可应用性不强。在此背景下,面对当前海量的空间数据,现有的空间聚类方法不仅没有有效的聚类效用评价方法,而且应用范围受到属性值的约束,因此,目前常用的聚类方法均不能很好解决空间数据的聚类问题,而且聚类效果不佳。
技术实现思路
本专利技术的目的是克服现有技术的不足,提供了一种基于GACUC和Delaunay三角网的空间聚类方法。本专利技术的技术方案如下:基于GACUC和Delaunay三角网的空间聚类方法包括如下步骤:1)设置分类效用函数CU,初始化属性聚类的个数为k;多次重复选择k个初始中心,分别计算分类效用函数CU的值,根据“分类效用函数CU的值越大,聚类效果越好”的原则,确定k个属性聚类初始中心;2)计算每个空间要素归入各个属性聚类初始中心时其分类效用函数CU的值,对这些分类效用函数CU的值进行比较,将该空间要素与分类效用函数CU值最大的初始中心聚为一类;遍历所有待聚类的空间要素,直至每个空间要素都完成聚类;3)优化步骤2)的属性聚类结果,对聚类簇中的空间要素进行调整,使得最终形成的空间要素属性聚类结果其分类效用函数CU的值最大;4)根据聚类簇中每一个空间要素的空间坐标位置,利用逐点插入法构建Delaunay三角网,并生成每一个空间要素的空间可达性关系表;根据各个空间要素的空间可达性关系表确定空间要素之间的空间可达性和连续空间可达性;5)基于深度优先算法对步骤3)生成的每个聚类簇进行遍历,将每个聚类簇中具有连续空间可达性的空间要素聚为一类,即完成属性聚类基础上的二次空间聚类,确保最终生成的每一个聚类簇中各个空间要素之间均具有最大属性相似性和空间可达性。所述的步骤1)包括:2.1设置属性聚类的个数为k,循环次数为m,初始化索引i=0;设置分类效用函数CU,并初始化bestCU=0.0;2.2随机选择k个初始聚类中心,计算分类效用函数CU的值,得到newCU,i增加1;2.3比较分类效用函数CU的值newCU和bestCU,如果newCU>bestCU,则将这k个初始中心设置为初始聚类中心,并且bestCU=newCU,否则初始中心保持不变;2.4比较i和m,如果i<m,返回步骤2.2;否则,循环结束,返回k个属性聚类的初始中心。所述的步骤2)包括:3.1遍历所有空间要素,选择尚未进行聚类的空间要素a;3.2判断空间要素a是否存在,如果存在,使用公式(1),计算该空间要素归入每个聚类簇后的分类效用函数CU的值,比较这k个分类效用函数CU的值,将该空间要素归入产生最大分类效用函数CU值的聚类簇中,返回步骤3.1;否则,进入步骤3.3;3.3得到初始聚类结果。所述的步骤3)包括:4.1设置循环次数为n;4.2在任一聚类簇A中,随机选择一个空间要素b;4.3随机选择不同于聚类簇A的聚类簇B,将空间要素b置换到聚类簇B,使用公式(1),计算置换后的分类效用函数CU的值,得到newCU,如果newCU>oldCU,则保留本次置换,否则,撤销本次置换,返回原来的聚类簇中;4.4循环n次步骤4.1和步骤4.2,最终生成k个聚类簇:cluster1、cluster2、……、clusterX、……、clusterk,X=1、2、……、k。所述的步骤4)包括:5.1定义空间要素的空间坐标为(x,y),遍历所有空间要素,从y值最小的空间要素开始,根据“凸多边形的各顶点必须在该多边形的任意一条边的同一侧”原理,找出最外部的凸多边形,从y值最小的空间要素向凸多边形的其他每个顶点连线,获得最初的三角形集合,保存到三角形链表中,并更新其空间可达性关系表,形成初始三角网;5.2依次选取独立点,即未构入Delaunay三角网的点,确定其外包三角形,连接该点至外包三角形各顶点,形成新的三角形,将新生成的三角形插入三角形链表中,并更新其空间可达性关系表;5.3重复步骤5.2,当所有点插入结束后,Delaunay三角网生成完毕,各个空间要素的空间可达性关系表生成;5.4定义空间可达性和连续空间可达性;空间可达性:如果两个空间要素在三角网中属于一条边的两个顶点,则称这两个空间要素具有空间可达性;连续空间可达性:如果空间要素a1和空间要素a2具有空间可达性,空间要素a2和空间要素a3具有空间可达性,则称空间要素a1和空间要素a3具有连续空间可达性。所述的步骤5)包括:6.1定义空间要素的空间坐标为(x,y);6.2随机选取未进行空间聚类的clusterX,X=1、2、……、k;6.3在clusterX中选择未进行空间聚类且x值最小的空间要素c;6.4对于空间要素c,根据深度优先算法,在空间可达性关系表中查找cluster1中和空间要素c具有连续空间可达性的空间要素,将其归为一类;如果没有找到符合条件的空间要素,则空间要素c自成一类;6.5循环步骤6.3和步骤6.4,直到clusterX中所有空间要素全部完成空间聚类;6.6循环步骤6.2至步骤6.5,直到步骤3)中所产生的k个聚类簇全部完成二次空间聚类;6.7得到最终的空间聚类结果,每个聚类簇中各个空间要素之间具有最大非空间属性的相似性和空间可达性。本专利技术与现有技术相比具有的有益效果:1)本专利技术针对现有空间聚类方法缺少有效的聚类效用评价方法的不足,采用聚类效用函数CU对非空间属性聚类结果进行评价,以确保非空间属性最佳的聚类结果。2)本专利技术支持非数值类型属性项进行非空间属性聚类,减少了非空间属性聚类的约束条件,扩大了本专利技术的应用范围。3)本专利技术技术实现方法简单,可操作性强,执行效率高。附图说明图1为本专利技术中聚类算法的流程图;图2为本发本文档来自技高网
...
一种基于GACUC和Delaunay三角网的空间聚类方法

【技术保护点】
一种基于GACUC和Delaunay三角网的空间聚类方法,其特征在于包括如下步骤: 1)设置分类效用函数CU,初始化属性聚类的个数为k;多次重复选择k个初始中心,分别计算分类效用函数CU的值,根据“分类效用函数CU的值越大,聚类效果越好”的原则,确定k个属性聚类初始中心; 2)计算每个空间要素归入各个属性聚类初始中心时其分类效用函数CU的值,对这些分类效用函数CU的值进行比较,将该空间要素与分类效用函数CU值最大的初始中心聚为一类;遍历所有待聚类的空间要素,直至每个空间要素都完成聚类; 3)优化步骤2)的属性聚类结果,对聚类簇中的空间要素进行调整,使得最终形成的空间要素属性聚类结果其分类效用函数CU的值最大; 4)根据聚类簇中每一个空间要素的空间坐标位置,利用逐点插入法构建Delaunay三角网,并生成每一个空间要素的空间可达性关系表;根据各个空间要素的空间可达性关系表确定空间要素之间的空间可达性和连续空间可达性; 5)基于深度优先算法对步骤3)生成的每个聚类簇进行遍历,将每个聚类簇中具有连续空间可达性的空间要素聚为一类,即完成属性聚类基础上的二次空间聚类,确保最终生成的每一个聚类簇中各个空间要素之间均具有最大属性相似性和空间可达性。...

【技术特征摘要】
1.一种基于GACUC和Delaunay三角网的空间聚类方法,其特征在于包括如下步骤:1)设置分类效用函数CU,初始化属性聚类的个数为k;多次重复选择k个初始中心,分别计算分类效用函数CU的值,根据“分类效用函数CU的值越大,聚类效果越好”的原则,确定k个属性聚类初始中心;2)计算每个空间要素归入各个属性聚类初始中心时其分类效用函数CU的值,对这些分类效用函数CU的值进行比较,将该空间要素与分类效用函数CU值最大的初始中心聚为一类;遍历所有待聚类的空间要素,直至每个空间要素都完成聚类;3)优化步骤2)的属性聚类结果,对聚类簇中的空间要素进行调整,使得最终形成的空间要素属性聚类结果其分类效用函数CU的值最大;4)根据聚类簇中每一个空间要素的空间坐标位置,利用逐点插入法构建Delaunay三角网,并生成每一个空间要素的空间可达性关系表;根据各个空间要素的空间可达性关系表确定空间要素之间的空间可达性和连续空间可达性;5)基于深度优先算法对步骤3)生成的每个聚类簇进行遍历,将每个聚类簇中具有连续空间可达性的空间要素聚为一类,即完成属性聚类基础上的二次空间聚类,确保最终生成的每一个聚类簇中各个空间要素之间均具有最大属性相似性和空间可达性。2.根据权利要求1所述的一种基于GACUC和Delaunay三角网的空间聚类方法,其特征在于所述的步骤1)包括:2.1设置属性聚类的个数为k,循环次数为m,初始化索引i=0;设置分类效用函数CU,并初始化bestCU=0.0;2.2随机选择k个初始聚类中心,计算分类效用函数CU的值,得到newCU,i增加1;2.3比较分类效用函数CU的值newCU和bestCU,如果newCU>bestCU,则将这k个初始中心设置为初始聚类中心,并且bestCU=newCU,否则初始中心保持不变;2.4比较i和m,如果i<m,返回步骤2.2;否则,循环结束,返回k个属性聚类的初始中心。3.根据权利要求1所述的一种基于GACUC和Delaunay三角网的空间聚类方法,其特征在于所述的步骤2)包括:3.1遍历所有空间要素,选择尚未进行聚类的空间要素a;3.2判断空间要素a是否存在,如果存在,使用公式(1),计算该空间要素归入每个聚类簇后的分类效用函数CU的值,比较这k个分类效用函数CU的值,将该空间要素归入产生最大分类效用函数CU值的聚类簇中,返回步骤3.1;否则,进入步骤3.3;3.3得到初始聚类结果。4.根据权利要求1所述...

【专利技术属性】
技术研发人员:刘仁义杜震洪张丰张逸然徐聪
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1