当前位置: 首页 > 专利查询>深圳大学专利>正文

基于ArcGIS二次开发的线聚类提取方法及系统技术方案

技术编号:19965139 阅读:26 留言:0更新日期:2019-01-03 13:17
本发明专利技术公开一种基于ArcGIS二次开发的线聚类提取方法及系统。在基于第n条简单线和第m个搜索半径构成的两个缓冲区域内,统计与第n条简单线的相交角度小于或者等于预设角度,且与第n条简单线的长度差大于或者等于预设倍数的第m个搜索半径的简单线的数目,得到第m组第n个第一统计结果,m的取值依次为从1到M,n的取值依次为从1到N,根据统计学原理和第m组的N个第一统计结果计算得到具有显著性的第m个最小聚类结果,根据M个最小聚类结果和第m组的N个第一统计结果对N条简单线进行聚类统计,得到聚类结果集合。该线聚类提取方法及系统能解决ArcGIS空间分析工具缺少聚类工具的技术问题。

Line Clustering Extraction Method and System Based on ArcGIS Secondary Development

The invention discloses a line clustering extraction method and system based on secondary development of ArcGIS. In two buffer regions based on the n-th simple line and the m-th search radius, the number of simple lines whose intersection angle with the n-th simple line is less than or equal to the preset angle and whose length difference with the n-th simple line is greater or equal to the preset multiple is counted. The n-th first statistical result of the m-th group is obtained. The values of M are in turn from 1 to M, and the values of N depend on the values of M. The second is from 1 to N. According to the statistical principle and the N first statistical results of group m, the M smallest clustering result is obtained. According to the M smallest clustering result and the N first statistical results of group m, the N simple lines are clustered and the clustering result set is obtained. The line clustering extraction method and system can solve the technical problem of lack of clustering tools in ArcGIS spatial analysis tools.

【技术实现步骤摘要】
基于ArcGIS二次开发的线聚类提取方法及系统
本专利技术涉及起讫(Origin-Destination,OD)线处理领域,尤其涉及一种基于ArcGIS二次开发的线聚类提取方法及系统。
技术介绍
OD矩阵是用于战略规划和交通网络管理的最重要的信息来源之一。传统上,城市规划和交通工程依靠家庭调查问卷或每5-10年进行的普查和道路调查来开发OD矩阵估计方法。近年来,大数据和跟踪设施的改进使得可以为移动物体收集大量的旅行数据。然而,由于OD流量的大量交叉和重叠,在OD矩阵的先前研究中,基于对行政或交通空间单元的点统计,因为数据量增加而迅速变得难以辨认。功能完备的地理空间分析软件ArcGIS对于OD线的处理功能较弱,只有两种相关算法,一是线密度分析,二是OD矩阵计算或轨迹生成。前者根据格网的设置,去计算格网内OD线的长度作为OD线密度分析,其结果可解释性非常差。因为它统计的是一个虚拟的经过频次和长度,而非实际的路线。后者的OD矩阵计算,实现较为简单,但也只是增加了OD线的一些相关属性,并不能将其空间关系表达清楚,尤其是在对海量数据进行分析时。OD轨迹生成,在ArcGIS中实现也相对困难,如果研究问题关于交通分析,这种实际轨迹的提取非常重要。但是,如果我们关心的是空间联系或者特别关注的领域,比如找到联系最密切的就业和居住中心,那么OD线的聚类工具则更为重要,而这正是ArcGIS空间分析工具中所缺少的。
技术实现思路
本专利技术的主要目的在于提供一种线聚类提取方法及系统,可以解决现有技术中ArcGIS空间分析工具缺少聚类工具的技术问题。为实现上述目的,本专利技术第一方面提供一种基于ArcGIS二次开发的线聚类提取方法,其特征在于,所述方法应用在ArcGIS空间分析工具中,所述方法包括:步骤101,获取简单线数据集,并根据最小搜索半径的数值、半径增加量的数值和循环次数的数值,按照预设半径公式计算第m个搜索半径的数值,所述简单线数据集包括N条具有起点坐标和终点坐标的简单线,所述N为正整数,所述m的取值依次为从1到M,所述M为正整数;步骤102,在基于第n条简单线和第m个搜索半径构成的两个缓冲区域内,统计与所述第n条简单线的相交角度小于或者等于预设角度,且与所述第n条简单线的长度差大于或者等于预设倍数的第m个搜索半径的简单线的数目,得到第m组第n个第一统计结果,两个所述缓冲区域为以第n条简单线的起点坐标和终点坐标分别为圆心,以所述第m个搜索半径的数值为半径构成的,所述n的取值依次为从1到所述N;步骤103,根据统计学原理和第m组的N个所述第一统计结果计算得到具有显著性的第m个最小聚类结果;步骤104,根据M个最小聚类结果和第m组的N个所述第一统计结果对N条所述简单线进行聚类统计,得到聚类结果集合。为实现上述目的,本专利技术第二方面提供一种基于ArcGIS二次开发的线聚类提取系统,其特征在于,所述系统应用在ArcGIS空间分析工具中,所述系统包括:获取计算模块,用于获取简单线数据集,并根据最小搜索半径的数值、半径增加量的数值和循环次数的数值,按照预设半径公式计算第m个搜索半径的数值,所述简单线数据集包括N条具有起点坐标和终点坐标的简单线,所述N为正整数,所述m的取值依次为从1到M,所述M为正整数;第一统计模块,用于在基于第n条简单线和第m个搜索半径构成的两个缓冲区域内,统计与所述第n条简单线的相交角度小于或者等于预设角度,且与所述第n条简单线的长度差大于或者等于预设倍数的第m个搜索半径的简单线的数目,得到第m组第n个第一统计结果,两个所述缓冲区域为以第n条简单线的起点坐标和终点坐标分别为圆心,以所述第m个搜索半径的数值为半径构成的,所述n的取值依次为从1到所述N;计算模块,用于根据统计学原理和第m组的N个所述第一统计结果计算得到具有显著性的第m个最小聚类结果;聚类统计模块,用于根据M个最小聚类结果和第m组的N个所述第一统计结果对N条所述简单线进行聚类统计,得到聚类结果集合。本专利技术提供一种基于ArcGIS二次开发的线聚类提取方法及系统。该方法和系统在基于第n条简单线和第m个搜索半径构成的两个缓冲区域内,统计与第n条简单线的相交角度小于或者等于预设角度,且与第n条简单线的长度差大于或者等于预设倍数的第m个搜索半径的简单线的数目,得到第m组第n个第一统计结果,m的取值依次为从1到M,n的取值依次为从1到N,根据统计学原理和第m组的N个第一统计结果计算得到具有显著性的第m个最小聚类结果,根据M个最小聚类结果和第m组的N个第一统计结果对N条简单线进行聚类统计,得到聚类结果集合。将该线聚类提取方法及系统应用到ArcGIS空间分析工具中,能解决ArcGIS空间分析工具缺少聚类工具的技术问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术第一实施例中一种基于ArcGIS二次开发的线聚类提取方法的流程示意图;图2为本专利技术第一实施例中步骤103的细化步骤的流程示意图;图3为本专利技术第一实施例中步骤104的细化步骤的流程示意图;图4为本专利技术第一实施例中基于第n条简单线和第m个搜索半径构成的缓冲区域的示意图;图5为本专利技术第二实施例中一种基于ArcGIS二次开发的线聚类提取系统的结构示意图;图6为本专利技术第二实施例中计算模块203的细化模块的结构示意图;图7为本专利技术第二实施例中聚类统计模块204的细化模块的结构示意图。具体实施方式为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。由于现有技术中存在ArcGIS空间分析工具缺少聚类工具的技术问题。为了解决上述技术问题,本专利技术提出一种基于ArcGIS二次开发的线聚类提取方法及系统。该方法和系统在基于第n条简单线和第m个搜索半径构成的两个缓冲区域内,统计与第n条简单线的相交角度小于或者等于预设角度,且与第n条简单线的长度差大于或者等于预设倍数的第m个搜索半径的简单线的数目,得到第m组第n个第一统计结果,m的取值依次为从1到M,n的取值依次为从1到N,根据统计学原理和第m组的N个第一统计结果计算得到具有显著性的第m个最小聚类结果,根据M个最小聚类结果和第m组的N个第一统计结果对N条简单线进行聚类统计,得到聚类结果集合。将该线聚类提取方法及系统应用到ArcGIS空间分析工具中,能解决ArcGIS空间分析工具缺少聚类工具的技术问题。请参阅图1,为本专利技术第一实施例中一种基于ArcGIS二次开发的线聚类提取方法的流程示意图。具体的,该方法应用在ArcGIS空间分析工具中,该方法包括:步骤101,获取简单线数据集,并根据最小搜索半径的数值、半径增加量的数值和循环次数的数值,按照预设半径公式计算第m个搜索半径的数值,简单线数据集包括N条具有起点坐标和终本文档来自技高网...

【技术保护点】
1.一种基于ArcGIS二次开发的线聚类提取方法,其特征在于,所述方法应用在ArcGIS空间分析工具中,所述方法包括:步骤101,获取简单线数据集,并根据最小搜索半径的数值、半径增加量的数值和循环次数的数值,按照预设半径公式计算第m个搜索半径的数值,所述简单线数据集包括N条具有起点坐标和终点坐标的简单线,所述N为正整数,所述m的取值依次为从1到M,所述M为正整数;步骤102,在基于第n条简单线和所述第m个搜索半径构成的两个缓冲区域内,统计与所述第n条简单线的相交角度小于或者等于预设角度,且与所述第n条简单线的长度差大于或者等于预设倍数的所述第m个搜索半径的简单线的数目,得到第m组第n个第一统计结果,两个所述缓冲区域为以所述第n条简单线的起点坐标和终点坐标分别为圆心,以所述第m个搜索半径的数值为半径构成的,所述n的取值依次为从1到所述N;步骤103,根据统计学原理和第m组的N个所述第一统计结果计算得到具有显著性的第m个最小聚类结果;步骤104,根据M个最小聚类结果和第m组的N个所述第一统计结果对N条所述简单线进行聚类统计,得到聚类结果集合。

【技术特征摘要】
1.一种基于ArcGIS二次开发的线聚类提取方法,其特征在于,所述方法应用在ArcGIS空间分析工具中,所述方法包括:步骤101,获取简单线数据集,并根据最小搜索半径的数值、半径增加量的数值和循环次数的数值,按照预设半径公式计算第m个搜索半径的数值,所述简单线数据集包括N条具有起点坐标和终点坐标的简单线,所述N为正整数,所述m的取值依次为从1到M,所述M为正整数;步骤102,在基于第n条简单线和所述第m个搜索半径构成的两个缓冲区域内,统计与所述第n条简单线的相交角度小于或者等于预设角度,且与所述第n条简单线的长度差大于或者等于预设倍数的所述第m个搜索半径的简单线的数目,得到第m组第n个第一统计结果,两个所述缓冲区域为以所述第n条简单线的起点坐标和终点坐标分别为圆心,以所述第m个搜索半径的数值为半径构成的,所述n的取值依次为从1到所述N;步骤103,根据统计学原理和第m组的N个所述第一统计结果计算得到具有显著性的第m个最小聚类结果;步骤104,根据M个最小聚类结果和第m组的N个所述第一统计结果对N条所述简单线进行聚类统计,得到聚类结果集合。2.根据权利要求1所述的方法,其特征在于,所述步骤103的具体步骤包括:步骤1031,获取已配置的显著性水平值,并测试第m组中的N个所述第一统计结果形成的数据分布的分布状况;步骤1032,若第m组中的N个所述第一统计结果形成的数据分布满足正态分布,则基于所述显著性水平值按照正态分布公式计算得到第m个最小聚类结果;步骤1033,若第m组中的N个所述第一统计结果形成的数据分布满足帕累托分布,则基于所述显著性水平值按照帕累托公式计算得到第m个最小聚类结果。3.根据权利要求1所述的方法,其特征在于,所述步骤104的具体步骤包括:步骤1041,在基于未标记的第a条简单线和第b个搜索半径构成的两个缓冲区域内,统计起点坐标与终点坐标分别在两个缓冲区域内,与所述第a条简单线的相交角度小于或者等于预设角度,且与所述第a条简单线的长度差大于或者等于预设倍数的所述第b个搜索半径的未标记的简单线的数目,得到第b组第a个第二统计结果,所述a为正整数且取值依次为从1至A,所述A为所述简单线数据集中未标记的简单线的数值,其中,根据统计学原理和第m组的N个第一统计结果计算得到第m个最大聚类结果,从第1至第M个最大聚类结果中,查找第一个满足第c个最大聚类结果小于第c个最小聚类结果条件的第c个搜索半径,所述b的初始值为c-1,所述c取值1至所述M中的一个;步骤1042,从第b组A个所述第二统计结果中提取出数值最大的目标统计结果,判断所述目标统计结果是否大于第b个最小聚类结果;步骤1043,若所述目标统计结果大于所述第b个最小聚类结果,则记i=i+1,查询与所述目标统计结果对应的目标简单线,在基于所述目标简单线和所述第b个搜索半径构成的两个缓冲区域内,标记起点坐标与终点坐标分别在两个缓冲区域内,与所述目标简单线的相交角度小于或者等于预设角度,且与所述目标简单线的长度差大于或者等于预设倍数的所述第b个搜索半径的未标记的简单线及所述目标简单线,并记所述目标统计结果为第i个聚类结果,所述i的初始值为0;步骤1044,判断未标记的简单线的数值是否为0,若未标记的简单线的数值不为0,则返回执行所述步骤1041,若未标记的简单线的数值为0,则基于i个聚类结果得到聚类结果集合;步骤1045,若所述目标统计结果小于或等于所述第b个最小聚类结果,则当b大于1时,令b=b-1,返回执行所述步骤1041,当b小于或者等于1时,基于i个聚类结果得到聚类结果集合。4.根据权利要求1所述的方法,其特征在于,所述半径公式为:rm=r1+(i-1)Δr其中,rm表示所述第m个搜索半径,r1表示所述最小搜索半径,也表示第1个搜索半径,i表示所述循环次数,Δr表示所述半径增加量。5.根据权利要求2所述的方法,其特征在于,所述正态分布公式为:minlines=average(Nls)+r*SD(Nls)其中,minlines表示所述第m个最小聚类结果,average表示平均值函数,Nls表示第m组中的N个所述第一统计结果,r为与所述显著性水平值相关的参数,当所述显著性水平值为99%时,r取值为2.58,当所述显著性水平值为95%时,r取值为1.96,SD表示标准差函数;所述帕累托公式为:其中,p为与所述显著性水平值相关的参数,当所述显著性水平值为99%时,p取值为小于0.01,当所述显著性水平值为95%时,p取值为小于0.05,xm表示第所述m个最小聚类结果,x表示第m组中的N个所述第一统计结果,α表示回归系数,是一个正参数。6.一种基于ArcG...

【专利技术属性】
技术研发人员:辜智慧张艳
申请(专利权)人:深圳大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1