The invention discloses a line clustering extraction method and system based on secondary development of ArcGIS. In two buffer regions based on the n-th simple line and the m-th search radius, the number of simple lines whose intersection angle with the n-th simple line is less than or equal to the preset angle and whose length difference with the n-th simple line is greater or equal to the preset multiple is counted. The n-th first statistical result of the m-th group is obtained. The values of M are in turn from 1 to M, and the values of N depend on the values of M. The second is from 1 to N. According to the statistical principle and the N first statistical results of group m, the M smallest clustering result is obtained. According to the M smallest clustering result and the N first statistical results of group m, the N simple lines are clustered and the clustering result set is obtained. The line clustering extraction method and system can solve the technical problem of lack of clustering tools in ArcGIS spatial analysis tools.
【技术实现步骤摘要】
基于ArcGIS二次开发的线聚类提取方法及系统
本专利技术涉及起讫(Origin-Destination,OD)线处理领域,尤其涉及一种基于ArcGIS二次开发的线聚类提取方法及系统。
技术介绍
OD矩阵是用于战略规划和交通网络管理的最重要的信息来源之一。传统上,城市规划和交通工程依靠家庭调查问卷或每5-10年进行的普查和道路调查来开发OD矩阵估计方法。近年来,大数据和跟踪设施的改进使得可以为移动物体收集大量的旅行数据。然而,由于OD流量的大量交叉和重叠,在OD矩阵的先前研究中,基于对行政或交通空间单元的点统计,因为数据量增加而迅速变得难以辨认。功能完备的地理空间分析软件ArcGIS对于OD线的处理功能较弱,只有两种相关算法,一是线密度分析,二是OD矩阵计算或轨迹生成。前者根据格网的设置,去计算格网内OD线的长度作为OD线密度分析,其结果可解释性非常差。因为它统计的是一个虚拟的经过频次和长度,而非实际的路线。后者的OD矩阵计算,实现较为简单,但也只是增加了OD线的一些相关属性,并不能将其空间关系表达清楚,尤其是在对海量数据进行分析时。OD轨迹生成,在ArcGIS中实现也相对困难,如果研究问题关于交通分析,这种实际轨迹的提取非常重要。但是,如果我们关心的是空间联系或者特别关注的领域,比如找到联系最密切的就业和居住中心,那么OD线的聚类工具则更为重要,而这正是ArcGIS空间分析工具中所缺少的。
技术实现思路
本专利技术的主要目的在于提供一种线聚类提取方法及系统,可以解决现有技术中ArcGIS空间分析工具缺少聚类工具的技术问题。为实现上述目的,本专利技术第一方面提 ...
【技术保护点】
1.一种基于ArcGIS二次开发的线聚类提取方法,其特征在于,所述方法应用在ArcGIS空间分析工具中,所述方法包括:步骤101,获取简单线数据集,并根据最小搜索半径的数值、半径增加量的数值和循环次数的数值,按照预设半径公式计算第m个搜索半径的数值,所述简单线数据集包括N条具有起点坐标和终点坐标的简单线,所述N为正整数,所述m的取值依次为从1到M,所述M为正整数;步骤102,在基于第n条简单线和所述第m个搜索半径构成的两个缓冲区域内,统计与所述第n条简单线的相交角度小于或者等于预设角度,且与所述第n条简单线的长度差大于或者等于预设倍数的所述第m个搜索半径的简单线的数目,得到第m组第n个第一统计结果,两个所述缓冲区域为以所述第n条简单线的起点坐标和终点坐标分别为圆心,以所述第m个搜索半径的数值为半径构成的,所述n的取值依次为从1到所述N;步骤103,根据统计学原理和第m组的N个所述第一统计结果计算得到具有显著性的第m个最小聚类结果;步骤104,根据M个最小聚类结果和第m组的N个所述第一统计结果对N条所述简单线进行聚类统计,得到聚类结果集合。
【技术特征摘要】
1.一种基于ArcGIS二次开发的线聚类提取方法,其特征在于,所述方法应用在ArcGIS空间分析工具中,所述方法包括:步骤101,获取简单线数据集,并根据最小搜索半径的数值、半径增加量的数值和循环次数的数值,按照预设半径公式计算第m个搜索半径的数值,所述简单线数据集包括N条具有起点坐标和终点坐标的简单线,所述N为正整数,所述m的取值依次为从1到M,所述M为正整数;步骤102,在基于第n条简单线和所述第m个搜索半径构成的两个缓冲区域内,统计与所述第n条简单线的相交角度小于或者等于预设角度,且与所述第n条简单线的长度差大于或者等于预设倍数的所述第m个搜索半径的简单线的数目,得到第m组第n个第一统计结果,两个所述缓冲区域为以所述第n条简单线的起点坐标和终点坐标分别为圆心,以所述第m个搜索半径的数值为半径构成的,所述n的取值依次为从1到所述N;步骤103,根据统计学原理和第m组的N个所述第一统计结果计算得到具有显著性的第m个最小聚类结果;步骤104,根据M个最小聚类结果和第m组的N个所述第一统计结果对N条所述简单线进行聚类统计,得到聚类结果集合。2.根据权利要求1所述的方法,其特征在于,所述步骤103的具体步骤包括:步骤1031,获取已配置的显著性水平值,并测试第m组中的N个所述第一统计结果形成的数据分布的分布状况;步骤1032,若第m组中的N个所述第一统计结果形成的数据分布满足正态分布,则基于所述显著性水平值按照正态分布公式计算得到第m个最小聚类结果;步骤1033,若第m组中的N个所述第一统计结果形成的数据分布满足帕累托分布,则基于所述显著性水平值按照帕累托公式计算得到第m个最小聚类结果。3.根据权利要求1所述的方法,其特征在于,所述步骤104的具体步骤包括:步骤1041,在基于未标记的第a条简单线和第b个搜索半径构成的两个缓冲区域内,统计起点坐标与终点坐标分别在两个缓冲区域内,与所述第a条简单线的相交角度小于或者等于预设角度,且与所述第a条简单线的长度差大于或者等于预设倍数的所述第b个搜索半径的未标记的简单线的数目,得到第b组第a个第二统计结果,所述a为正整数且取值依次为从1至A,所述A为所述简单线数据集中未标记的简单线的数值,其中,根据统计学原理和第m组的N个第一统计结果计算得到第m个最大聚类结果,从第1至第M个最大聚类结果中,查找第一个满足第c个最大聚类结果小于第c个最小聚类结果条件的第c个搜索半径,所述b的初始值为c-1,所述c取值1至所述M中的一个;步骤1042,从第b组A个所述第二统计结果中提取出数值最大的目标统计结果,判断所述目标统计结果是否大于第b个最小聚类结果;步骤1043,若所述目标统计结果大于所述第b个最小聚类结果,则记i=i+1,查询与所述目标统计结果对应的目标简单线,在基于所述目标简单线和所述第b个搜索半径构成的两个缓冲区域内,标记起点坐标与终点坐标分别在两个缓冲区域内,与所述目标简单线的相交角度小于或者等于预设角度,且与所述目标简单线的长度差大于或者等于预设倍数的所述第b个搜索半径的未标记的简单线及所述目标简单线,并记所述目标统计结果为第i个聚类结果,所述i的初始值为0;步骤1044,判断未标记的简单线的数值是否为0,若未标记的简单线的数值不为0,则返回执行所述步骤1041,若未标记的简单线的数值为0,则基于i个聚类结果得到聚类结果集合;步骤1045,若所述目标统计结果小于或等于所述第b个最小聚类结果,则当b大于1时,令b=b-1,返回执行所述步骤1041,当b小于或者等于1时,基于i个聚类结果得到聚类结果集合。4.根据权利要求1所述的方法,其特征在于,所述半径公式为:rm=r1+(i-1)Δr其中,rm表示所述第m个搜索半径,r1表示所述最小搜索半径,也表示第1个搜索半径,i表示所述循环次数,Δr表示所述半径增加量。5.根据权利要求2所述的方法,其特征在于,所述正态分布公式为:minlines=average(Nls)+r*SD(Nls)其中,minlines表示所述第m个最小聚类结果,average表示平均值函数,Nls表示第m组中的N个所述第一统计结果,r为与所述显著性水平值相关的参数,当所述显著性水平值为99%时,r取值为2.58,当所述显著性水平值为95%时,r取值为1.96,SD表示标准差函数;所述帕累托公式为:其中,p为与所述显著性水平值相关的参数,当所述显著性水平值为99%时,p取值为小于0.01,当所述显著性水平值为95%时,p取值为小于0.05,xm表示第所述m个最小聚类结果,x表示第m组中的N个所述第一统计结果,α表示回归系数,是一个正参数。6.一种基于ArcG...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。