【技术实现步骤摘要】
一种全局时空加权协同定位商计算方法
[0001]本专利技术涉及计算机和GIS
,更具体地说,它涉及一种全局时空加权协同定位商计算方法。
技术介绍
[0002]点数据是城市大数据研究中的一种重要的数据形式,这种点数据包含有随时空变化的位置和类型或类别属性,如POI数据。和传统的面板数据不同,这些点数据是根据时间堆积在一起,数据之间的时间间隔以及空间位置都是变化的,同时,这些数据并不是数量数据而是描述性的数据或类型数据。因此,挖掘这类数据中蕴含的时空关联模式存在较大困难。传统的时空分析方法如时空地理加权,莫兰指数等都是处理数量数据,无法对这种类型数据进行分析。
[0003]另一方面,协同定位商在处理这种包含类型的时空数据方面具有独特的优势,同时它能捕捉到要素空间分布的对称和非对称信息,被广泛应用在犯罪分析,疾病分析等方面。协同定位商首先被提出用于分析不同人群的全局空间模式上,后来通过引入地理加权的方法,把协同定位商扩展到局部空间模式,以便于分析空间模式的异质性和自相关性,并引入统计显著性检验,进一步完善协同定位商的 ...
【技术保护点】
【技术特征摘要】
1.一种全局时空加权协同定位商计算方法,其特征在于,包括以下步骤:S1:数据预处理,对原始数据进行处理空值、处理类别、处理时间、分割数据和计算距离并排序;S2:计算全局协同定位商,在每一个类别下,遍历目标时刻中该类别所有数据点,即目标数据点,找到各点的指定个数的近邻数据点,即近邻点,根据近邻数据点的类别,计算目标数据点与指定个数的近邻点之间的协同定位商;所有类别遍历结束后,再计算目标数据中所有点的协同定位商,即全局协同定位商;S3:蒙特卡罗显著性检验,从预处理结束的时空数据集中,用分层抽样方式随机产生各时刻的数据,按步骤S2,计算本次随机数据的全局协同定位商,随机的次数由用户指定;然后计算所有随机得到的全局协同定位商的均值和标准差,与步骤S2计算得到的所有数据的全局协同定位商一起构造一个正态分布数据点,最后通过计算该正态分布的双边累积函数,得到验证的p值统计量。2.根据权利要求1所述的一种全局时空加权协同定位商计算方法,其特征在于,所述步骤S1的具体方法为:S101:处理空值:删除原始数据中存在空值的记录,得到无空值数据;S102:处理类别:对无空值数据中的类别进行编码,不同的类别名称采用不同的数字编码,得到类别已编码数据;S103:处理时间:将类别已编码数据按时间单位进行数字编码,让同一时间内发生的数据编码相同,其中数字编码按时间从小到大排序,得到时间和类别已编码数据;S104:分割数据:将时间和类别已编码数据分为不同子集,其中同一个子集内的时间编码相同,得到数据集合;S105:计算距离并排序:(1)利用矩阵,采用向量化方式计算两个时刻件所有点之间的距离,计算公式如下:h=sin(a/2).^2+cos(Lat1).*cos(Lat2).*sin(b/2).^2
ꢀꢀꢀ
(1)dist=2*R*asin(sqrt(h))
ꢀꢀꢀ
(2)其中,A点经纬度为(Lung1,Lat1),B点经纬度为(Lung2,Lat2);a为两点纬度之差且a=(Lat1
–
Lat2),b为两点经度之差且b=(Lung1
‑
Lung2),R为地球半径,dist为两点之间的欧式空间距离;(2)利用排序算法,对计算出的距离进行排序,并存储已排序的距离矩阵及索引矩阵,得到距离数据。3.根据权利要求1所述的一种全局时空加权协同定位商计算方法,其特征在于,所述步骤S2的具体方法为:S201:寻找近邻点:从目标时刻的数据点中选择指定类别中的一个点,即目标数据点,然后在所有时刻数据点中找到与该点距离较近的指定个数最近邻;实现时,将目标数据点与其它时刻前...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。