一种全局时空加权协同定位商计算方法技术

技术编号:33631566 阅读:21 留言:0更新日期:2022-06-02 01:36
本发明专利技术涉及计算机和GIS技术领域,公开了一种全局时空加权协同定位商计算方法,本方法首先对数据进行预处理,解决数据中空值问题,将类别进行编号,把时间编码并按时间分割数据,为后面计算协定位商加入时间因素作基础;采用向量化方式计算不同时间数据之间的距离,节省了循环遍历所需的大量时间;对距离进行排序,为后面近邻计算做基础;然后采用带时间权重的全局协同定位商计算方法,计算全局协同定位商;最后采用蒙特卡罗方法进行验证。另外,针对不平衡时间比例尺问题,本发明专利技术采用了分层计算时空权重的方法,大大减少了距离矩阵的计算量。量。量。

【技术实现步骤摘要】
一种全局时空加权协同定位商计算方法


[0001]本专利技术涉及计算机和GIS
,更具体地说,它涉及一种全局时空加权协同定位商计算方法。

技术介绍

[0002]点数据是城市大数据研究中的一种重要的数据形式,这种点数据包含有随时空变化的位置和类型或类别属性,如POI数据。和传统的面板数据不同,这些点数据是根据时间堆积在一起,数据之间的时间间隔以及空间位置都是变化的,同时,这些数据并不是数量数据而是描述性的数据或类型数据。因此,挖掘这类数据中蕴含的时空关联模式存在较大困难。传统的时空分析方法如时空地理加权,莫兰指数等都是处理数量数据,无法对这种类型数据进行分析。
[0003]另一方面,协同定位商在处理这种包含类型的时空数据方面具有独特的优势,同时它能捕捉到要素空间分布的对称和非对称信息,被广泛应用在犯罪分析,疾病分析等方面。协同定位商首先被提出用于分析不同人群的全局空间模式上,后来通过引入地理加权的方法,把协同定位商扩展到局部空间模式,以便于分析空间模式的异质性和自相关性,并引入统计显著性检验,进一步完善协同定位商的理论体系。然而,传统的协同定位商分析的是类型数据空间关联作用,忽略了时间对事件的影响效应,无法充分挖掘时空数据中存在的有效信息,且由于时空数据具有空间多向性和时间单向性,会产生不对称时间尺度问题,所挖掘的自相关关系会发生变化或者减弱。
[0004]因此,需要构造一个能够处理时空数据的协同定位商的计算方法,能充分考虑空间和时间的变化效应。

技术实现思路

[0005]为了克服现有技术中所存在的上述缺陷,本专利技术提供了一种全局时空加权协同定位商计算方法,对时空数据的挖掘更全面,在消除传统双向时间效应的计算误差的同时减少了不对称时间尺度对相关关系的影响,且时空权重矩阵采用向量点积的计算方式,大大减少了计算成本,并引入蒙特卡洛显著性检验,使结果具有更高的可信度。
[0006]本专利技术的上述技术目的是通过以下技术方案得以实现的:一种全局时空加权协同定位商计算方法,包括以下步骤:
[0007]S1:数据预处理,对原始数据进行处理空值、处理类别、处理时间、分割数据和计算距离并排序;
[0008]S2:计算全局协同定位商,在每一个类别下,遍历目标时刻中该类别所有数据点,即目标数据点,找到各点的指定个数的近邻数据点,即近邻点,根据近邻数据点的类别,计算目标数据点与指定个数的近邻点之间的协同定位商;所有类别遍历结束后,再计算目标数据中所有点的协同定位商,即全局协同定位商;
[0009]S3:蒙特卡罗显著性检验,从预处理结束的时空数据集中,用分层抽样方式随机产
生各时刻的数据,按步骤S2,计算本次随机数据的全局协同定位商,随机的次数由用户指定;然后计算所有随机得到的全局协同定位商的均值和标准差,与步骤S2计算得到的所有数据的全局协同定位商一起构造一个正态分布数据点,最后通过计算该正态分布的双边累积函数,得到验证的p值统计量。
[0010]通过采用上述技术方案,首先对原始数据进行预处理,其中原始数据包括类别、时间和经纬度信息,解决数据中空值问题,将类别进行编号,将时间编码并按时间分割数据,为后面计算协定位商加入时间因素作基础;计算不同时间数据之间的距离,对距离进行排序,为后面近邻计算做基础;然后采用带时间权重的全局协同定位商计算方法,计算全局协同定位商;最后采用蒙特卡罗方法进行验证。
[0011]进一步的,所述步骤S1的具体方法为:
[0012]S101:处理空值:删除原始数据中存在空值的记录,得到无空值数据;
[0013]S102:处理类别:对无空值数据中的类别进行编码,不同的类别名称采用不同的数字编码,得到类别已编码数据;
[0014]S103:处理时间:将类别已编码数据按时间单位进行数字编码,让同一时间内发生的数据编码相同,其中数字编码按时间从小到大排序,得到时间和类别已编码数据;
[0015]S104:分割数据:将时间和类别已编码数据分为不同子集,其中同一个子集内的时间编码相同,得到数据集合;
[0016]S105:计算距离并排序:
[0017](1)利用矩阵,采用向量化方式计算两个时刻件所有点之间的距离,计算公式如下:
[0018]h=sin(a/2).^2+cos(Lat1).*cos(Lat2).*sin(b/2).^2
ꢀꢀꢀꢀꢀ
(1)
[0019]dist=2*R*asin(sqrt(h))
ꢀꢀꢀꢀꢀꢀꢀ
(2)
[0020]其中,A点经纬度为(Lung1,Lat1),B点经纬度为(Lung2,Lat2);a为两点纬度之差且a=(Lat1

Lat2),b为两点经度之差且b=(Lung1

Lung2),R为地球半径,dist为两点之间的欧式空间距离;
[0021](2)利用排序算法,对计算出的距离进行排序,并存储已排序的距离矩阵及索引矩阵,得到距离数据。
[0022]通过采用上述技术方案,在计算不同时间数据之间的距离时,采用向量化方式,节省了循环遍历所需的大量时间。
[0023]进一步的,所述步骤S2的具体方法为:
[0024]S201:寻找近邻点:从目标时刻的数据点中选择指定类别中的一个点,即目标数据点,然后在所有时刻数据点中找到与该点距离较近的指定个数最近邻;实现时,将目标数据点与其它时刻前指定个数的数据点之间的距离拼接在一起,再按从小到大的顺序重新排序,取出指定个数的数据点,得到领域集合;
[0025]S202:计算单点协位商权值:根据近邻点所在时刻,设a,b分别代表目标点与邻近点数据的类别,利用以下三种不同密度函数中的一种,计算协位商权值:
[0026](4)盒状密度函数
[0027][0028](5)高斯密度函数
[0029]P(b|a)=exp(

0.5dist2/bandWidth2)*g(t) (4)
[0030](6)反距离密度函数
[0031][0032]以上公式中,dist是目标点与近邻点之间的欧式空间距离,t是目标点与近邻点之间的时间距离,g是关于时间t的函数,时间距离t越大,g(t)的取值越小,表示作用越小;
[0033]S203:计算全局协位商GWTCLQ
a<

b
,计算公式如下:
[0034][0035]其中,allnum为所有时间的数据点个数,aNum为所有时间类别为a的数据点个数,sum_b_a为步骤S202中所有计算的目标点为a类并且近邻点为b类的P(b|a)相加,sum_a为步骤S202中所有计算的目标点为a类的P(b|a)相加。
[0036]通过采用上述技术方案,与现有技术相比,其优势如下:
[0037](1)与传统的时间效应计算方法不同,基于时空的全局协位商定义了时间的单向性,消除了传统双向时间效应的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种全局时空加权协同定位商计算方法,其特征在于,包括以下步骤:S1:数据预处理,对原始数据进行处理空值、处理类别、处理时间、分割数据和计算距离并排序;S2:计算全局协同定位商,在每一个类别下,遍历目标时刻中该类别所有数据点,即目标数据点,找到各点的指定个数的近邻数据点,即近邻点,根据近邻数据点的类别,计算目标数据点与指定个数的近邻点之间的协同定位商;所有类别遍历结束后,再计算目标数据中所有点的协同定位商,即全局协同定位商;S3:蒙特卡罗显著性检验,从预处理结束的时空数据集中,用分层抽样方式随机产生各时刻的数据,按步骤S2,计算本次随机数据的全局协同定位商,随机的次数由用户指定;然后计算所有随机得到的全局协同定位商的均值和标准差,与步骤S2计算得到的所有数据的全局协同定位商一起构造一个正态分布数据点,最后通过计算该正态分布的双边累积函数,得到验证的p值统计量。2.根据权利要求1所述的一种全局时空加权协同定位商计算方法,其特征在于,所述步骤S1的具体方法为:S101:处理空值:删除原始数据中存在空值的记录,得到无空值数据;S102:处理类别:对无空值数据中的类别进行编码,不同的类别名称采用不同的数字编码,得到类别已编码数据;S103:处理时间:将类别已编码数据按时间单位进行数字编码,让同一时间内发生的数据编码相同,其中数字编码按时间从小到大排序,得到时间和类别已编码数据;S104:分割数据:将时间和类别已编码数据分为不同子集,其中同一个子集内的时间编码相同,得到数据集合;S105:计算距离并排序:(1)利用矩阵,采用向量化方式计算两个时刻件所有点之间的距离,计算公式如下:h=sin(a/2).^2+cos(Lat1).*cos(Lat2).*sin(b/2).^2
ꢀꢀꢀ
(1)dist=2*R*asin(sqrt(h))
ꢀꢀꢀ
(2)其中,A点经纬度为(Lung1,Lat1),B点经纬度为(Lung2,Lat2);a为两点纬度之差且a=(Lat1

Lat2),b为两点经度之差且b=(Lung1

Lung2),R为地球半径,dist为两点之间的欧式空间距离;(2)利用排序算法,对计算出的距离进行排序,并存储已排序的距离矩阵及索引矩阵,得到距离数据。3.根据权利要求1所述的一种全局时空加权协同定位商计算方法,其特征在于,所述步骤S2的具体方法为:S201:寻找近邻点:从目标时刻的数据点中选择指定类别中的一个点,即目标数据点,然后在所有时刻数据点中找到与该点距离较近的指定个数最近邻;实现时,将目标数据点与其它时刻前...

【专利技术属性】
技术研发人员:麦雄发李玲程建权
申请(专利权)人:南宁师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1