【技术实现步骤摘要】
一种分布式环境下基于Ripley’sK函数的时空POI数据点模式分析方法
本专利技术涉及时空大数据挖掘、空间统计领域,具体涉及一种分布式环境下基于Ripley’sK函数的时空POI数据点模式分析方法。
技术介绍
点模式分析是空间统计的重要组成部分,旨在一定空间范围内研究点数据的分布模式,挖掘点所代表的现象本身以及产生过程。随着传感器技术的广泛应用、通讯技术的飞跃发展以及信息基础设施的日渐成熟,针对点数据的分析逐渐从空间维度扩展至时空维度。时空Ripley’sK函数是Ripley’sK函数在时空维度的扩展,相比于其他点模式分析方法,其主要优势在于:它将时空尺度作为输入变量,能够研究点数据在不同时空尺度下的分布模式;其输入参数可以结合点数据特征决定,对主观经验依赖较小;且不会受到可变面元问题(ModifiableArealUnitProblem,MAUP)的影响。然而,由于Ripley’sK函数计算量较大,通常需要耗费大量时间来获得Ripley’sK函数结果。而在大数据时代,数据规模的集聚增长进一步提升Ripley’sK
【技术保护点】
1.一种分布式环境下基于Ripley’s K函数的时空POI数据点模式分析方法,其特征在于,包括:/n步骤S1:在分布式集群环境中,配置面向时空对象与时空索引的定制序列化器,用以支持时空点、时空圆柱、时空包围盒、时空KDB树、时空R树以预设精简的字节结构进行传输,其中,分布式集群环境中包括主节点和工作节点;/n步骤S2:通过主节点根据各工作节点抽样的时空POI数据集合,建立时空KDB树,将KDB树数据传输至各工作节点,以使各工作节点利用时空KDB树的叶子节点对应的时空立方体对观测点进行数据重分区,其中,抽样的时空POI数据集合由各工作节点抽样后的时空POI数据构成,抽样后的 ...
【技术特征摘要】
1.一种分布式环境下基于Ripley’sK函数的时空POI数据点模式分析方法,其特征在于,包括:
步骤S1:在分布式集群环境中,配置面向时空对象与时空索引的定制序列化器,用以支持时空点、时空圆柱、时空包围盒、时空KDB树、时空R树以预设精简的字节结构进行传输,其中,分布式集群环境中包括主节点和工作节点;
步骤S2:通过主节点根据各工作节点抽样的时空POI数据集合,建立时空KDB树,将KDB树数据传输至各工作节点,以使各工作节点利用时空KDB树的叶子节点对应的时空立方体对观测点进行数据重分区,其中,抽样的时空POI数据集合由各工作节点抽样后的时空POI数据构成,抽样后的时空POI数据由各工作节点读取本地的时空POI数据并随机抽样后传输至主节点,KDB树包括根节点、非叶子节点和叶子节点,根节点包含时空POI数据全集对应的时空立方体,非叶子节点包含子节点所在时空立方体的并集,叶子节点包含最小时空分区以及分区内的时空点数据;
步骤S3:在对观测点进行数据重分区得到的数据分区内,以每个时空点为中心、空间距离阈值为半径、2倍时间距离阈值为高,构建一系列时空圆柱,其中,时空圆柱数量与时空点数量相同,空间距离阈值与时间距离阈值为预设输入参数,并采用递归网格排序算法批量导入时空点,构建局部时空R树索引,对时空圆柱与时空R树索引的最小外包时空立方体进行时空连接,获得时空圆柱所包含的邻近时空点,由各时空圆柱的中心时空点与其所包含的邻近时空点,构造时空点对,其中,时空R树中,根节点包含当前分区的时空POI数据的最小外包时空立方体,非叶子节点包含所有子节点对应最小外包时空立方体集合的最小外包时空立方体,叶子节点包含时空点数据;
步骤S4:对于每个点对,根据中心点的空间位置、时间戳、点对空间距离以及点对时间距离,在双层缓存中查找与点对对应的时空权重,若存在则取出权重,否则计算对应时空权重,并插入双层缓存,其中,双层缓存中用以存储已知点对的时空权重;
步骤S5:根据得到的数据分区的时空权重,计算观测点对应的不同时空距离阈值下时空Ripley’sK函数计算结果,其中,时空Ripley’sK函数计算结果用以表征POI数据点的分布情况;
步骤S6:基于观测点生成模拟点,对模拟点进行抽样,建立时空KDB树,利用时空KDB树的叶子节点对模拟点进行数据重分区后,对模拟点产生的数据分区进行步骤S3~步骤S5的操作,得到模拟点对应的不同时空距离阈值下的时空Ripley’sK函数计算结果;
步骤S7:根据模拟点对应的不同时空距离阈值下的时空Ripley’sK函数计算结果,获取时空Ripley’sK函数模拟的上下界;
步骤S8:根据观测点对应的不同时空距离阈值下时空Ripley’sK函数计算结果与时空Ripley’sK函数模拟的上下界,获得最终的数据分布输出结果。
2.如权利要求1所述的方法,其特征在于,步骤S1具体包括:
在分布式集群环境中,配置面向时空对象与时空索引的定制序列化器,覆盖时空点、时空圆柱、时空包围盒、时空KDB树、时空R树对象,以预设精简的字节结构进行传输为:当时空对象与时空索引于集群节点间交换传输时,判断对象所属类,提取关键信息构建字节数组,由发送方发出,接收方获得字节数组后,利用其中关键信息还原出发送方的对象。
3.如权利要求1所述的方法,其特征在于,步骤S2具体包括:
步骤S21:通过集群中的各工作节点从分布式存储系统中,...
【专利技术属性】
技术研发人员:桂志鹏,王源,吴华意,彭德华,吴京航,崔邹森,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。