确定地理区域的组团数据的方法、计算设备和存储介质技术

技术编号:29313702 阅读:13 留言:0更新日期:2021-07-17 02:31
本发明专利技术提供了一种确定地理区域的组团数据的方法、计算设备和计算机可读存储介质。该方法包括:获取该地理区域的多个栅格的栅格数据;获取该地理区域内的多个人员的定位数据,并且基于每个人员的定位数据和该栅格数据确定该人员的轨迹数据;基于该多个人员的轨迹数据确定该多个人员中从该多个栅格中的第一栅格到第二栅格的转移人数以构建样例数据集合,样例数据集合中的每条样例数据包括第一栅格、第二栅格以及多个人员中从第一栅格到第二栅格的转移人数;利用社区发现算法将该多个人员的样例数据集合聚类为多个簇,以获得每个栅格所属的簇标签;以及对属于同一簇标签的栅格进行融合以确定与该簇标签相对应的组团数据。行融合以确定与该簇标签相对应的组团数据。行融合以确定与该簇标签相对应的组团数据。

Method, computing device and storage medium for determining group data of geographical area

【技术实现步骤摘要】
确定地理区域的组团数据的方法、计算设备和存储介质


[0001]本专利技术概括而言涉及计算机软件领域,更具体地,涉及一种用于确定地理区域的组团数据的方法、计算设备和计算机可读存储介质。

技术介绍

[0002]对城市内部或者若干个城市之间的人员流动或迁徙进行研究具有重要意义。例如,其可以用于指导城市各项公共设施或商业设施的规划、指导特定城市出台相关政策以吸引人才等。当前,这些研究通常通过静态采集人口数据来获得。例如,对城市内部的人员的居住和工作情况进行研究时通常以选定居住地为中心,一定的空间距离(如一公里)、时间距离(如十五分钟等时圈)为边界来划定城市内的不同生活圈并对这些生活圈内的人口数据进行统计。
[0003]然而,真实的人群活动轨迹并不局限于静态的空间或等时圈半径范围,这种简单的划分方式忽略了人迹活动的独特性与空间异质性,不能真正体现真实的生活圈分布,更不能体现城市生活圈的变化。

技术实现思路

[0004]针对上述问题,本专利技术通过采集特定地理区域内的栅格级定位数据来搭建栅格联系网络,应用社区发现算法来更加准确地识别该特定地理区域内的各个组团结构。
[0005]根据本专利技术的一个方面,提供了一种确定地理区域的组团数据的方法。该方法包括: 获取所述地理区域的多个栅格的栅格数据;获取所述地理区域内的多个人员的定位数据,并且基于每个人员的定位数据和所述栅格数据确定所述人员的轨迹数据;基于所述多个人员的轨迹数据确定所述多个人员中从所述多个栅格中的第一栅格到第二栅格的转移人数以构建样例数据集合,样例数据集合中的每条样例数据包括第一栅格、第二栅格以及所述多个人员中从第一栅格到第二栅格的转移人数;利用社区发现算法将所述多个人员的样例数据集合聚类为多个簇,以获得每个栅格所属的簇标签;以及对属于同一簇标签的栅格进行融合以确定与该簇标签相对应的组团数据。
[0006]根据本专利技术的另一个方面,提供了一种计算设备。该计算设备包括:至少一个处理器;以及至少一个存储器,该至少一个存储器被耦合到该至少一个处理器并且存储用于由该至少一个处理器执行的指令,该指令当由该至少一个处理器执行时,使得该计算设备执行根据上述方法的步骤。
[0007]根据本专利技术的再一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序代码,该计算机程序代码在被运行时执行如上所述的方法。
[0008]在一些实施例中,其中获取所述地理区域内的多个人员的定位数据,并且基于每个人员的定位数据和所述栅格数据确定所述人员的轨迹数据包括:获取预定时间周期内所述地理区域内的多个人员在至少一个特定时间段的定位数据;基于每个人员在每个特定时间段的定位数据和所述栅格数据确定所述人员的第一栅格和第二栅格;以及基于每个人员
的第一栅格和第二栅格确定所述多个人员在所述预定时间周期内的轨迹数据。
[0009]在一些实施例中,其中基于所述多个人员的轨迹数据确定所述多个人员中从所述多个栅格中的第一栅格到第二栅格的转移人数以构建样例数据集合包括:基于所述多个人员的轨迹数据确定所述多个人员中从所述多个栅格中的第一栅格到第二栅格的转移人数,以构建初始样例数据集合,其中所述第一栅格与所述第二栅格不同;以及从所述初始样例数据集合中删除所述第一栅格和所述第二栅格之间的距离满足预定阈值的样例数据以获得所述样例数据集合。
[0010]在一些实施例中,其中利用社区发现算法将所述多个人员的样例数据集合聚类为多个簇,以获得每个栅格所属的簇标签包括:计算初级簇的第一模块度,所述初级簇包括所述多个栅格中的至少一个栅格;将所述初级簇的至少一个相邻栅格依次组合到所述初级簇并计算所述初级簇的至少一个第二模块度;确定所述至少一个第二模块度与所述第一模块度之间的至少一个模块度差值;确定所述至少一个模块度差值中的最大模块度差值;以及更新所述初级簇以包含与所述最大模块度差值对应的相邻栅格。
[0011]在一些实施例中,其中更新所述初级簇以包含与所述最大模块度差值对应的相邻栅格还包括:确定所述最大模块度差值是否大于零;以及响应于确定所述最大模块度差值大于零,更新所述初级簇以包含与所述最大模块度差值对应的相邻栅格。
[0012]在一些实施例中,其中计算初级簇的第一模块度包括:基于所述多个栅格之间的转移人数之和、所述初级簇内的栅格之间的转移人数之和以及所述初级簇内的栅格与所述初级簇外的栅格之间的转移人数之和计算所述初级簇的第一模块度。
[0013]在一些实施例中,该方法还包括:遍历所述多个栅格以产生多个初级簇;将所述多个初级簇中的每个初级簇中的栅格归并为一个超节点以产生多个超节点;根据两个超节点中的栅格之间的转移人数确定所述两个超节点之间的转移人数;计算一个超节点的第三模块度;将所述超节点的至少一个相邻超节点依次组合到所述超节点中并计算所述超节点的至少一个第四模块度;确定所述至少一个第四模块度中与所述第三模块度之间的至少一个模块度差值;确定所述至少一个模块度差值中的最大模块度差值;以及更新所述超节点以包含与所述最大模块度差值对应的相邻超节点。
[0014]在一些实施例中,构建样例数据集合之后还包括:基于所述样例数据集合构建所述地理区域的人迹图,其中所述人迹图的节点指示所述多个栅格中的一个栅格,两个节点之间的连线指示从两个节点中的一个节点向另一个节点转移的人员轨迹,连线的权重指示从两个节点中的一个节点到另一个节点的转移人数。
[0015]在一些实施例中,确定与该簇标签相对应的组团数据之后还包括:基于与每个簇标签对应的所有栅格的地理信息产生与所述簇标签对应的地理栅格面文件;以及基于与每个簇标签对应的地理栅格面文件和所述簇标签对应的栅格的数量在电子地图上显示各个簇标签对应的组团数据。
附图说明
[0016]通过参考下列附图所给出的本专利技术的具体实施方式的描述,将更好地理解本专利技术,并且本专利技术的其他目的、细节、特点和优点将变得更加显而易见。
[0017]图1示出了根据本专利技术的实施例的用于确定地理区域的组团数据的设备的示意
图。
[0018]图2示出了地理区域的电子地图的示例性示意图。
[0019]图3示出了根据本专利技术的实施例的用于确定地理区域的组团数据的方法的流程图。
[0020]图4示出了根据本专利技术一种实施例的确定人员的轨迹数据的步骤的流程图。
[0021]图5示出了根据本专利技术一些实施例构建的人迹图的示意图。
[0022]图6示出了根据本专利技术的实施例的用于将样例数据集合聚类为多个簇的步骤的示例性流程图。
[0023]图7示出了根据本专利技术一些实施例产生的初级簇的示意图。
[0024]图8示出了根据本专利技术一些实施例的超节点的示意图。
[0025]图9示出了包含根据本专利技术产生的各个组团的地理区域的电子地图的示意图。
[0026]图10示出了适合实现本公开的实施例的计算设备的结构方框图。
具体实施方式
[0027]下面将参照附图更详细地描述本专利技术的优选实施方式。虽然附图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种确定地理区域的组团数据的方法,包括:获取所述地理区域的多个栅格的栅格数据;获取所述地理区域内的多个人员的定位数据,并且基于每个人员的定位数据和所述栅格数据确定所述人员的轨迹数据;基于所述多个人员的轨迹数据确定所述多个人员中从所述多个栅格中的第一栅格到第二栅格的转移人数以构建样例数据集合,所述样例数据集合中的每条样例数据包括第一栅格、第二栅格以及所述多个人员中从第一栅格到第二栅格的转移人数;利用社区发现算法将所述多个人员的样例数据集合聚类为多个簇,以获得每个栅格所属的簇标签;以及对属于同一簇标签的栅格进行融合以确定与该簇标签相对应的组团数据,其中基于所述多个人员的轨迹数据确定所述多个人员中从所述多个栅格中的第一栅格到第二栅格的转移人数以构建样例数据集合包括:基于所述多个人员的轨迹数据确定所述多个人员中从所述多个栅格中的第一栅格到第二栅格的转移人数,以构建初始样例数据集合,其中所述第一栅格与所述第二栅格不同;以及从所述初始样例数据集合中删除所述第一栅格和所述第二栅格之间的距离满足预定阈值的样例数据以获得所述样例数据集合。2.如权利要求1所述的方法,其中获取所述地理区域内的多个人员的定位数据,并且基于每个人员的定位数据和所述栅格数据确定所述人员的轨迹数据包括:获取预定时间周期内所述地理区域内的多个人员在至少一个特定时间段的定位数据;基于每个人员在每个特定时间段的定位数据和所述栅格数据确定所述人员的第一栅格和第二栅格;以及基于每个人员的第一栅格和第二栅格确定所述多个人员在所述预定时间周期内的轨迹数据。3.如权利要求1所述的方法,其中利用社区发现算法将所述多个人员的样例数据集合聚类为多个簇,以获得每个栅格所属的簇标签包括:计算初级簇的第一模块度,所述初级簇包括所述多个栅格中的至少一个栅格;将所述初级簇的至少一个相邻栅格依次组合到所述初级簇并计算所述初级簇的至少一个第二模块度;确定所述至少一个第二模块度与所述第一模块度之间的至少一个模块度差值;确定所述至少一个模块度差值中的最大模块度差值;以及更新所述初级簇以包含与所述最大模块度差值对应的相邻栅格。4.如权利要求3所述的方法,其中更新所述初级簇以包含与所述最大...

【专利技术属性】
技术研发人员:陈旦魏川登谢贤彬
申请(专利权)人:上海脉策数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1