基于两步空间层次聚类的居民群体出行特征探测方法技术

技术编号:38919792 阅读:11 留言:0更新日期:2023-09-25 09:31
本发明专利技术提出一种基于两步空间层次聚类的居民出行群体特征探测方法,方法包括获取规则格网点下的居民出行O

【技术实现步骤摘要】
基于两步空间层次聚类的居民群体出行特征探测方法


[0001]本专利技术涉及数据处理
,具体涉及一种基于两步空间层次聚类的居民群体出行特征探测方法。
技术背景
[0002]理解城市居民的日常出行特征是认识城市不同内部空间交互规律重要前提,对城市公共设施和交通资源等城市要素的优化配置具有深刻的影响。传统的小区调查的方式在分析居民群体移动行为特征时时效性低、成本高。通过居民出行轨迹大数据挖掘居民出行的群体特征成为一种新兴手段。相关技术中,一般利用O

D数据及空间聚类模型分析基于出租车等单一交通模式下的居民出行特征,对城市整体居民的覆盖不够全面。基于规则格网点的手机信令O

D数据具有数据量大、样本覆盖全面、起终点固定、获取方式便捷的特点,但是,原始的规则格网点O

D数据之间存在相互覆盖、遮挡和杂乱的问题,如何利用规则格网点下的O

D数据挖掘数据规律,进而探测居民的群体出行特征对现有方法提出了新的挑战。

技术实现思路

[0003](一)解决的技术问题
[0004]本专利技术提供了一种基于两步空间层次聚类的居民群体出行特征探测方法,以解决上述问题。
[0005](二)技术方案
[0006]为实现上述目的,本专利技术提供如下技术方案:一种基于两步空间层次聚类的居民群体出行特征探测方法,包括以下步骤:
[0007]步骤S1:获取规则格网点下的O

D移动数据,所述数据包括每条O/>‑
D数据的ID号、起点坐标、终点坐标、出行人数和移动距离;
[0008]步骤S2:对O

D数据的起点去重复后进行编号,构建空间索引,记录每个起点按距离排序的最近其它点的编号;
[0009]步骤S3:将相同起点的O

D数据进行分组,得到基于相同起点进行组织的数据列表;
[0010]步骤S4:设定最小距离阈值参数,进行相同起点O

D流的组内层次聚类(第一步聚类),若同一起点内两条流的距离小于约定距离阈值,将生成新的O

D流,得到基于相同起点进行组织的初始数据集D1,新数据集中包括未聚类流和聚类形成的新流;
[0011]步骤S5:按照S2步构造的索引顺序,从第一个起点开始,逐步完成多个起点间O

D数据的组间聚类(第二步聚类),设计新起点对应流的加入和流退出机制,不同起点对应的O

D数据中小于约定阈值的数据将被组成一类,得到最终数据集D2;
[0012]步骤S6:利用以上两步聚类的结果,对数据集D2中聚类后形成的新O

D流的出行人数进行自然断裂法分级展示,得到分析结果。
[0013]优选地,步骤S2中起点数据集的构建基于所有O

D数据起点去重复后,按照起点的
X坐标和Y坐标值排序后逐步加入;
[0014]优选地,步骤S2中的空间索引构建方式包括k

d树、B树、R树和四叉树;
[0015]优选地,步骤S4中新形成的O

D数据的起点/终点采用参与聚类数据的起点/终点平均值计算,新聚类形成的O

D数据承载的人流量为所有参与聚类的O

D数据对应的人流量的总和;
[0016]优选地,步骤S5中的第二步聚类中,采用未参与聚类的新点的加入和已参与聚类的流的退出机制来提升计算效率,按照S2中的起点编号顺序,新点加入的原则为预设聚类数量参数N,逐步加入第i到第(i+N)个点,流退出的原则为当i>N时的第(i

N)个聚类周期中未参与聚类的流逐步退出。
[0017](三)有益成果
[0018]与最接近的现有技术相比,本专利技术提供的技术方案具有如下有益效果:
[0019]本方法提出一种基于两步空间层次聚类的居民群体出行特征探测方法,先获取基于规则格网的城市居民出行O

D数据,按照规则格网中的O

D起点对数据进行组织,形成相同起点的列表数据,对相同起点列表内的O

D进行空间层次聚类,形成未聚类流和新聚类流的总数据集D1,再对D1中不同起点关联的O

D数据进行第二步空间层次聚类,得到最终数据集D2,最后根据D2的结果进行自然断裂法分级,实现对居民群体出行特征的识别,解决了在复杂、杂乱的原始O

D大数据中识别居民群体出行规律的问题。从而分析居民日常出行中的主要流动方向和数量问题,然后将该分析结果用于其它下游的城市规划环节中。
附图说明
[0020]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的示意性实施例一起用于解释本专利技术,并不构成对本专利技术的限制,在附图中:
[0021]图1为本专利技术满足两步空间层次聚类的居民群体出行特征探测方法的流程图;
[0022]图2为本专利技术实施例中第一步空间聚类结果的示意图;
[0023]图3为本专利技术实施例中第二步空间聚类结果的示意图。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0025]参阅附图1

附图3,本专利技术公开一种基于两步空间层次聚类的居民群体出行特征探测方法,包括以下步骤:
[0026]步骤S1:获取规则格网点下的O

D移动数据,所述数据包括每条O

D数据的ID号、起点坐标、终点坐标、出行人数和移动距离;
[0027]具体地,坐标系统采用西安80坐标系、高斯

克吕格3度分带投影系统,移动距离采用米为单位;在本实施例中共有1万条O

D数据;
[0028]表1规则格网点下居民出行的O

D数据样例
[0029]IDO点X坐标O点Y坐标D点X坐标D点Y坐标出行人数出行距离
11517446.16904110439.35571516945.68124111195.96236907121517542.44474109634.32781516945.68124106699.257333281
…………………
[0030]步骤S2:对O

D数据的起点去重复后进行编号,构建空间索引,记录每个起点按距离排序的最近其它点的编号;
[0031]步骤S2包括以下步骤:
[0032]S2

1:提取所有流的起点;
[0033]S2

本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于两步空间层次聚类的居民群体出行特征探测方法,其特征在于,所述方法包括如下步骤:步骤S1:获取规则格网点下的O

D移动数据,所述数据包括每条O

D数据的ID号、起点坐标、终点坐标、出行人数和移动距离;步骤S2:对O

D数据的起点去重复后进行编号,构建空间索引,记录每个起点按距离排序的最近其它点的编号;步骤S3:将相同起点的O

D数据进行分组,得到基于相同起点进行组织的数据列表;步骤S4:设定最小距离阈值参数,进行相同起点O

D数据的组内层次聚类(第一步聚类),若同一起点内两条O

D数据的距离小于约定距离阈值,将生成新的O

D数据,得到基于相同起点进行组织的初始数据集D1,新数据集中包括未聚类O

D数据和聚类形成的新O

D数据;步骤S5:按照S2步构造的索引顺序,从第一个起点开始,逐步完成多个起点间O

D数据的组间聚类(第二步聚类),设计新起点对应O

D数据的加入和O

D数据退出机制,不同起点对应的O

D数据中小于约定阈值的数据将被组成一类,得到最终数据集D2;步骤S6:利用以上两步聚类的结果,对数据集D2中聚类后形成的新O

D数据的出行人数进行自然断裂法分级展示,得到分析结果。2.根据权利要求1所述的一种基于两步空间层次聚类的居民群体出行特征探测方法,其特征在于,根据相同起点组织的O

D数据和不同起点组织的O

D数据,得到最终聚类结果,包括:按照相同起点组对组内流数据进行组织,计算流之间的距离,并将流之间的距离小于预设最小距离阈值的两条流进行聚类,得到初始数据集D1;按照不同起点对组间O

D数据进行组织,计算O

D数据之间的距离,并将O

D数据之间的距离小于预设最小距离阈值的两条O

D数据进行聚类,得到最终数据集D2。3.根据权利要求1所述的一种基于两步空间层次聚类的居民群体出行特征探测方法,其特征在于,步骤S4中新的O

D数据的构建方法为:ID=FlowA[0]X1=(FlowA[1]+FlowB[1])/2X2=(FlowA[2]+FlowB[2])/2Y1=(FlowA[3]+FlowB[3])/2Y2=(FlowA[4]+FlowB[4])/2NUM=(FlowA[5]+FlowB[5])其中,...

【专利技术属性】
技术研发人员:廖聪刘世晖于沛洋李悦晖
申请(专利权)人:中规院北京规划设计有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1