当前位置: 首页 > 专利查询>北京大学专利>正文

一种地铁出行目的识别方法及装置制造方法及图纸

技术编号:26421164 阅读:54 留言:0更新日期:2020-11-20 14:17
本发明专利技术实施例提供一种地铁出行目的识别方法及装置,能够提高出行目的识别精度。方法包括:获取地铁出行样本,以及获取地铁站周边的土地利用特征信息;将所述地铁出行样本划分为训练集和测试集;以所述训练集中的出行特征信息和相对应的出行始末地铁站周边的土地利用特征信息为输入,以及出行目的为预测变量,对分类器进行训练,并基于所述测试集对训练后的所述分类器进行检验,得到检验后的所述分类器;将公交智能卡数据中每条目标出行记录对应的目标出行特征信息与相对应的目标出行始末地铁站周边的土地利用特征信息输入至检验后的所述分类器中,得到所述每条目标出行记录的出行目的识别结果。

【技术实现步骤摘要】
一种地铁出行目的识别方法及装置
本专利技术涉及数据分析领域,尤其涉及一种地铁出行目的识别方法及装置。
技术介绍
公交智能卡数据(SCD,Smartcarddata)在我国城市中使用较广,记载了大量的公共交通出行信息,但是在应用到具体的交通监测和管理中,则受到诸多技术瓶颈限制。其中,最为突出的技术瓶颈是无法从智能卡的刷卡记录数据中准确得知地铁乘客的出行目的,难于判断这些公交刷卡用户的交通出行是上班、回家,还是其他目的的出行。地铁是造价昂贵的交通基础设施,是特大城市公共交通的重要组成方式;同时,也是促进城市生长,支撑大城市空间发展的核心“骨架”。准确识别地铁出行目的,是以人为本、合理、高效提供地铁服务的前提。现有方案提供了一种基于出行链特征的地铁出行目的识别技术,该项技术从居民个体地铁出行链角度出发,挖掘个体居住地与就业地位置信息,进而根据地铁出行目的地,判断出该次地铁出行出行目的。现有方案还提供了一种基于数据融合方法的地铁出行目的识别技术,该项技术是通过融合地铁出行调查数据与地铁智能数据,对出行目的进行估计。首先通过地铁出行调查数据,使用机器学习方法,获取地铁出行目的分类器。随后将地铁智能卡记录带入分类器中,获取每条地铁智能卡记录对应出行目的。然而,上述基于出行链特征的地铁出行目的识别技术虽然简单有效、具有一定的合理性,但该种技术方法主要依赖于居住地和就业地判断相关的假定条件。相关研究中对停留时长、土地利用等相关判断条件设定存在着以来经验等主观条件判断的问题,无真值对假定条件进行检验。因此该判断方法更依赖于经验判断,其合理性、真实性与有效性实际上有待进一步检验。上述基于数据融合方法的地铁出行目的识别技术仅采用单一地铁站的地铁智能卡记录与地铁出行调查手机数据。仅采用一个地铁站的地铁智能卡记录与地铁出行调查数据,会忽略城市内部来自不同区域乘客在社会经济属性、出行行为习惯等方面的差异。该项技术仅仅包括了出发时刻、出行时长、到达时刻等地铁出行自身相关特征,出行目的的识别精度有待提高。
技术实现思路
本专利技术的目的是提供一种地铁出行目的识别方法,能够提高出行目的识别精度。第一方面,本专利技术实施例提供一种地铁出行目的识别方法,包括:获取地铁出行样本,以及获取地铁站周边的土地利用特征信息;将所述地铁出行样本划分为训练集和测试集;以所述训练集中的出行特征信息和相对应的出行始末地铁站周边的土地利用特征信息为输入,以及出行目的为预测变量,对分类器进行训练,并基于所述测试集对训练后的所述分类器进行检验,得到检验后的所述分类器;将公交智能卡数据中每条目标出行记录对应的目标出行特征信息与相对应的目标出行始末地铁站周边的土地利用特征信息输入至检验后的所述分类器中,得到所述每条目标出行记录的出行目的识别结果。可选地,所述以所述训练集中的出行特征信息和相对应的出行始末地铁站的周边土地利用特征信息为输入,以及出行目的为预测变量,对分类器进行训练,包括:以所述训练集中的地铁出行出发时刻、到达时刻及出行时长,和相对应的出行始末地铁站周边的土地利用特征信息为输入,以及出行目的为预测变量,对随机森林分类器进行参数标定以及训练,其中,所述参数标定包括随机森林分类器中的特征数量以及随机森林决策树数量。可选地,所述基于所述测试集对训练后的所述分类器进行检验,包括:采用准确率以及混合矩阵方式将所述测试集输入至训练后的所述随机森林分类器中,以评估训练后的所述分类器的分类精确程度。可选地,所述获取地铁出行样本,包括:获取交通调查数据;从所述交通调查数据中随机选取出行调查样本;从所述出行调查样本中提取地铁出行样本。可选地,所述方法还包括:根据获取到的地铁站点位置信息,使用兴趣点数据对每次出行的始末地铁站周边的土地利用特征信息进行表征。可选地,所述根据获取到的地铁站点位置信息,使用兴趣点数据对每次出行的始末地铁站周边的土地利用特征信息进行表征,包括:根据获取到的地铁站点位置信息,使用就业机会、住房机会与公共服务设施的兴趣点数据对每次出行的始末地铁站周边的土地利用特征信息进行表征。第二方面,本专利技术实施例提供一种地铁出行目的识别装置,包括:获取单元,用于获取地铁出行样本,以及获取地铁站周边的土地利用特征信息;划分单元,用于将所述地铁出行样本划分为训练集和测试集;训练检验单元,用于以所述训练集中的出现特征信息和相对应的出行始末地铁站周边的土地利用特征信息为输入,以及出行目的为预测变量,对分类器进行训练,并基于所述测试集对训练后的所述分类器进行检验,得到检验后的所述分类器;识别单元,用于将公交智能卡数据中每条目标出行记录对应的目标出行特征信息与相对应的目标出行始末地铁站周边的土地利用特征信息输入至检验后的所述分类器中,得到所述每条目标出行记录的出行目的识别结果。可选地,所述分类器包括随机森林分类器。第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法。本专利技术实施例提供的地铁出行目的识别方法及装置,考虑到根据交通与土地利用时空间互动理论,交通出行与城市土地利用特征息息相关,从而在分类器中加入土地利用特征信息,以提高出行目的识别精度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种地铁出行目的识别方法流程图;图2为本专利技术实施例提供的一种随机森林分类器训练过程示意图;图3为本专利技术实施例提供的一种随机森林分类器精度评估示意图;图4为本专利技术实施例提供的一种地铁出行目的识别示意图;图5为本专利技术实施例提供的一种随机森林分类器中不同特征MDA值示意图;图6为本专利技术实施例提供的一种随机森林分类器预测精度随特征数量变化情况示意图;图7为本专利技术实施例提供的一种随机森林分类器中计算不同决策树数量对应OOB精度示意图;图8为本专利技术实施例提供的地铁出行目的识别装置结构示意图;图9为本专利技术实施例提供的一种电子设备的实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术本文档来自技高网
...

【技术保护点】
1.一种地铁出行目的识别方法,其特征在于,包括:/n获取地铁出行样本,以及获取地铁站周边的土地利用特征信息;/n将所述地铁出行样本划分为训练集和测试集;/n以所述训练集中的出行特征信息和相对应的出行始末地铁站周边的土地利用特征信息为输入,以及出行目的为预测变量,对分类器进行训练,并基于所述测试集对训练后的所述分类器进行检验,得到检验后的所述分类器;/n将公交智能卡数据中每条目标出行记录对应的目标出行特征信息与相对应的目标出行始末地铁站周边的土地利用特征信息输入至检验后的所述分类器中,得到所述每条目标出行记录的出行目的识别结果。/n

【技术特征摘要】
1.一种地铁出行目的识别方法,其特征在于,包括:
获取地铁出行样本,以及获取地铁站周边的土地利用特征信息;
将所述地铁出行样本划分为训练集和测试集;
以所述训练集中的出行特征信息和相对应的出行始末地铁站周边的土地利用特征信息为输入,以及出行目的为预测变量,对分类器进行训练,并基于所述测试集对训练后的所述分类器进行检验,得到检验后的所述分类器;
将公交智能卡数据中每条目标出行记录对应的目标出行特征信息与相对应的目标出行始末地铁站周边的土地利用特征信息输入至检验后的所述分类器中,得到所述每条目标出行记录的出行目的识别结果。


2.根据权利要求1所述的地铁出行目的识别方法,其特征在于,所述以所述训练集中的出行特征信息和相对应的出行始末地铁站的周边土地利用特征信息为输入,以及出行目的为预测变量,对分类器进行训练,包括:
以所述训练集中的地铁出行出发时刻、到达时刻及出行时长,和相对应的出行始末地铁站周边的土地利用特征信息为输入,以及出行目的为预测变量,对随机森林分类器进行参数标定以及训练,其中,所述参数标定包括随机森林分类器中的特征数量以及随机森林决策树数量。


3.根据权利要求1所述的地铁出行目的识别方法,其特征在于,所述基于所述测试集对训练后的所述分类器进行检验,包括:
采用准确率以及混合矩阵方式将所述测试集输入至训练后的所述随机森林分类器中,以评估训练后的所述分类器的分类精确程度。


4.根据权利要求1所述的地铁出行目的识别方法,其特征在于,所述获取地铁出行样本,包括:
获取交通调查数据;
从所述交通调查数据中随机选取出行调查样本;
从所述出行调查样本中提取地铁出行样本。


5.根据权利要求1所述的地铁出行目的识别方法,其特征在...

【专利技术属性】
技术研发人员:赵鹏军曹毓书
申请(专利权)人:北京大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1