一种基于重复接驳行为的跨交通方式用户匹配方法组成比例

技术编号:36897506 阅读:10 留言:0更新日期:2023-03-18 09:18
本发明专利技术公开了一种基于重复接驳行为的用户匹配方法,基于用户的重复接驳行为,通过预先建立的约束方程及设置的相应约束条件确定匹配用户对,再根据排斥法对匹配结果进行修正。通过以上匹配方法可以识别不同交通数据集中的同一个体,实现基于匿名出行数据的跨交通方式用户匹配。该匹配方法能够较好的处理具有重复接驳行为的两个不同出行数据集之间的用户匹配问题,具有较强的普适性,可为综合交通运输决策管理与服务提供有效支撑。运输决策管理与服务提供有效支撑。

【技术实现步骤摘要】
一种基于重复接驳行为的跨交通方式用户匹配方法


[0001]本专利技术属于交通领域,具体涉及一种基于重复接驳行为的跨交通方式用户匹配方法。

技术介绍

[0002]得益于公交卡与智能手机的应用,市民出行产生了大量的出行记录数据。例如地铁运营公司拥有地铁出行数据,滴滴等网约车公司拥有网约车和出租车出行数据,哈喽单车等共享单车公司拥有单车出行数据。如果能将多个公司的出行数据结合,构成出行链,就能够代替大规模出行调查,将会是交通规划领域的重要进步。然而由于不同公司脱敏方法的不同等原因,无法直接从多个公司的出行数据中匹配出同一用户。因此如何从多数据源的匿名出行记录中匹配出同一个用户成为解决该问题的关键所在。
[0003]现有的用户匹配方法多以位置信息匹配为主,大致可分为基于同时段数据的用户匹配与基于异时段数据的用户匹配两个方向。基于异时段数据的用户匹配是指研究者有一个包含用户位置轨迹的数据集,通过将该数据集划分为前后两个时段,并分析轨迹数据的相似程度,识别两个时段中的相同个体。基于同时段数据的用户匹配是指研究者有两个包含用户位置轨迹信息的数据集(如手机信令数据和含有位置信息的社交网络数据等),通过分析两数据中的轨迹信息,识别其中相同的个体。
[0004]虽然这些研究采用的基于轨迹点时空重合的用户匹配思路是有效的,但是这些方法尚不能用于交通出行数据相关的用户匹配,主要原因在于很多交通方式的用户轨迹点十分稀疏(如公共交通中的刷卡数据),因而用户匹配难度较大。这就要求我们专利技术更加准确有效的算法来实现交通数据中相同个体的识别。本专利技术旨在提出一种基于重复接驳行为的跨交通方式用户匹配方法,以实现基于匿名出行数据的跨交通方式用户匹配。

技术实现思路

[0005]本专利技术的目的是:实现基于匿名出行数据的跨交通方式用户匹配,为综合交通运输决策管理与服务提供有效支撑。
[0006]为此本专利技术提供了一种基于重复接驳行为的跨交通方式用户匹配方法,包括但不限于轨道交通、公交、共享单车、网约车等多种不同交通方式的用户匹配。具体步骤为。
[0007]步骤1:出行数据准备,包括两种可能存在接驳行为的交通方式出行数据。数据中需含有的订单ID、用户ID、出发及到达时间、起点与终点经纬度。
[0008]步骤2:建立约束方程:1)空间约束|

|≤d其中,S和T表示两个出行数据集,为用户在S数据集中第k次出行开始的地点,为用户在T数据集中第l次出行结束的地点,d表示空间约束常数2)时间约束

≤t(d、t为常量)其中,S和T表示两个出行数据集,为用户在S数据集中第k次出行开始的时刻,为用户在T数据集中第l次出行结束的时刻,t表示时间约束常数3)接驳次数约束=其中,为匹配成功的用户对,为候选用户对出现的次数,为最小接驳次数约束常数。
[0009]步骤3:设置约束条件。本方法实施前需设置两种交通方式接驳的空间约束常数d、时间约束常数t和最小接驳次数约束常数n。以上约束的设定方法包括但不限于根据经验及现有文献资料确定、现场调查试验确定、基于用户出行特征、分析其他具有完整出行链的接驳出行数据集确定。
[0010]步骤4:确定匹配用户对,根据步骤2与步骤3设置的约束方程与约束条件,在两个数据集中进行搜索匹配,确定匹配用户对。
[0011]步骤5:若步骤4识别出的匹配用户对集合中,某一用户存在于多个用户对中,如用户i同时存在于、、
……
、等N个用户对中,则采用基于时空限制的错误匹配排除法(以下简称排斥法)进行排除。具体方法为:对比用户i和用户的所有出行记录,观察两者的出行记录在时间上是否有重叠,如果有,则表明用户i和用户同时使用了两种交通工具,说明两者不是同一用户,该用户对应予以排除。
[0012]本专利技术的有益技术效果为:本专利技术基于用户的重复接驳行为,通过预先建立的约束方程及设置的相应约束条件确定匹配用户对,再根据排斥法对匹配结果进行修正。通过以上匹配方法可以识别不同交通数据集中的同一个体,实现基于匿名出行数据的跨交通方式用户匹配。该匹配方法能够较好的处理具有重复接驳行为的两个不同出行数据集之间的用户匹配问题,具有较强的普适性,可为综合交通运输决策管理与服务提供有效支撑。
附图说明
[0013]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1为本专利技术实施例提供的匹配方法应用于地铁

共享单车接驳出行模式的用户识别流程示意图。
[0015]图2为本专利技术实施例提供的向站名方向统一空间信息尺度方法的流程示意图。
具体实施方式
[0016]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实
施例,都属于本专利技术保护的范围。
[0017]参见图1,为了在多源匿名出行数据集中,识别统一用户,本专利技术实施例提供了一种基于重复接驳行为的跨交通方式用户匹配方法,其具体流程包括。
[0018]步骤S101为设置约束,本方法实施前需设置地铁—共享单车接驳的空间约束常数d、时间约束常数t和最小接驳次数约束常数n。以上约束常数的设定方法包括但不限于根据经验及现有文献资料确定、现场调查试验确定、基于用户出行特征确定、分析其他具有完整出行链的接驳出行数据集确定。
[0019]步骤S102为数据准备,其中,地铁和共享单车数据集包含:订单ID、用户ID、出发及到达时间以及出发和到达站点空间信息(包括但不限于站点名称、站点经纬度),其中订单ID可为非原始数据,可在数据准备过程中进行标定,标定方法包括但不限于基于现有数据新加一有序或无序数列作为订单ID;组合用户ID和出发及到达时间形成唯一的订单ID。
[0020]此外若两出行数据集空间信息尺度不一致,可引入额外数据集(应包含站名和站点经纬度信息)进行尺度统一,因统一方向不同可分为:1)通过为每一站点设置缓冲圆或缓冲矩形向站名方向统一,本实施例中若共享单车一条出行记录的起点落在此缓冲区域内,则将当前地铁站点名添加到该条记录的空间信息中,实现两出行数据集空间信息向站名方向统一,参见图2;2)基于站名向经纬度统一,本实施例可通过地铁出行数据集中每条出行记录地铁终点的站名在额外数据集中提取该站点经纬度信息并添加到该条出行记录的空间信息中,实现空间信息向经纬度方向统一。
[0021]步骤S103为用户匹配,基于S102所准备的统一尺度的出行记录进行用户匹配,本实施例采用向经纬度方向统一的空间信息。
[0022]首先对两个交通数据集进行时空匹配来确定候选用户对,时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于重复接驳行为的用户匹配方法,具体步骤为:步骤1:出行数据准备,包括两种可能存在接驳行为的交通方式出行数据,数据中需含有订单ID、用户ID、出发及到达时间、起点与终点经纬度;步骤2:建立约束方程;1)空间约束|

|≤d其中,S和T表示两个出行数据集,为用户在S数据集中第k次出行开始的地点,为用户在T数据集中第l次出行结束的地点,d表示空间约束常数;2)时间约束

≤t(d、t为常量)其中,S和T表示两个出行数据集,为用户在S数据集中第k次出行开始的时刻,为用户在T数据集中第l次出行结束的时刻,t表示时间约束常数;3)接驳次数约束=其中,为匹配成功的用户对,为候选用户对出现的次数,为最小接驳次数约束常数;步骤3:设置约束条件,本方法实施前需设置...

【专利技术属性】
技术研发人员:杨鸿泰李香孟瑶刘政
申请(专利权)人:西南交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1