一种基于信令数据多重特征的城际多交通出行方式辨识方法技术

技术编号:38458554 阅读:14 留言:0更新日期:2023-08-11 14:35
本发明专利技术公开了一种基于信令数据多重特征的城际多交通出行方式辨识方法,首先进行交通路网绘制,并对路网进行分类,之后获取移动网络基站信息,并将移动网络基站与交通网信息进行关联,获取手机数据并对手机数据、基站以及交通网信息进行融合,基于手机信令数据构建手机数据特征表;随后构建随机森林模型进行训练,最后基于训练后的随机森林模型对手机信令数据进行交通出行方式辨识。本发明专利技术基于大数据和机器学习理论,实现跨域出行方式的高精度分类,在提出具有较高置信度的出行方式识别基础上能够对居民日常跨域出行方式进行高采样比的大规模评估,评估跨域出行路网热度,并为城市间综合交通网络规划和完善提供参考。市间综合交通网络规划和完善提供参考。市间综合交通网络规划和完善提供参考。

【技术实现步骤摘要】
一种基于信令数据多重特征的城际多交通出行方式辨识方法


[0001]本专利技术属于交通出行领域,具体涉及一种基于信令数据多重特征的城际多交通出行方式辨识方法。

技术介绍

[0002]居民出行需求是城市道路基础设施规划与建设的基本依据之一,城市道路基础设施建设不仅涉及到市内交通网络建设,同时还包括连通城市的综合交通运输网络建设。传统的居民出行行为调查包括线下问卷调查、电话采访、邮件、网络问卷收集等方式。这些方法有着固有局限性,如覆盖范围小、覆盖率低、投入成本高、数据质量差等。面对跨市出行行为特征分析的需求,采用传统调查方式采集数据的难度和成本将进一步大幅提升。
[0003]近年来,随着智能手机的迅速发展和普及,基于移动网络数据的出行行为分析的研究已经成为热点。目前被应用于研究的数据类型可以分为两类:当用户使用服务(如呼叫、短消息服务或因特网)时记录的事件驱动数据((如呼叫详细记录CDR),和捕获信令事件的网络驱动数据(如切换、位置区域更新、定期位置更新)。其中基于网络驱动的数据又被称为蜂窝信号数据(CSD)。这些数据,通常由移动网络运营商在后台自动记录,用于计费、管理和维护,因此不需要最终用户额外提供。然而,受限于移动网络数据较低的空间精度和较长的采样周期,从这些数据中提取出行方式等移动性信息非常具有挑战性。

技术实现思路

[0004]针对上述问题,本专利技术的目的在于提供一种基于信令数据多重特征的城际多交通出行方式辨识方法,利用手机数据和交通路网数据,生成面向居民出行方式分类的特性数据,并基于随机森林模型,实现跨域出行方式的高精度分类,可以对跨域出行居民的出行方式进行有效识别,为现网通勤现状评估和未来综合交通网络规划提供依据。
[0005]实现本专利技术目的的具体技术方案为:
[0006]一种基于信令数据多重特征的城际多交通出行方式辨识方法,包括以下步骤:
[0007]步骤1、进行交通路网绘制,并对路网进行分类;
[0008]步骤2、获取移动网络基站信息,并将移动网络基站与交通网信息进行关联;
[0009]步骤3、获取手机数据并对手机数据预处理,并对手机数据、基站以及交通网信息进行融合,并基于手机信令数据构建手机数据特征表;
[0010]步骤4、构建随机森林模型,并基于手机数据特征表提取样本数据对随机森林模型进行训练;
[0011]步骤5、基于训练后的随机森林模型对手机信令数据进行交通出行方式辨识。
[0012]与现有技术相比,本专利技术的有益效果在于:
[0013](1)本专利技术基于大数据和机器学习理论,实现跨域出行方式的高精度分类,在提出具有较高置信度的出行方式识别基础上能够对居民日常跨域出行方式进行高采样比的大规模评估,评估跨域出行路网热度,并为城市间综合交通网络规划和完善提供参考;
[0014](2)本专利技术的方法提出一种基于个体城际出行稀疏轨迹特征提取与多维特征的刻画方法,为机器学习模型提供提取的个体城际出行多维特征数据序列作为输入,以强化模型学习效果。
附图说明
[0015]图1为本专利技术的基于信令数据多重特征的城际多交通出行方式辨识方法步骤流程图。
[0016]图2为本专利技术的实施例中的随机森林和长短时记忆模型的混合训练模型示意图。
[0017]图3为本专利技术的实施例中的交通路网图。
[0018]图4为本专利技术的实施例中的采样时间间隔分布图。
[0019]图5为本专利技术的实施例中的采样里程间隔分布图。
[0020]图6为本专利技术的实施例中的采样速度间隔分布图。
[0021]图7为本专利技术的实施例中的特征量重要性直方图。
[0022]图8为本专利技术的实施例中的基于随机森林的分类结果混淆矩阵图。
具体实施方式
[0023]一种基于信令数据多重特征的城际多交通出行方式辨识方法,包括以下步骤:
[0024]步骤1、进行交通路网绘制,并对路网进行分类,具体为:
[0025]绘制交通路网,并将路网类型分为:国道,省道、高速、普铁和高铁,五种类型路网分别用{GD,GS、GG、TS、TG}进行表征,同时定义火车站、客运站、机场,分别为{RS、PS、AP};
[0026]并根据设定的路网类型构建对应的跨域出行路网。
[0027]步骤2、获取移动网络基站信息,并将移动网络基站与交通网信息进行关联,具体为:
[0028]获取移动网络基站信息,以移动网络基站信号覆盖直径作为路网线路宽度构建路网缓冲区,提取缓冲区内所有基站,并为基站标记交通路网类型信息,形成基站列表;
[0029]移动网络基站的覆盖分为随功率、城市环境的变化,具有一定的差异,面对大规模广域出行方式分类需求,在此以单个4G基站的最大覆盖半径L作为统一标的,以L为直径,构建路网缓冲区,并在GIS经纬度地图上提取缓冲区内所有4G基站,并为基站标记上路网类型信息。
[0030]步骤3、获取手机数据并对手机数据预处理,并对手机数据、基站以及交通网信息进行融合,并基于手机信令数据构建手机数据特征表,具体为:
[0031]步骤3

1、获取手机数据,并对手机数据预处理;
[0032]步骤3

2、基于预处理后的手机数据,提取手机信令打点数据中存在“位置上报地市”跳变的信令数据,此处,若存在“A

B

A

B”这样的“位置上报地市”跳变数据,则表示该数据为乒乓数据,选择丢弃;
[0033]步骤3

3、将存在“位置上报地市”跳变的信令数据与路网信息进行关联,确定信令数据打点落在哪些路网类型的缓冲区中,构建跨城市打点的手机信令数据的特征列表T:
[0034]T={mdn,time,cID,LON,LAT,GG_R,GD_R,GS_R,TG_R,TS_R,RS,PS,AP}
[0035]其中,mdn表示信令数据手机端用户唯一编码,time表示信令数据采样时刻,cID表
示信令数据打点的基站编号,LON表示基站的经度,LAT表示基站的维度,GD_R为国道标识,GS_R为省道标识,GG_R为高速公路标识,TS_R为普通铁路标识,TG_R为高速铁路标识,RS为火车站标识,PS为客运站标识,AP为机场标识;
[0036]步骤3

4、基于特征列表T,构建单个用户的单个采样点在i时刻的特征列表
[0037][0038]其中,GD_R
i
表示第i个有效采样数据是否落在国道,GS_R
i
表示第i个有效采样数据是否落在省道,GG_R
i
表示第i个有效采样数据是否落在高速公路,TS_R
i
表示第i个有效采样数据是否落在普铁,TG_R
i
表示第i个有效采样数据是否落在高铁,RS
i
表示第i个有效采样数据是否落在火车站,PS
...

【技术保护点】

【技术特征摘要】
1.一种基于信令数据多重特征的城际多交通出行方式辨识方法,其特征在于,包括以下步骤:步骤1、进行交通路网绘制,并对路网进行分类;步骤2、获取移动网络基站信息,并将移动网络基站与交通网信息进行关联;步骤3、获取手机数据并对手机数据预处理,并对手机数据、基站以及交通网信息进行融合,并基于手机信令数据构建手机数据特征表;步骤4、构建随机森林模型,并基于手机数据特征表提取样本数据对随机森林模型进行训练;步骤5、基于训练后的随机森林模型对手机信令数据进行交通出行方式辨识。2.根据权利要求1所述的基于信令数据多重特征的城际多交通出行方式辨识方法,其特征在于,所述步骤1中的进行交通路网绘制,并对路网进行分类,具体为:绘制交通路网,并将路网类型分为:国道,省道、高速、普铁和高铁,五种类型路网分别用{GD,GS、GG、TS、TG}进行表征,同时定义火车站、客运站、机场,分别为{RS、PS、AP};并根据设定的路网类型构建对应的跨域出行路网。3.根据权利要求1所述的基于信令数据多重特征的城际多交通出行方式辨识方法,其特征在于,所述步骤2中的移动网络基站与交通网信息,具体为:获取移动网络基站信息,以移动网络基站信号覆盖直径作为路网线路宽度构建路网缓冲区,提取缓冲区内所有基站,并为基站标记交通路网类型信息,形成基站列表。4.根据权利要求1所述的基于信令数据多重特征的城际多交通出行方式辨识方法,其特征在于,所述步骤3中的基于手机信令数据构建手机数据特征表,具体为:步骤3

1、获取手机数据,并对手机数据预处理;步骤3

2、基于预处理后的手机数据,提取手机信令打点数据中存在“位置上报地市”跳变的信令数据;步骤3

3、将存在“位置上报地市”跳变的信令数据与路网信息进行关联,确定信令数据打点落在哪些路网类型的缓冲区中,构建跨城市打点的手机信令数据的特征列表T:T={mdn,time,cID,LON,LAT,GG_R,GD_R,GS_R,TG_R,TS_R,RS,PS,AP}其中,mdn表示信令数据手机端用户唯一编码,time表示信令数据采样时刻,cID表示信令数据打点的基站编号,LON表示基站的经度,LAT表示基站的维度,GD_R为国道标识,GS_R为省道标识,GG_R为高速公路标识,TS_R为普通铁路标识,TG_R为高速铁路标识,RS为火车站标识,PS为客运站标识,AP为机场标识;步骤3

4、基于特征列表T,构建单个用户的单个采样点在i时刻的特征列表4、基于特征列表T,构建单个用户的单个采样点在i时刻的特征列表其中,GD_R
i
表示第i个有效采样数据是否落在国道,GS_R
i
表示第i个有效采样数据是否落在省道,GG_R
i
表示第i个有效采样数据是否落在高速公路,TS_R
i
表示第i个有效采样数据是否落在普铁,TG_R
i
表示第i个有效采样数据是否落在高铁,RS
i
表示第i个有效采样数据是否落在火车站,PS
i
表示第i个有效采样数据是否落在客运站,AP
i
表示第i个有效采样数据是否落在机场;
信令数据第i个有效采样数据的打点时刻相对上一时刻打点之间的时间间隔Δt
i
、近似里程S
i
、平均速度v
i
,平均加速度acc
i
;则单个用户当日的所有采样点的特征列表为:5.根据权利要求4所述的基于信令数据多重特征的城际多交通出行方式辨识方法,其特征在于,所述步骤4中的构建随机森林模型并进行训练,具体为:步骤4

1、在手机数据特征表中提取数据作为样本数据,获得样本数据集D_sampel;步骤4

...

【专利技术属性】
技术研发人员:孙婧朱治邦杨卫东白桦刘秀彩曹璐程雪敏汤晓燕周涛
申请(专利权)人:华设设计集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1