一种基于手机信令数据的城市出行方式识别方法技术

技术编号:25602071 阅读:36 留言:0更新日期:2020-09-11 23:58
本发明专利技术公开了一种基于手机信令数据的城市出行方式识别方法,针对目标城市全天产生的手机信令数据,识别出每个人的停驻点及全天出行OD,首先通过地铁专用基站精准识别出所有地下轨道交通出行方式,然后在提取手机数据特征参数的基础上与高德GPS真实导航数据相比较,利用无监督的机器学习算法识别居民出行的交通方式。本发明专利技术基于手机信令数据在利用地铁专用基站判断地下轨道交通出行的基础上,结合显著出行特征的划分、高德GPS导航规划不同方式的出行路径特征偏移度判断、无监督的模糊K‑means聚类机器学习算法,对目标城市一天产生的全样本出行的交通方式进行识别。

【技术实现步骤摘要】
一种基于手机信令数据的城市出行方式识别方法
本专利技术涉及交通规划领域,具体是交通需求预测领域。
技术介绍
交通需求预测是城市交通规划的基础,能够准确地预测城市交通需求对合理管理和控制城市交通系统具有重要意义。在现有的交通需求预测方法(例如交通分配模型)中都高度依赖于不同出行方式下的出行需求估计。然而,鉴于其高度复杂的性质,准确预测不同方式的需求具有一定的难度。这是由于运输系统的运行和交通流的时间/空间波动是不可检测的,因此,有效识别交通方式是当前技术的关键。以往通过传统调查手段获取出行方式等交通信息的方法存在许多缺陷,如调查成本高,抽样率低等,近年来移动智能设备迅速发展,如何从包含有居民移动位置信息的轨迹数据比如GPS数据、手机信令数据中获取出行方式成为了交通领域关注的热点。目前现有技术中,张锦等人公开了一种基于手机信令数据的居民出行方式综合判别的方法(CN201510452430.1),采用了出行方式子链与GIS线网匹配结合构建先验概率的方法,将属于机动车出行方式的子链分别与GIS的轨道交通线网、公交线网进行匹配来判别轨道交通出行与常规公交出行,后通过平均速度、最大速度与出行时长三个属性,对剩下可能的出行方式构建先验概率进行判别。该方法采用的GIS线网匹配判断轨道交通出行和公交出行的方法忽略了与轨道线网和公交线网相重叠的小汽车出行的情况,容易造成误判;以及后续构建先验概率的过程中,仅考虑了平均速度、最大速度与出行时长三个属性,由于手机信令数据的位置更新是以基站为单位,得到的出行特征与实际情况都存在一定误差,所以仅考虑这三个属性容易造成误判。张锦等人还公开了一种基于手机信令数据的半监督SVM的交通方式判别方法(CN201910076104.3),通过人工识别流程对部分出行进行方式识别后,将已标记的样本和未标记的样本一起训练半监督SVM分类器。该方法由于采用了部分人工判别流程,在实际操作中专家的选取与工人标记的组织都有一定困难,耗时长且结果受主观因素影响。杨继伟等人公开了一种基于大数据机器学习的出行方式辨识方法(CN201710693960.4),通过采集训练样本调查对象的手机信令数据和加速度检测设备数据,分析数据波动特征,获取速度加速度波动特征数据作为预测输入值,出行方式作为输出值,训练机器学习算法,最终选取精度高的算法进行出行方式划分。该方法需要调查对象配合采集加速度检测设备数据,此过程受人力物力等多重因素影响实施难度大,不仅样本数量受到限制,而且数据质量受加速度检测设备质量以及调查对象使用程度影响,且将一次调查采集的数据训练得到的算法模型运用于此后所有出行数据的方式识别并不合理。
技术实现思路
针对
技术介绍
中存在的问题,本专利技术提出了一种基于手机信令数据的城市出行方式识别方法。技术方案:一种基于手机信令数据的城市出行方式识别方法,结合图1,具体步骤为:S1、根据手机信令数据识别用户停驻点,得到出行OD;S2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;S3、根据地铁专用基站信息识别地铁出行OD;S4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;S5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;S6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分。优选的,步骤S1对获得的手机信令数据进行清洗后,基于基站停留时间和服务半径识别用户停驻点,当用户以某一基站为中心在服务半径阈值radius_range范围内停留时长超过停驻时间阈值min_stay_time,则将该基站作为用户的停驻点,进而根据出行停驻点得到出行OD。实施中,radius_range可取800m~1500m,min_stay_time取40min。优选的,步骤S2针对得到的每条出行OD,提取其出行特征,包括:起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv;筛选出行距离distance小于有效出行距离阈值min_dis、出行时间move_time小于有效出行时间阈值min_time、出行平均速度speed大于城市交通工具的平均出行速度最大值max_speed的无效OD并删除。实施中,min_dis选取1km,min_time选取5min,max_speed选取120km/h。优选的,步骤S4根据出行OD的出行距离distance与出行平均速度speed对方式进行划分,具体步骤如下:S41、若出行距离distance超过城市长距离出行阈值long_dis的长距离出行OD,划分为小汽车方式出行;S42、若平均出行速度speed小于等于步行速度阈值walk_speed同时出行距离distance小于等于步行出行距离阈值walk_dis的出行OD,划分为步行方式出行。实施中,long_dis可取30km~100km,walk_speed选取8km/h,walk_dis选取3km。优选的,步骤S5通过比较OD的出行特征与爬取高德不同方式规划出行的特征相似度识别OD出行方式,具体步骤如下:S51、针对每条未识别的出行OD,以出行特征起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time为参数分别爬取高德步行、自行车、公交、小汽车方式规划路径的出行距离GD_dis与出行时耗GD_time;S52、计算每条出行OD与上述4中交通方式高德规划的总偏移度GD_diff:i)与高德某交通方式规划时间偏移度GD_time_diff=Math.abs(出行时耗move_time–高德规划时间GD_time)/出行时耗move_timeii)与高德某交通方式规划距离偏移度GD_dis_diff=Math.abs(出行距离distance–高德规划距离GD_dis)/出行距离distanceiii)与高德某交通方式规划的总偏移度GD_diff=与高德某交通方式规划时间偏移度GD_time_diff*α+与高德某交通方式规划距离偏移度GD_dis_diff*(1–α),其中α为高德规划出行时耗权重;S53、比较并判断每条OD偏移度GD_diff最低的交通方式;S54、若步行方式偏移度GD_diff最低且小于偏移度阈值max_diff,且出行距离distance<步行出行距离阈值walk_dis,判断为步行;S55、若骑行方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为自行车;S本文档来自技高网
...

【技术保护点】
1.一种基于手机信令数据的城市出行方式识别方法,其特征在于具体步骤为:/nS1、根据手机信令数据识别用户停驻点,得到出行OD;/nS2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;/nS3、根据地铁专用基站信息识别地铁出行OD;/nS4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;/nS5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;/nS6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分。/n

【技术特征摘要】
1.一种基于手机信令数据的城市出行方式识别方法,其特征在于具体步骤为:
S1、根据手机信令数据识别用户停驻点,得到出行OD;
S2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;
S3、根据地铁专用基站信息识别地铁出行OD;
S4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;
S5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;
S6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分。


2.根据权利要求1所述的方法,其特征在于步骤S1对获得的手机信令数据进行清洗后,基于基站停留时间和服务半径识别用户停驻点,当用户以某一基站为中心在服务半径阈值radius_range范围内停留时长超过停驻时间阈值min_stay_time,则将该基站作为用户的停驻点,进而根据出行停驻点得到出行OD。


3.根据权利要求1所述的方法,其特征在于步骤S2针对得到的每条出行OD,提取其出行特征,包括:起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv;筛选出行距离distance小于有效出行距离阈值min_dis、出行时间move_time小于有效出行时间阈值min_time、出行平均速度speed大于城市交通工具的平均出行速度最大值max_speed的无效OD并删除。


4.根据权利要求1所述的方法,其特征在于步骤S4根据出行OD的出行距离distance与出行平均速度speed对方式进行划分,具体步骤如下:
S41、若出行距离distance超过城市长距离出行阈值long_dis的长距离出行OD,划分为小汽车方式出行;
S42、若平均出行速度speed小于等于步行速度阈值walk_speed同时出行距离distance小于等于步行出行距离阈值walk_dis的出行OD,划分为步行...

【专利技术属性】
技术研发人员:万紫吟陆振波张改夏井新余启航刘娟张念启张静芬
申请(专利权)人:南京瑞栖智能交通技术产业研究院有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1