基于出租车OD数据的非常态居民出行模式挖掘方法技术

技术编号:28558921 阅读:19 留言:0更新日期:2021-05-25 17:53
基于出租车OD数据的非常态居民出行模式挖掘方法属于智能交通和数据挖掘领域。为了能够更好的挖掘出租车乘客出行规律,同时更深入的挖掘居民出行中存在的非常态模式,本发明专利技术提出了一种基于高维度稀疏张量分解的方法,即通过组织包括时间、经纬度、功能区属性等多维度信息为张量模型,对其进行低秩稀疏分解。为此,需要解决的关键技术问题包括:对研究区域划分功能区并把对应数据归到相应功能区内;组织时间、经纬度、功能区属性等对应数据构成张量模型;对张量模型做低秩稀疏分解,分别提取低秩模型和稀疏模型并做Tucker分解;对分解得到的基底矩阵做可视化,直观的展现乘客出行模式。

【技术实现步骤摘要】
基于出租车OD数据的非常态居民出行模式挖掘方法
本专利技术属于智能交通和数据挖掘领域,具体涉及市区居民的非常态出行规律挖掘方法。
技术介绍
随着信息技术的快速发展和无处不在的数据,在空间和时间尺度上记录人类个体活动的位置及轨迹数据已经成为可能。在大数据的驱动下,这些位置信息不仅帮助规划人员和研究人员将城市理解为复杂的系统,而且还允许研究人员通过以数据为中心的技术来理解人类活动的规律。这种移动数据的出现确实带来了将更多信息整合到决策中去的机会。然而,数据的复杂性也随其内容的维数而增加,这意味着空间、时间和社会属性之间存在复杂的依赖关系和高阶相互作用。考虑到出租车作为城市中的重要交通工具之一,通过出租车OD数据了解城市居民的出行需求是理解城市人类活动规律的重要途径。随着大数据的发展,近十几年来针对人类移动规律的研究越来越多。由于数据的多样性,研究人员通过多种不同的载体跟踪人类移动。MartaC.等人通过对手机信号定位的跟踪来追寻人类的移动轨迹,发现他们的移动轨迹服从幂律分布,同时对轨迹访问点的概率密度做了可视化,发现研究人群总是出现在特定的轨迹路线并访问特定的地点;随后MartaC.为了发现更宏观的移动规律和Filippo等人对美国政府提供的人口普查数据进行研究,发现居民在求职时,在距离居住地近的基础上更倾向于人口密度大的城市。这种规律类似于引力模型,也就是说两地间通勤流量和两地距离成反比而与人口数量成正比,这个规律同样适用于人口迁徙以及货物运输等;Luca等人通过对私家车GPS定位的追踪发现存在两个截然不同特征的人类流动性:“回归者”和“探索者”。“回归者”将他们的大部分流动性限制在几个地点,相反“探索者”总是涉足更多的新地点。随着社交网络的发展,网站门户的登录记录同样能从记录用户的定位。例如,Yan等人使用微博等网站的登录信息进行研究,建立了吸引力模型,该模型同时从个体和宏观层面对网站用户的移动规律进行了总结。但是这几种模型只能粗略统计人群的出行规律,由于调查载体的不稳定性很容易得到错误数据或丢失数据。为了得到居民日常的出行数据,研究人员对公交车乘客刷卡数据进行研究。考虑到雨雪天气对居民出行有着重要影响,为了探索天气变化对公交乘客出行的影响,Sui等人对自回归滑动平均(AutoregressiveIntegratedMovingAveragemodel,ARIMA)模型进行改进,得到了研究外部变量对时间序列影响的周期性模型,该模型包含了周期和非周期自相关性,很好地模拟了天气对每小时交通客流量的影响。区域层次的流动模式可以提供关于人们如何聚集或离开该区域的更宏观和直观的知识,Qi等人通过对公交车站点进行聚类,把范围内的站牌聚类为区域,并引入了PointofInterest(POI)数据为每个区域分配了功能属性,实现了基于区域属性的区域流动模式的分析和预测。刘耀林等人基于公交刷卡数据,以武汉市主城区和都市发展区为研究区,通过构建出行模型和职住地识别规则,识别了职住通勤群体,从职住密度、通勤时间与距离、通勤流向和可视化等方面对武汉市的通勤出行和职住平衡进行测度,并识别了武汉市的职住通勤模式。Pan等人使用自回归滑动模型对杭州市区热点乘客数量预测并做测点推荐,但是他们仅考虑了出租车历史数据而忽略了影响乘客出行的天气因素。Pang等人通过对市区进行网格划分,构建了空间模式下的出租车OD矩阵,并通过稀疏分解得到空间非常态出行模式。但是这种分析方法仅仅考虑了空间下出行规律,而忽略了城市区功能区对于乘客出行的潜在影响。
技术实现思路
为了能够更好的挖掘出租车乘客出行规律,同时更深入的挖掘居民出行中存在的非常态模式,本专利技术提出了一种基于高维度稀疏张量分解的方法,即通过组织包括时间、经纬度、功能区属性等多维度信息为张量模型,对其进行低秩稀疏分解。为此,需要解决的关键技术问题包括:对研究区域划分功能区并把对应数据归到相应功能区内;组织时间、经纬度、功能区属性等对应数据构成张量模型;对张量模型做低秩稀疏分解,分别提取低秩模型和稀疏模型并做Tucker分解;对分解得到的基底矩阵做可视化,直观的展现乘客出行模式。本专利技术提出一种基于稀疏张量分解模型的乘客出行规律挖掘方法,整体框架如图1所示。首先对原始数据进行预处理,提取滴滴打车每条数据中的起点-终点即O-D点,对研究区域做功能区划分,分类为住宅区、商业区、学校等11类区域属性;把从O-D数据中提取的时间、空间数据结合其所属的功能区构成三阶张量,张量中每个单位表示当前时间段内某个位置的某个区域,如上午九点到九点半北二环某个商场的打车数据量;对张量模型做低秩稀疏分解,得到低秩和稀疏模式两个模型,并对其做Tucker分解得到基底矩阵;对时间、空间、功能区基底矩阵分别做可视化分析。本专利技术所提出方法的具体步骤如下:1)数据预处理和功能区划分:原始数据是使用嘀嘀打车数据,原始数据记录乘客从上车开始到下车的行车轨迹,在此提取每条数据的起点和终点(O-D数据)的时间和经纬度信息。研究区域总共包括8km*8km的正方形区域,对此区域各位置做功能区属性划分,对不同区域用使用不同颜色不透明像素将其覆盖。总共分类为11中功能区类别包括:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学。2)构建数据张量:把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量。在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据。三阶张量中每个单位格子中表示某时间段内某个位置的某个区域如上午九点到九点半北二环某个商)的打车数据量。3)低秩稀疏张量分解模型构建:为了得到数据中非常态模式的数据,在此对原始张量做一个提取分解,使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量。常态模式即为每天交通规律中周期性较强的数据,在每个时间段每个地点出现的打车数量相似。而非常态模式则为在周期性之外的数据,这样的数据通常出现的频率较低。为经过预处理后的OD数据和功能区数据张量,三个矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3。通过如下的低秩稀疏张量分解模型,构建表达常态模式张量D1与非常态模式张量D2以及相应的不同维度模态,即目标函数第一项||[D1](3)||*表示对常态模式下张量的时间维度做低秩约束,||||*表示核范数约束,||D2||1表示对D2做稀疏约束,×1,×2,×3表示模乘,Vi,Fi,Ti分别为张量Di不同维度的基底,Ai,i=1,2为对应基底下的核张量,即表示系数,矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3,0.1≤α<1为稀疏与低秩约束的权重,从0.1到1寻求最优值,i=1,2时分别执行约束条件。4)低秩稀疏张量分解模型求解:为求解(1),在此引入辅助变量Vi',Fi',Ti',i=1,2,辅助变量与V,F,T维度相本文档来自技高网
...

【技术保护点】
1.基于出租车OD数据的非常态居民出行模式挖掘方法,其特征在于:/n1)数据预处理和功能区划分:原始数据是使用嘀嘀打车数据,原始数据记录乘客从上车开始到下车的行车轨迹,在此提取每条数据的起点和终点O-D数据的时间和经纬度信息;研究区域总共包括8km*8km的正方形区域,对此区域各位置做功能区属性划分,对不同区域用使用不同颜色不透明像素将其覆盖;总共分类为11中功能区类别包括:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学;/n2)构建数据张量:把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量;在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据;三阶张量中每个单位格子中表示某时间段内某个位置的某个区域的打车数据量;/n3)低秩稀疏张量分解模型构建:为了得到数据中非常态模式的数据,在此对原始张量做一个提取分解,使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量;常态模式即为每天交通规律中周期性较强的数据,在每个时间段每个地点出现的打车数量相似;而非常态模式则为在周期性之外的数据,这样的数据通常出现的频率较低;...

【技术特征摘要】
1.基于出租车OD数据的非常态居民出行模式挖掘方法,其特征在于:
1)数据预处理和功能区划分:原始数据是使用嘀嘀打车数据,原始数据记录乘客从上车开始到下车的行车轨迹,在此提取每条数据的起点和终点O-D数据的时间和经纬度信息;研究区域总共包括8km*8km的正方形区域,对此区域各位置做功能区属性划分,对不同区域用使用不同颜色不透明像素将其覆盖;总共分类为11中功能区类别包括:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学;
2)构建数据张量:把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量;在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据;三阶张量中每个单位格子中表示某时间段内某个位置的某个区域的打车数据量;
3)低秩稀疏张量分解模型构建:为了得到数据中非常态模式的数据,在此对原始张量做一个提取分解,使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量;常态模式即为每天交通规律中周期性较强的数据,在每个时间段每个地点出现的打车数量相似;而非常态模式则为在周期性之外的数据,这样的数据通常出现的频率较低;为经过预处理后的OD数据和功能区数据张量,三个矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3;通过如下的低秩稀疏张量分解模型,构建表达常态模式张量D1与非常态模式张量D2以及相应的不同维度模态,即



目标函数第一项||[D1](3)||*表示对常态模式下张量的时间维度做低秩约束,||||*表示核范数约束,||D2||1表示对D2做稀疏约束,×1,×2,×3表示模乘,Vi,Fi,Ti分别为张量Di不同维度的基底,Ai,i=1,2为对应基底下的核张量,即表示系数,矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3,0.1≤α<1为稀疏与低秩约束的权重,从0.1到1寻求最优值,i=1,2时分别执行约束条件;
4)低秩稀疏张量分解模型求解:
为求解(1),在此引入辅助变量Vi′,Fi′,Ti′,i=1,2,辅助变量与V,F,T维度相同,通过初始化随机值赋值来迭代求取最优值,在约束条件中加上约束使辅助变量值逼近原矩阵;把模型(1)改写为



使用乘子法对模型(2)求解,将其转化为如下的增广拉格朗日函数:



其中,<·,·>表示两个矩阵的内积运算,β为对应于约束条件D=D1+D2的拉格朗日乘子,β1,β2分别为Di=Ai×1Vi×2Fi×3Ti的乘子;矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为,17×3;μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大;在此采用交替方向法求解(2);具体分为如下几个子问题;
子问题D1求解低秩模型:



取中间变量对其做SVD分解求得奇异值矩阵利用软阈值函数,的奇异值矩阵σ1的闭合解为:

【专利技术属性】
技术研发人员:王立春张彬王少帆孔德慧尹宝才
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1