基于出租车OD数据的非常态居民出行模式挖掘方法技术

技术编号：28558921 阅读：19 留言：0更新日期：2021-05-25 17:53

基于出租车OD数据的非常态居民出行模式挖掘方法属于智能交通和数据挖掘领域。为了能够更好的挖掘出租车乘客出行规律，同时更深入的挖掘居民出行中存在的非常态模式，本发明专利技术提出了一种基于高维度稀疏张量分解的方法，即通过组织包括时间、经纬度、功能区属性等多维度信息为张量模型，对其进行低秩稀疏分解。为此，需要解决的关键技术问题包括：对研究区域划分功能区并把对应数据归到相应功能区内；组织时间、经纬度、功能区属性等对应数据构成张量模型；对张量模型做低秩稀疏分解，分别提取低秩模型和稀疏模型并做Tucker分解；对分解得到的基底矩阵做可视化，直观的展现乘客出行模式。

全部详细技术资料下载

【技术实现步骤摘要】
基于出租车OD数据的非常态居民出行模式挖掘方法
本专利技术属于智能交通和数据挖掘领域，具体涉及市区居民的非常态出行规律挖掘方法。
技术介绍
随着信息技术的快速发展和无处不在的数据，在空间和时间尺度上记录人类个体活动的位置及轨迹数据已经成为可能。在大数据的驱动下，这些位置信息不仅帮助规划人员和研究人员将城市理解为复杂的系统，而且还允许研究人员通过以数据为中心的技术来理解人类活动的规律。这种移动数据的出现确实带来了将更多信息整合到决策中去的机会。然而，数据的复杂性也随其内容的维数而增加，这意味着空间、时间和社会属性之间存在复杂的依赖关系和高阶相互作用。考虑到出租车作为城市中的重要交通工具之一，通过出租车OD数据了解城市居民的出行需求是理解城市人类活动规律的重要途径。随着大数据的发展，近十几年来针对人类移动规律的研究越来越多。由于数据的多样性，研究人员通过多种不同的载体跟踪人类移动。MartaC.等人通过对手机信号定位的跟踪来追寻人类的移动轨迹，发现他们的移动轨迹服从幂律分布，同时对轨迹访问点的概率密度做了可视化，发现研究人群总是出现在特定的轨迹路线并访问特定的地点；随后MartaC.为了发现更宏观的移动规律和Filippo等人对美国政府提供的人口普查数据进行研究，发现居民在求职时，在距离居住地近的基础上更倾向于人口密度大的城市。这种规律类似于引力模型，也就是说两地间通勤流量和两地距离成反比而与人口数量成正比，这个规律同样适用于人口迁徙以及货物运输等；Luca等人通过对私家车GPS定位的追踪发现存在两个截然不同特征的人类流...

【技术保护点】
1.基于出租车OD数据的非常态居民出行模式挖掘方法，其特征在于：/n1)数据预处理和功能区划分：原始数据是使用嘀嘀打车数据，原始数据记录乘客从上车开始到下车的行车轨迹，在此提取每条数据的起点和终点O-D数据的时间和经纬度信息；研究区域总共包括8km*8km的正方形区域，对此区域各位置做功能区属性划分，对不同区域用使用不同颜色不透明像素将其覆盖；总共分类为11中功能区类别包括：住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学；/n2)构建数据张量：把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量；在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据；三阶张量中每个单位格子中表示某时间段内某个位置的某个区域的打车数据量；/n3)低秩稀疏张量分解模型构建：为了得到数据中非常态模式的数据，在此对原始张量做一个提取分解，使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量；常态模式即为每天交通规律中周期性较强的数据，在每个时间段每个地点出现的打车数量相似；而非常态模式则为...

【技术特征摘要】
1.基于出租车OD数据的非常态居民出行模式挖掘方法，其特征在于：
1)数据预处理和功能区划分：原始数据是使用嘀嘀打车数据，原始数据记录乘客从上车开始到下车的行车轨迹，在此提取每条数据的起点和终点O-D数据的时间和经纬度信息；研究区域总共包括8km*8km的正方形区域，对此区域各位置做功能区属性划分，对不同区域用使用不同颜色不透明像素将其覆盖；总共分类为11中功能区类别包括：住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学；
2)构建数据张量：把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量；在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据；三阶张量中每个单位格子中表示某时间段内某个位置的某个区域的打车数据量；
3)低秩稀疏张量分解模型构建：为了得到数据中非常态模式的数据，在此对原始张量做一个提取分解，使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量；常态模式即为每天交通规律中周期性较强的数据，在每个时间段每个地点出现的打车数量相似；而非常态模式则为在周期性之外的数据，这样的数据通常出现的频率较低；为经过预处理后的OD数据和功能区数据张量，三个矩阵V,F,T分别表示位置矩阵，维度为1600×6，区域属性矩阵，维度为11×4和时间的基底矩阵，维度为17×3；通过如下的低秩稀疏张量分解模型，构建表达常态模式张量D1与非常态模式张量D2以及相应的不同维度模态，即

目标函数第一项||[D1](3)||*表示对常态模式下张量的时间维度做低秩约束，||||*表示核范数约束，||D2||1表示对D2做稀疏约束，×1，×2，×3表示模乘，Vi,Fi,Ti分别为张量Di不同维度的基底，Ai,i＝1,2为对应基底下的核张量，即表示系数，矩阵V,F,T分别表示位置矩阵，维度为1600×6，区域属性矩阵，维度为11×4和时间的基底矩阵，维度为17×3，0.1≤α＜1为稀疏与低秩约束的权重，从0.1到1寻求最优值，i＝1,2时分别执行约束条件；
4)低秩稀疏张量分解模型求解：
为求解(1)，在此引入辅助变量Vi′,Fi′,Ti′,i＝1,2,辅助变量与V,F,T维度相同，通过初始化随机值赋值来迭代求取最优值，在约束条件中加上约束使辅助变量值逼近原矩阵；把模型(1)改写为

使用乘子法对模型(2)求解，将其转化为如下的增广拉格朗日函数：

其中，<·,·>表示两个矩阵的内积运算，β为对应于约束条件D＝D1+D2的拉格朗日乘子，β1，β2分别为Di＝Ai×1Vi×2Fi×3Ti的乘子；矩阵V,F,T分别表示位置矩阵，维度为1600×6，区域属性矩阵，维度为11×4和时间的基底矩阵，维度为，17×3；μ为惩罚参数，初始值为1，在每次迭代中以1.05倍速度增大；在此采用交替方向法求解(2)；具体分为如下几个子问题；
子问题D1求解低秩模型：

取中间变量对其做SVD分解求得奇异值矩阵利用软阈值函数，的奇异值矩阵σ1的闭合解为：

【专利技术属性】
技术研发人员：王立春，张彬，王少帆，孔德慧，尹宝才，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人