一种基于多源城市数据的出行共现现象可视化分析方法技术

技术编号:17097578 阅读:27 留言:0更新日期:2018-01-21 09:28
本发明专利技术属于城市移动数据分析技术领域,公开了一种基于多源城市数据的出行共现现象可视化分析方法,步骤为:首先利用路网基础数据和仿真工具对城市进行区域划分,随后对针对区域间共现建模,利用该模型以及用户的设置的参数基于出租车轨迹数据对区域进行关联规则挖掘,之后结合城市兴趣点数据挖掘区域功能,最终可视化展示共现挖掘结果和区域功能。本发明专利技术能够利用多源城市数据:出租车轨迹数据,城市路网数据,POI数据,对区域共现现象及城市区域功能进行全方面多角度地可视化分析探索,为城市交通规划提供有效信息,具有便于分析数据内在关联、可操作性强等特点。

A visualization analysis method of travel co occurrence based on multi source city data

The invention belongs to the technical field of city mobile data analysis, discloses a multi city travel data visualization analysis method based on co-occurrence phenomenon, the first step is to partition the city road network using basic data and simulation tools, then for regional co-occurrence modeling, the model parameters and the user set taxi trajectory the data of regional mining association rules based on data mining point of interest after the combination of city function, the final visual co-occurrence mining results and regional function. The present invention can utilize multi-source data: City taxi trajectory data, city road network data, POI data, the regional co-occurrence phenomenon and regional city function analysis to explore all aspects of multi angle visualization, provide useful information for city traffic planning, it is easy to analysis according to the characteristics of correlation and strong operability etc..

【技术实现步骤摘要】
一种基于多源城市数据的出行共现现象可视化分析方法
本专利技术属于城市移动数据分析
,尤其涉及一种基于多源城市数据的出行共现现象可视化分析方法。
技术介绍
随着城市交通的快速发展,随之产生了大量的移动数据,这些移动数据具有丰富的时间属性、空间属性,通过这些属性能够真实的反应城市人类移动状况。出租车作为城市移动交通的重要组成部分,为城市居民出行提供极大便利。根据出租车轨迹数据可以发现城市中具有某种规律的出行模式,这种发现对了解城市结构有着极为重要的意义。我们将共现现象定义为:如果来自区域A和区域B的人在同一时间间隔内访问区域C,我们称“区域A和区域B在区域C共现”。我们可以说区域A和区域B参与了一个共现事件。一个城市中发生的所有共现事件的规律就是我们的分析主题-共现现象。基于共现现象的分析,我们可以获取到城市规划,商业策略制定,接触性传染病传播等方面的有价值的信息。路网数据是城市研究中最常用的地理数据,通常通过图的方式呈现。图中节点表示交叉路口,具有唯一的地理坐标;边表示路段,连接两个节点;其他属性,如长度、速度限制、道路类型、车道数等,都与边相关。兴趣点(PointOfInterest,POI)数据(例如餐厅、商场)通常由名称、地址、类别和地理坐标所组成,概括地介绍了各地理单元的基本属性,该类数据主要通过地图数据提供商通过人工进行标识或者网民在开源在线地图网站自由编辑得到。然而出租车轨迹数据的庞杂和抽象造成从这些数据中挖掘信息并不容易,而可视化技术结合可视图表的展示形式和人机交互,操作简化分析过程,用户通过交互修改分析模型的参数,从而生成新的可视化结果,经过可视化分析,能够从出租车轨迹数据中挖掘更多有价值的信息。本方法采用了城市出租车轨迹数据,路网数据和POI数据,旨在利用多源城市数据从多方面来共同探索出行共现现象,挖掘该现象所隐藏的价值。
技术实现思路
本专利技术的目的主要针对上述数据分析的不便之处,提出一种基于多源城市数据的出行共现现象可视化分析方法。基于路网数据对区域进行划分,通过对出租车轨迹数据处理,提取出能够反映区域间联系的共现数据;结合城市POI数据挖掘区域功能,并最终对共现结果和区域功能挖掘进行可视化展示。为了解城市结构提供有效信息。本专利技术的技术方案:一种基于多源城市数据的出行共现现象可视化分析方法,步骤如下:S1:对原始数据进行预处理S1.1:出租车运营轨迹数据的清洗以及出租车基础数据的规范化处理;S1.2:原始POI数据的清洗以及对POI数据规范化处理;S2:对步骤S1预处理得到的数据进行时间,区域划分S2.1:时间划分:根据行车规律特征,将一天划分为T个时段;S2.2:区域划分:根据城市道路路网,将城市空间划分为R个区域;S3:对步骤S2划分后的数据进行区域功能挖掘S3.1:区域功能划分,将城市区域功能归类为F类S3.2:计算每个区域中各类POI出现的频率,使用符号TFi,j表示在区域ri中第j类POI数据出现的频率,计算公式如下所示:其中,ni,j代表区域ri中第j类POI的数量,F表示POI的类别数;S3.3:计算第j类POI数据的逆文档频率,使用IDFj来表示,其中R表示区域总数量,计算公式如下:S3.4:TFi,j与IDFj相乘即是区域ri对第j类POI的TF-IDF值,表示区域的静态功能分布状况,计算公式如下:TF-IDFi,j=TFi,j×IDFjS3.5:运用LDA主题模型算法对步骤S2中的OD数据进行主题挖掘,最终结果使用进行表示,它表示区域ri的动态功能分布,其中zi,k表示第k类区域功能在区域ri的占比;S3.6:计算区域ri和区域rm之间的动态功能相似度,记为λi,m,cos表示向量间余弦值,计算公式如下:S3.7:定义如下的代价函数J,也即目标函数,表示区域真实执行的功能状况与其表现在静态和动态两方面现象的偏差,并计算出代价函数的最小值,代价函数公式如下:其中,R代表区域总数量,代表区域ri的真实功能分布,也是最终所求,代表区域rj的POI分布状况;S4:对步骤S2划分后的数据通过关联规则挖掘算法挖掘共现事件S4.1:对步骤S2所述的数据进行共现事务提取;S4.2:对S4.1提取到的数据通过关联规则Apriori算法挖掘频繁项集;S4.3:对步骤S4.2得到的数据进行相关性统计量计算,区域A和区域B之间的各相关性统计量支持度support,置信度confidence,全置信度all_confidence,最大置信度max_confidence,提升度lift,Kulczynski度量Kulc,不平衡比IR,以及余弦cosine计算公式如下,其中P表示概率:support=P(A∪B)S5:可视化展示共现结果S5.1:根据S3.7中计算得到的区域功能图,使用不同的颜色在地图上标识不同的区域功能;S5.2:根据S4.2中挖掘到的频繁项集绘制全局共现现象地图,地图基于共现关系和共现参与度两个方面进行绘制;S5.3:根据S4.2中挖掘到的频繁项集绘制区域共现环形热图,环形热图着力于分析区域和区域之间的共现规律;S5.4:根据S4.3中计算得到的统计量数据绘制平行坐标图,平行坐标图以指标来衡量两个区域之间的相关性。本专利技术的有益效果:本专利技术能够利用多源城市数据:出租车轨迹数据,城市路网数据,POI数据,对区域共现现象及城市区域功能进行全方面多角度地可视化分析探索,为城市交通规划提供有效信息,具有便于分析数据内在关联、可操作性强等特点。附图说明图1为本方法的结构图;图2为一种基于多源城市数据的出行共现现象可视化分析方法的数据处理流程图;图3为一种基于多源城市数据的出行共现现象可视化分析方法的区域划分图;图4为本专利技术实施案例利用上海2015年4月的出租车数据进行共现挖掘后的共现事件全局可视化效果;图5为本专利技术实施案例利用上海2015年4月的出租车数据进行共现挖掘后的共现热度全局可视化效果;图6为本专利技术实施案例利用上海2015年4月的出租车数据进行共现挖掘后的区域共现热度局部可视化效果;图7为本专利技术实施案例利用上海POI数据和2015年4月的出租车数据进行区域功能挖掘的可视化效果;图8为本专利技术实施案例利用上海市2015年4月的出租车数据进行共现挖掘后的区域相似性统计量分析可视化效果。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的具体实施方式作进一步的详细描述。本专利技术实施例提供了一种基于多源城市数据的出行共现现象可视化分析方法,系统流程如图1所示,数据处理流程如图2所示,该方法包括:S1:在原始数据集的基础上提取出有用的数据,步骤如下:S1.1:其中出租车运营轨迹数据的清洗针对的是2015年4月1日至2015年4月30日共30天的上海出租车轨迹数据。基于对共现现象的研究,很明显,我们需要载客出租车的OD数据,因此需要从原始数据集中提取出载客的出租车上下车时间,上下车地点经纬度,OD数据所拥有的属性包括,如表1:表1由于原始数据集中使用的距离为直线距离,但城市的道路基本是规整的,经过对城市中距离的进一步分析比较,我们抛弃原始的距离,并根据原始的经纬度计算两点的曼哈顿距离。出租车在不载客时会放慢速度来寻找乘客,对城市移动规律影响很小,因此我们选择筛掉本文档来自技高网
...
一种基于多源城市数据的出行共现现象可视化分析方法

【技术保护点】
一种基于多源城市数据的出行共现现象可视化分析方法,其特征在于,步骤如下:S1:对原始数据进行预处理S1.1:出租车运营轨迹数据的清洗以及出租车基础数据的规范化处理;S1.2:原始POI数据的清洗以及对POI数据规范化处理;S2:对步骤S1预处理得到的数据进行时间,区域划分S2.1:时间划分:根据行车规律特征,将一天划分为T个时段;S2.2:区域划分:根据城市道路路网,将城市空间划分为R个区域;S3:对步骤S2划分后的数据进行区域功能挖掘S3.1:区域功能划分,将城市区域功能归类为F类S3.2:计算每个区域中各类POI出现的频率,使用符号TFi,j表示在区域ri中第j类POI数据出现的频率,计算公式如下所示:

【技术特征摘要】
1.一种基于多源城市数据的出行共现现象可视化分析方法,其特征在于,步骤如下:S1:对原始数据进行预处理S1.1:出租车运营轨迹数据的清洗以及出租车基础数据的规范化处理;S1.2:原始POI数据的清洗以及对POI数据规范化处理;S2:对步骤S1预处理得到的数据进行时间,区域划分S2.1:时间划分:根据行车规律特征,将一天划分为T个时段;S2.2:区域划分:根据城市道路路网,将城市空间划分为R个区域;S3:对步骤S2划分后的数据进行区域功能挖掘S3.1:区域功能划分,将城市区域功能归类为F类S3.2:计算每个区域中各类POI出现的频率,使用符号TFi,j表示在区域ri中第j类POI数据出现的频率,计算公式如下所示:其中,ni,j代表区域ri中第j类POI的数量,F表示POI的类别数;S3.3:计算第j类POI数据的逆文档频率,使用IDFj来表示,其中R表示区域总数量,计算公式如下:S3.4:TFi,j与IDFj相乘即是区域ri对第j类POI的TF-IDF值,表示区域的静态功能分布状况,计算公式如下:TF-IDFi,j=TFi,j×IDFjS3.5:运用LDA主题模型算法对步骤S2中的OD数据进行主题挖掘,最终结果使用进行表示,它表示区域ri的动态功能分布,其中zi,k表示第k类区域功能在区域ri的占比;S3.6:计算区域ri和区域rm之间的动态功能相似度,记为λi,m,cos表示向量间余弦值,计算公式如下:S3.7:定义如下的代价函数J,也即目标函数,表示区域真实执行的功能状况与其表现在静态和动态两方面现象的偏差,并计算出代价函数的最小值,代价函数公式如下:其中,R代表区域总数量,代表区域ri的真实功能分布,也是...

【专利技术属性】
技术研发人员:孔祥杰李梦琳夏锋赵高兴刘程程
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1