基于OD数据感知城市动态结构演化规律的可视分析方法技术

技术编号:20176738 阅读:22 留言:0更新日期:2019-01-23 00:23
本发明专利技术公开了一种基于OD数据感知城市动态结构演化规律的可视分析方法,包括如下步骤:步骤1:收集OD数据,并存储在数据库中;步骤2:对位置进行聚类,对轨迹按位置聚类和小时聚合;步骤3:按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;步骤4:基于位置聚类网络序列,定义LDA模型,训练得到主题模型,并对主题基于重要程度排序;步骤5:设计主题‑时间视图,可视化不同主题在每个位置网络中的概率分布,展示不同主题随着时间的演化特征;步骤6:设计边关联视图,直观展示重要区域的空间分布和它们之间的流量关系;步骤7:设计边流量时间分布视图,展示边关联视图中每条弧线在不同时间步下出现的概率。

Visual Analysis Method for Perception of Urban Dynamic Structure Evolution Based on OD Data

The invention discloses a visual analysis method based on OD data to perceive the evolution law of urban dynamic structure, which includes the following steps: step 1: collecting OD data and storing it in database; step 2: clustering location, clustering trajectory by location and aggregating trajectory by hour; step 3: constructing location clustering network sequence by hour to characterize the flow relationship among clusters in an hour. Step 4: Define LDA model based on location clustering network sequence, train the topic model, and rank the topics based on importance degree; Step 5: Design topic time view, visualize the probability distribution of different topics in each location network, and show the evolution characteristics of different topics over time; Step 6: Design side Association view to visualize the space of important areas. Step 7: Design a time distribution view of side flow to show the probability of each arc appearing at different time steps in the side correlation view.

【技术实现步骤摘要】
基于OD数据感知城市动态结构演化规律的可视分析方法
本专利技术属于信息
,具体是一种基于OD数据感知城市动态结构演化规律的可视分析方法。
技术介绍
感知城市动态,理解居民如何在城市中移动、他们的行为模式如何随着时间演化,是智慧城市建设必须解决的课题。传统的城市动态研究依赖于粗糙的统计数据和小范围的调查问卷,无法细粒度地从个体层面构建定量模型。随着无线通讯和移动互联网技术的快速发展,带来了丰富多样的具有个体标记和时空信息的数据集,为理解城市动态结构和人群活动模式提供了新的手段。一些具有OD(origin-destination)属性的公共交通数据集,如公共自行车、公交车、出租车数据等,记录了个体时空移动信息,包括出行的起点/终点、起始/结束时间等,能用于挖掘城市动态结构。LDA(LatentDirichletAllocation)主题模型已被用于研究人类行为和城市模式。采用社交网络数据挖掘城市模式,个体轨迹采样频率较低、在数据代表性上有所欠缺。手机定位数据的用户位置通常由基站位置近似估算得到,精度有限。采用这两类数据只能提取城市中的热点区域,忽略了人群在区域之间的流动关系。Ferrari等人基于谷歌位置数据集来发现用户的日常活动轨迹,但只能分析个体用户行为。Chu等人将出租车轨迹的地理坐标转化为街道名字,将每辆出租车的轨迹看作一个文档,将转化后的街道名字看作是单词,来识别出租车轨迹中隐含的主题。提取得到的主题反映了重要街道的使用模式。他们的研究关注于街道在城市中的使用情况。总的来说,现有的城市动态分析方法不仅缺乏对重要的流动关系和城市结构演化规律的分析,而且很难挖掘得到隐含在数据集背后的语义级别的信息。此外,数据挖掘的结果是一些复杂的数字,对于领域专家来说很难理解。因此需要设计一种可视分析方法,不仅能够从OD数据集中提取隐含城市动态演化规律的主题信息,从语义层面上发现城市结构的时域变化,而且能够支持交互式地演化模式分析,基于多样化的视觉线索找到这些模式发生的原因。
技术实现思路
为了解决现有技术中存在的上述技术问题,本专利技术的目的是从OD数据集中挖掘得到城市动态结构的演化规律,设计基于主题模型的方法从语义层面发现城市动态结构,设计可视分析方法辅助分析者渐进式地理解演化模式,通过与丰富的可视化组件进行交互,找到促使这些模式发生的内在原因,有助于相关人员更好地进行交通管理和城市规划,促进智慧城市的构建。其具体技术方案如下:一种基于OD数据感知城市动态结构演化规律的可视分析方法,包括如下步骤:步骤1:收集OD数据,并存储在数据库中;步骤2:对位置进行聚类,对轨迹按位置聚类和小时聚合;步骤3:按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;步骤4:基于位置聚类网络序列,定义LDA模型,训练得到主题模型,并对主题基于重要程度排序;步骤5:设计主题-时间视图,可视化不同主题在每个位置网络中的概率分布,展示不同主题随着时间的演化特征;步骤6:设计边关联视图,直观展示重要区域的空间分布和它们之间的流量关系;步骤7:设计边流量时间分布视图,展示边关联视图中每条弧线在不同时间步下出现的概率。进一步的,所述步骤1包括:获取OD数据集,并存储在轨迹记录表中,一条轨迹记录trajRec表示如下:trajRec=[startLocLong,startLocLat,startTime,endLocLong,endLocLat,endTime]其中startLocLong和startLocLat为出发地点的经度和纬度,startTime为出发时间,endLocLong和endtLocLat为到达地点的经度和纬度,endTime为到达时间。进一步的,所述步骤2包括:步骤2.1:对所有位置进行聚类:假设locSet={locLongi,locLati}(1≤i≤n)为包含所有出发地点和到达地点的位置集合,一共有n个位置点;locLongi和locLati为第i个位置点的经度和纬度;第i个位置点和第j个位置点之间的距离定义为:使用k-means算法根据距离定义将地理相邻的位置聚合在一起,获取得到位置聚类集合cluLocSet={cluLoci}(1≤i≤k),其中k是聚类个数,一个位置聚类cluLoci中包含了多个相邻的位置点;步骤2.2:将轨迹按位置聚类和小时聚合,基于trajRec,以小时为单位统计某两个聚类间在单位时间内的人流量,并存储加速后续计算;聚合后的一条记录trajAggrRec表示为:trajAggrRec=[startDate,startHour,startCluLoc,endCluLoc,flowNum]其中startDate表示出发日期,startHour表示出发小时,可以从starttTme中提取得到;startCluLoc和endCluLoc表示出发和到达的位置聚类的ID,flowNum表示在某日(startDate)某小时(startHour)内,从startCluLoc内出发到达endCluLoc的人流量。进一步的,所述步骤3包括:按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;假设Gτ=(cluLocSet,Eτ)表示在时间步τ下的位置聚类网络,用一个图结构表示;其中位置聚类集合cluLocSet被看作是顶点集合,Eτ为边集合。eijτ∈Eτ表示在时间步τ内从cluLoci出发到达cluLocj的人流量,具体的值从trajAggrRec中查询得到;然后按小时构建位置聚类网络序列NS={G1,G2,...,GT},T为所有时间步的总数,由待分析的时间段内的日期数d决定,T=24×d。进一步的,所述步骤4包括:步骤4.1:基于位置聚类网络序列,定义LDA模型;LDA模型包含3层:文档、单词和主题;一篇文档是由一组单词构成的集合,所有的文档集构成了一个语料库;一篇文档可以包含多个主题,文档中每一个词都由其中的一个主题生成;将每个时间步下的位置聚类网络Gτ看作是一篇文档,从而位置聚类网络序列NS={G1,G2,...,GT}构成了一个语料库;将边集合Eτ看作是一篇文档Gτ中的单词集合,一条边的权重eijτ对应于一个单词在一篇文档中出现的频率;主题为网络序列中的结构信息,隐含了城市动态相关的、重要的语义信息;步骤4.2:通过将位置聚类网络定义为文档,将网络中的边关联定义为单词,训练得到一个主题模型,推理OD数据集中隐含的K个主题;采用EM算法训练得到模型参数,采用Gibbs采样计算得到2个概率分布:网络-主题概率分布和主题-边关联概率分布;对于网络-主题概率分布来说,每一个网络代表了一些主题所构成的一个概率分布;用θτ表示网络Gτ的主题概率分布,θτ,k表示主题k在Gτ网络中的概率;对于主题-边关联概率分布来说,由于每一个主题又代表了很多边所构成的一个概率分布,一条边在不同的主题上具有不同的概率;对于主题k,计算得到的边关联概率由表示;在一个主题中,具有高概率的边被认为更能代表那个主题。步骤4.3:对主题基于重要程度排序;由于每个主题在不同的位置聚类网络中具有不同的概率,一个主题在所有网络中的概率和表征了这个主题的重要程度;对于第k个主题,计算表示第k个主题在所有网络中的概率和。s本文档来自技高网
...

【技术保护点】
1.一种基于OD数据感知城市动态结构演化规律的可视分析方法,包括如下步骤:步骤1:收集OD数据,并存储在数据库中;步骤2:对位置进行聚类,对轨迹按位置聚类和小时聚合;步骤3:按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;步骤4:基于位置聚类网络序列,定义LDA模型,训练得到主题模型,并对主题基于重要程度排序;步骤5:设计主题‑时间视图,可视化不同主题在每个位置网络中的概率分布,展示不同主题随着时间的演化特征;步骤6:设计边关联视图,直观展示重要区域的空间分布和它们之间的流量关系;步骤7:设计边流量时间分布视图,展示边关联视图中每条弧线在不同时间步下出现的概率。

【技术特征摘要】
1.一种基于OD数据感知城市动态结构演化规律的可视分析方法,包括如下步骤:步骤1:收集OD数据,并存储在数据库中;步骤2:对位置进行聚类,对轨迹按位置聚类和小时聚合;步骤3:按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;步骤4:基于位置聚类网络序列,定义LDA模型,训练得到主题模型,并对主题基于重要程度排序;步骤5:设计主题-时间视图,可视化不同主题在每个位置网络中的概率分布,展示不同主题随着时间的演化特征;步骤6:设计边关联视图,直观展示重要区域的空间分布和它们之间的流量关系;步骤7:设计边流量时间分布视图,展示边关联视图中每条弧线在不同时间步下出现的概率。2.如权利要求1所述的基于OD数据感知城市动态结构演化规律的可视分析方法,其特征在于:所述步骤1包括:获取OD数据集,并存储在轨迹记录表中,一条轨迹记录trajRec表示如下:trajRec=[startLocLong,startLocLat,startTime,endLocLong,endLocLat,endTime]其中startLocLong和startLocLat为出发地点的经度和纬度,startTime为出发时间,endLocLong和endtLocLat为到达地点的经度和纬度,endTime为到达时间。3.如权利要求2所述的基于OD数据感知城市动态结构演化规律的可视分析方法,其特征在于:所述步骤2包括:步骤2.1:对所有位置进行聚类:假设locSet={locLongi,locLati}(1≤i≤n)为包含所有出发地点和到达地点的位置集合,一共有n个位置点;locLongi和locLati为第i个位置点的经度和纬度;第i个位置点和第j个位置点之间的距离定义为:使用k-means算法根据距离定义将地理相邻的位置聚合在一起,获取得到位置聚类集合cluLocSet={cluLoci}(1≤i≤k),其中k是聚类个数,一个位置聚类cluLoci中包含了多个相邻的位置点;步骤2.2:将轨迹按位置聚类和小时聚合,基于trajRec,以小时为单位统计某两个聚类间在单位时间内的人流量,并存储加速后续计算;聚合后的一条记录trajAggrRec表示为:trajAggrRec=[startDate,startHour,startCluLoc,endCluLoc,flowNum]其中startDate表示出发日期,startHour表示出发小时,可以从starttTme中提取得到;startCluLoc和endCluLoc表示出发和到达的位置聚类的ID,flowNum表示在某日(startDate)某小时(startHour)内,从startCluLoc内出发到达endCluLoc的人流量。4.如权利要求3所述的基于OD数据感知城市动态结构演化规律的可视分析方法,其特征在于:所述步骤3包括:按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;假设Gτ=(cluLocSet,Eτ)表示在时间步τ下的位置聚类网络,用一个图结构表示;其中位置聚类集合cluLocSet被看作是顶点集合,Eτ为边集合。eijτ∈Eτ表示在时间步τ内从cluLoci出发到达cluLocj的人流量,具体的值从trajAggrRec中查询得到;然后按小时构建位置聚类网络序列NS={G1,G2,...,GT},T为所有时间步的总数,由待分析的时间段内的日期数d决定,T=24×d。5.如权利要求4所述的基于OD数据感知城市动态结构演化规律的可视分析方法,其特征在于:所述步骤4包括:步骤4.1:基于位置聚类网络序列,定义LDA模型;LDA模型包含3层:文档、单词和主题;一篇文档是由一组单词构成的集合,所有的文档集构成了一个语料库;一篇文档可以包含多个主题,文档中每一个词都由其中的一个主题生成;将每个时间步下的位置聚类网络Gτ看作是一篇文档,从而位置聚类网络序列NS={G1,...

【专利技术属性】
技术研发人员:史晓颖吕凡顺僧德文
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1