【技术实现步骤摘要】
基于轨迹分布表示的城市区域关系可视分析方法
[0001]本专利技术属于数据分析与建模
,具体涉及基于轨迹分布表示的城市区域关系可视分 析方法。
技术介绍
[0002]随着定位跟踪技术的不断发展,城市中大量的时空轨迹数据能够被收集,这些时空轨迹代 表着各类移动对象,如人、车辆的移动。大量的时空轨迹数据为我们提供了许多前所未有的信 息,在基于位置的社交网络、智能交通系统和城市计算等领域获得了广泛的应用,同时这些应 用的普及,也推动着针对轨迹数据挖掘的新技术的发展。因此,针对轨迹数据的数据挖掘任务 已经成为智慧城市建设中重要的研究热点。在城市人群移动模式探索方面,通过有效地处理和 分析城市中人或车辆的时空轨迹数据,对于诸如估计迁移流量、交通预测、城市规划和流行病 建模等应用尤为重要。
[0003]轨迹数据中蕴含了潜在的人群移动模式,然而全面高效地探索运动物体的轨迹绝非易事, 难点主要体现在以下三个方面:首先,两条途经位置差异很大的轨迹,其内部隐含的移动模式 却可能是相同的,因此针对轨迹经过位置进行特征提取对于移动模式的分析而言就变得十分重 要。其次,轨迹数据往往规模庞大且结构性复杂,导致了轨迹数据分析的全面性和高效性之间 存在矛盾,因此不得不采用折中的手段如基于位置聚合轨迹等方法分析问题。最后,人群的移 动模式是与时间相关的,不仅不同时段人们的移动模式不同,对于轨迹数据的处理也应充分考 虑其时空连续性。如果仅仅使用来自轨迹的聚合值如位置流量或位置对之间的进出流来表示、 分析轨迹,则会极大地忽略掉轨迹时空属性中 ...
【技术保护点】
【技术特征摘要】
1.基于轨迹分布表示的城市区域关系可视分析方法,其特征在于,包括以下步骤:S1:基于轨迹数据的城市区域划分方法;考虑轨迹数据的规模、结构,将轨迹数据进行空间泛化和聚合,将城市地理空间划分成适当的各个区域,最终将轨迹转换为各个区域之间的聚合流,即为轨迹区域序列化的表示,并且轨迹区域序列化的表示作为基于词嵌入技术的区域向量化模型的输入;S2:建立基于词嵌入技术的区域向量化模型;通过利用词嵌入技术,用向量化表示对城市区域进行编码,考虑结合城市位置和移动对象之间的相互作用,通过将城市区域视为文本处理中的单词,轨迹视为句子,建立区域向量化空间;S3:分析区域向量和人群移动模式的可视分析系统;以区域向量化空间为基础,通过使用可视化视图联动机制,支持从全局概览到局部分析,最后到细节分析人群移动模式。2.如权利要求1所述的基于轨迹分布表示的城市区域关系可视分析方法,其特征在于,步骤S2包括以下子步骤:S21:城市区域划分;城市区域划分方法基于轨迹数据,从轨迹数据中提取特征轨迹点,并采用聚类算法根据其空间分布情况进行区域划分;城市空间被划分成单个区域,轨迹可被转化为区域之间的移动;S22:基于F
‑
Glove模型的区域向量化;提出基于城市区域向量化表示模型F
‑
Glove,首先利用分布式假设原理将城市区域嵌入到一个连续的向量空间中,结合城市区域与人群移动之间的相互作用;针对词嵌入模型存在的问题进行改进,生成新的区域向量,通过轨迹与区域向量相结合计算出的轨迹向量空间。3.如权利要求2所述的基于轨迹分布表示的城市区域关系可视分析方法,其特征在于,步骤S21包括以下子步骤:S211:从轨迹数据中提取特征点;输入:T=<tp1...tp
n
>,tp
i
=(lng
i
,lat
i
,t
i
)其中tp
i
表示该轨迹某时间戳的轨迹点,n表示轨迹点个数(n≥2),t
i
表示对应轨迹点的时间戳,lng
i
与lat
i
表示对应时间戳的经纬度;输出:特征点集合C;其中,Step 1:定义i=1,将轨迹点tp1加入C;Step 2:定义j=i+1;Step 3:若j≥n则进行Step 8,否则下一步;Step 4:计算tp
i
与tp
j
空间距离SD(i,j),若SD(i,j)≥MaxDistance,则将tp
j
加入特征点集合C,令i=j并返回到Step 2,否则进下一步;Step 5:在j+1与n之间寻找Min(k),使得SD(j,k)≥MinDistance,若存在k则下一步,否则进行Step 8;Step 6:计算tp
j
与tp
k
时间差异TD(j,k),若TD(j,k)≥MinStopDuration,则将tp
j
加入特征点集合C,并令i=j,j=k,返回到Step 3;否则计算tp
j
与tp
k
之间的平均位置tp
p
(lng
ave
,lat
ave
),寻找tp
m
使得SD(m,p)最小,令j=m进行下一步step 7:计算角度,ANGLE=(<(lng
i
,lat
i
),(lng
j
,lat
j
)>,<(lng
j
,lat
j
),(lng
k
,lat
k
)>),若ANGLE≥MinAngle则将tp
j
加入C,并令i=j,j=k,否则令j=j+1;该步执行完毕后返回step3;Step 8:将轨迹点tp
n
加入C;Step 9:结束;其中,MaxDistance表示从轨迹中提取的连续特征点之间允许的最大距离,因为如果轨迹是一条直线段,则必须从这条直线段中挑选有代表性的点,且代表性的点之间距离不能超过该值;MinDistance表示如果两个连续轨迹点之间距离小于该值,则被视为是近似相同位置;MinStopDuration表示如果在近似相同位置停留的时间超过该值,则被视为运动中暂停点;MinAngle表示连续轨迹段之间的角度超过该值,则被视为一次转弯;S212:特征轨迹点聚类;输入:C=<p1...p
n
>,n为特征轨迹点提取算法中提取轨迹点的个数,其中每个特征轨迹点为p
i
=(lng
i
,lat
i
);输出:簇中心集合R;其中,step 1:定义寻找lng
max
、lng
min
、lat
max
、lat
min
,使得对于lng
max
≥p.lng≥lng
min
与lat
max
≥p.lat≥lat
min
均成立;step 2:根据lng
max
、lng
min
、lat
max
、lat
min
围成的城市矩形区域,划分为边长为MaxRadius的正方形网格,正方形网格可超出矩形边界;step 3:遍历C中所有特征轨迹点,对于轨迹点p
i
=(lng
i
,lat
i
),计算m=floor((lng
i
‑
lng
min
)/MaxRadius),n=floor((lat
i
‑
lat
min
)/MaxRadius),即根据步长向下取整寻找该点所属网格;step 4:根据p
i
所属网格计算其位置相邻网格中,与p
i
点空间距离最小且大于等于MaxRadius的簇中心g,即寻找点g∈R使SD(p
i
,g)最小并且SD(p
i
,g)≥MaxRadius;若不存在,则将点p
i
加入到R中,返回上一步;step 5:根据簇中心g所属所有特征轨迹点,重新计算簇中心g
new
加入到R并删除g;step 6:若所有特征轨迹点遍历完成,结束;其中,MaxRadius表示出所划分区域的面积的大小;S213:划分城市区域;使用聚类簇群的质心作为Voronoi图的生成点;在边界附近和轨迹上没有特征点的区域引入额外的生成点,得到大小和形状更均匀的城市区域。4.如权利要求1所述的基于轨迹分布表示的城市区域关系可视分析方法,其特征在于,步骤S22包括以下子步骤:S221:轨迹建模;将每个时间段轨迹数据汇集起来作为训练的原始数据,每条轨迹表示成区域转移序列,即将轨迹点之间的移动转化为城市区域之间的移动;每条轨迹构建成为区域编号的序列后,根据所有轨迹构建共现矩阵X,其中X每一个元素X
ij
表示区域st
j
在目标区域st
i
窗口内出现的次数,为共现矩阵中第i行的和,即在区域st
i
窗口内所有区域出现的
总次数;P
ij
=P(j|i)=X
ij
/X
i
表示区域st
j
出现在区域st
i
周围的概率;S222:基于词嵌入技术分析区域关系;共现矩阵X中的第i行j列的值X
ij
为目标词W
i
与上下文词W
j
在语料库中的共同出现次数,此处给出该模型损失函数:其中|V|为词典的大小,在本申请中即为区域总个数,w
i
为目标词的词向量,为上下文词的词向量,b
i
与b
j
为共现矩阵X行和列的偏移值,f(x)是针对语料库中的低频词,f(x)定义为:在Glove模型中,对目标词向量和上下文向量做区分,最后将两组词向量求和,得到最终的词向量;其中参数b
i
、b
j
为可训练的参数,公式(3)表示公式(1)中损失函数的求解,而公式(4)所示对于模型训练处的词向量加上任意一个常数向量c后,由于偏置项b
i
、b
j
的调控,最终结果仍然会是损失函数的解;仍然会是损失函数的解;基于相同语料库下不同模型训练出的同一维度词向量而言,Glove生成的词向量,噪声词的模长远大于Word2vec词向量的模长;S223:基于相似性法则过...
【专利技术属性】
技术研发人员:张慧杰,白静涵,吕程,邵威璋,曲德展,
申请(专利权)人:东北师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。