【技术实现步骤摘要】
一种融合密度值和K
‑
means算法的车辆轨迹聚类方法
[0001]本专利技术涉及轨迹数据挖掘
,更具体的是,本专利技术涉及一种融合密度值和K
‑
means算法的车辆轨迹聚类方法。
技术介绍
[0002]近年来,随着无线通信、GPS设备、云计算、存储技术的快速发展,使得位置数据的采集、传输和保存变得更加容易和快捷,因此产生了海量的轨迹数据。这些数据通常包含用户标识、经纬度、时间、海拔等信息,所以轨迹数据可以看作是移动对象的时间位置顺序序列,通过使用聚类、分类等技术挖掘分析掩藏在轨迹数据背后的知识,从而为城市规划、位置服务、用户推荐等领域提供方案。
[0003]K
‑
means聚类算法作为最流行的无监督学习聚类算法,其具有原理简单、容易实现、收敛速度快的特点,现在广泛应用于图像、文字、轨迹等领域,但是该算法仍然有一定的局限性,如K值的选取不好把握,对噪音和异常点比较敏感,在初始中心点选择和迭代过程中簇中心计算不精准,造成聚类陷入局部迭代或者导致初始中心轨迹集中 ...
【技术保护点】
【技术特征摘要】
1.一种融合密度值和K
‑
means算法的车辆轨迹聚类方法,其特征在于,包括如下步骤:步骤一、采集车辆移动的轨迹数据进行预处理后,获得轨迹集合TS={T1,T2,
…
T
i
,
…
T
j
,
…
T
n
};其中,T
i
为第i条轨迹,T
j
为第j条轨迹,且i=1~n,j=1~n,T
i
={i,p1,p2…
p
t
,
…
p
m
},T
j
=(j,q1,q2…
q
t
,
…
q
l
),p
t
为轨迹T
i
在时间戳为t处的轨迹点(x1,y1,t),q
t
为轨迹T
j
在时间戳为t处的轨迹点(x2,y2,t);步骤二、依次对所述轨迹集合中的轨迹两两之间计算轨迹距离,并将所述轨迹集合中所有轨迹间的轨迹距离保存至轨迹距离矩阵中;其中,所述轨迹距离满足:D(T
i
,T
j
)=D(p
t
,q
t
);式中,D(T
i
,T
j
)为轨迹T
i
和轨迹T
j
之间的距离,D(p
t
,q
t
)为轨迹点p
t
和轨迹点q
t
之间的变换距离,且轨迹点p
t
和轨迹点q
t
之间的变换距离满足:式中,d(p
t
,q
t
)为轨迹点p
t
和轨迹点q
t
之间的实际距离,min{d(p
t
‑1,q
t
‑1),d(p
t
‑1,q
t
),d(p
t
,q
t
‑1)}为轨迹T
i
和轨迹T
j
间的对齐点对的最小距离;步骤三、确定所述轨迹集合中所有轨迹的密度,并将密度值最大的轨迹作为第一条中心轨迹添加至簇中心轨迹集合TScen={T
c1
,T
c2
,
…
,T
cz
…
,T
ck
}中;其中,所述轨迹的密度满足:其中,所述轨迹的密度满足:式中,ρ(T
i
)为轨迹T
i
的密度,u(x)为函数取值,Eps为邻域距离,T
cz
为第z条中心轨迹,z=1~k;步骤四、依次计算所述轨迹集合中每条剩余轨迹被选为中心轨迹的权重,将所述轨迹集合中权重值最大的剩余轨迹作为下一条中心轨迹,并将其移入簇中心轨迹集合中,直至簇中心轨迹集合的容量达到K时,中心轨迹挑选完成;其中,步骤五、将所述轨迹集合中密度最低值的轨迹移除,再次进行K
‑
means...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。