一种融合密度值和K-means算法的车辆轨迹聚类方法技术

技术编号：37366200 阅读：26 留言：0更新日期：2023-04-27 07:13

本发明专利技术公开了一种融合密度值和K

全部详细技术资料下载

【技术实现步骤摘要】
一种融合密度值和K
‑
means算法的车辆轨迹聚类方法

[0001]本专利技术涉及轨迹数据挖掘
，更具体的是，本专利技术涉及一种融合密度值和K
‑
means算法的车辆轨迹聚类方法。

技术介绍

[0002]近年来，随着无线通信、GPS设备、云计算、存储技术的快速发展，使得位置数据的采集、传输和保存变得更加容易和快捷，因此产生了海量的轨迹数据。这些数据通常包含用户标识、经纬度、时间、海拔等信息，所以轨迹数据可以看作是移动对象的时间位置顺序序列，通过使用聚类、分类等技术挖掘分析掩藏在轨迹数据背后的知识，从而为城市规划、位置服务、用户推荐等领域提供方案。
[0003]K
‑
means聚类算法作为最流行的无监督学习聚类算法，其具有原理简单、容易实现、收敛速度快的特点，现在广泛应用于图像、文字、轨迹等领域，但是该算法仍然有一定的局限性，如K值的选取不好把握，对噪音和异常点比较敏感，在初始中心点选择和迭代过程中簇中心计算不精准，造成聚类陷入局部迭代或者导致初始中心轨迹集中...

【技术保护点】

【技术特征摘要】
1.一种融合密度值和K
‑
means算法的车辆轨迹聚类方法，其特征在于，包括如下步骤：步骤一、采集车辆移动的轨迹数据进行预处理后，获得轨迹集合TS＝{T1,T2,
…
T
i
,
…
T
j
,
…
T
n
}；其中，T
i
为第i条轨迹，T
j
为第j条轨迹，且i＝1～n，j＝1～n，T
i
＝{i,p1,p2…
p
t
,
…
p
m
}，T
j
＝(j,q1,q2…
q
t
,
…
q
l
)，p
t
为轨迹T
i
在时间戳为t处的轨迹点(x1,y1,t)，q
t
为轨迹T
j
在时间戳为t处的轨迹点(x2,y2,t)；步骤二、依次对所述轨迹集合中的轨迹两两之间计算轨迹距离，并将所述轨迹集合中所有轨迹间的轨迹距离保存至轨迹距离矩阵中；其中，所述轨迹距离满足：D(T
i
,T
j
)＝D(p
t
,q
t
)；式中，D(T
i
,T
j
)为轨迹T
i
和轨迹T
j
之间的距离，D(p
t
,q
t
)为轨迹点p
t
和轨迹点q
t
之间的变换距离，且轨迹点p
t
和轨迹点q
t
之间的变换距离满足：式中，d(p
t
,q
t
)为轨迹点p
t
和轨迹点q
t
之间的实际距离，min{d(p
t
‑1,q
t
‑1),d(p
t
‑1,q
t
),d(p
t
,q
t
‑1)}为轨迹T
i
和轨迹T
j
间的对齐点对的最小距离；步骤三、确定所述轨迹集合中所有轨迹的密度，并将密度值最大的轨迹作为第一条中心轨迹添加至簇中心轨迹集合TScen＝{T
c1
,T
c2
,
…
,T
cz
…
,T
ck
}中；其中，所述轨迹的密度满足：其中，所述轨迹的密度满足：式中，ρ(T
i
)为轨迹T
i
的密度，u(x)为函数取值，Eps为邻域距离，T
cz
为第z条中心轨迹，z＝1～k；步骤四、依次计算所述轨迹集合中每条剩余轨迹被选为中心轨迹的权重，将所述轨迹集合中权重值最大的剩余轨迹作为下一条中心轨迹，并将其移入簇中心轨迹集合中，直至簇中心轨迹集合的容量达到K时，中心轨迹挑选完成；其中，步骤五、将所述轨迹集合中密度最低值的轨迹移除，再次进行K
‑
means...

【专利技术属性】
技术研发人员：周旭，徐腾鹏，刘衍珩，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人