众包地图道路对象要素聚类方法、系统及存储介质技术方案

技术编号:38590305 阅读:12 留言:0更新日期:2023-08-26 23:30
本发明专利技术公开了一种众包地图道路对象要素聚类方法、系统及存储介质,根据改进的均值漂移算法,巧妙地将道路对象数据用其质心代表,根据不同类型的道路对象,选取不同的对象几何关系作为聚类的度量条件;根据道路要素数据类型的特点,在聚类过程中考虑了对象的邻域关系,最终得到不同道路要素类型的聚类输出。本方法巧妙地将对象数据转换为其质心作为聚类输入,并根据不同的场景灵活地使用其对象的多几何关系,拥有传统均值漂移算法的效率高、计算量小、不受异常点影响的优点,还加入了对象邻域关系,解决了传统均值漂移算法不适用于复杂数据分布类型的缺点。杂数据分布类型的缺点。杂数据分布类型的缺点。

【技术实现步骤摘要】
众包地图道路对象要素聚类方法、系统及存储介质


[0001]本专利技术属于高精度地图
,具体涉及一种众包地图道路对象要素聚类方法、系统及存储介质。

技术介绍

[0002]在自动驾驶技术的发展过程中,需要借助高精度地图进行定位和规划。高精度地图提供了比传统地图更加精确的道路级别和车道级别的导航信息,能更好的服务于自动驾驶车辆。而基于众包地图的方法收集大量的众包道路的最新数据是为自动驾驶提供与现实世界保持一致性最好的方式。
[0003]高精度地图的成图主要包括了车端数据采集和云端数据成图两个方面。云端建图系统主要利用汽车搭载的多传感器回传的数据作为众包源,通过地图学习方式实现地图的实时增量变化。其中聚类是高精度地图生产中地图学习中的一环,其主要目的是将同一类型的多个对象数据聚类成一簇,为地图学习的后续步骤提供有效的结果输出,能够保证众包地图的增量地图数据与地图供应商地图数据可以进行周期性的交互更新。
[0004]常见的聚类算法有很多,各自都有一定的优缺点。针对K

means算法来说,K值的选取不好把握,对于不是凸的数据集比较难收敛。如果各隐含类别的数据不平衡,比如各隐含类别的数据量严重失衡,或者各隐含类别的方差不同,则聚类效果不佳。容易陷入局部最优,对噪音和异常点也非常敏感。
[0005]针对谱聚类算法来说,选择不同的相似矩阵构建方法会对结果有很大的影响,对参数的选择也比较敏感,其构建完成后还是需要基于K

means进行聚类,且仍具有上述问题。并且数据量较大时,构建相似性矩阵是非常耗费时间的,算法的算力不强。针对DBSCAN聚类算法来说,如果样本集的密度不均匀、聚类间距差相差很大时,聚类质量较差。如果样本集较大时,聚类收敛时间较长。针对传统的均值漂移聚类算法,只采用距离作为聚类判断,无法综合考虑复杂的实际道路环境。并且,对于一些稀疏和密集不显著区分的数据,聚类效果也不好。
[0006]目前,均值漂移的聚类算法大多应用于图像类数据,比如,专利文献CN104751185B公开的基于均值漂移遗传聚类的SAR图像变化检测方法,该方法的实现步骤为:(1)导入图像;(2)构造差异图像;(3)均值漂移滤波;(4)遗传模糊聚类;(5)分割差异图像;(6)输出结果。如专利文献CN105718942B公开的基于均值漂移和过采样的高光谱图像不平衡分类方法,该方法首先将高光谱图像的每一个像素点用特征向量表示,用主成分分析降维方法提取第一主成分高光谱图像;利用均值漂移算法得到分割图,对分割图块中的像素点光谱值求和做平均得到局部空间信息;随机选取原高光谱图像数据中的每一类别样本,对样本数少的类别采用SMOTE技术过采样预处理,然后对各个类别样本两两训练支持向量机;对分类超平面上由少数类和多数类训练的支持向量再次过采样;结合空谱信息对测试样本利用混合核支持向量机分类器得到分类图;最后由最大投票方法对分割图和分类图融合得到最终的分类结果。又如专利文献CN111695389A公开的一种车道线聚类方法及装置,该方法包括:
获取车道线特征图像,将车道线特征图像中的像素点按照预设规则构成特征点集合;根据预设条件依次从特征点集合中的选取特征点组,并对特征点组进行横向聚类,生成各聚类组;分别计算各聚类组的聚类中心;根据预设车道线保留条件及各聚类中心与已有车道线集合的关系对已有车道线集合中的车道线进行更新,并返回根据预设条件将特征点集合中的特征点组进行横向聚类,生成各聚类组的步骤,直至遍历完特征点集合,得到车道线特征图像的聚类结果。以上方法虽然实现了车道线聚类方法,但其中心思想是通过获取车道线特征图像,从图像的视觉特征去进行聚类,不仅需要提前制定预设规则,同样也并不适用于所有类型的道路要素。因此,针对大量包含不同类型的众包道路对象数据,结合常见聚类算法的不足之处,找到一种聚类算法准确且快速的实现更好的聚类结果,是目前亟待解决的问题。
[0007]因此,有必要开发一种众包地图道路对象要素聚类方法、存储介质、设备及车辆。

技术实现思路

[0008]本专利技术的目的在于提供一种众包地图道路对象要素聚类方法、系统及存储介质,以提高算法的效率,且计算量小、不受异常点影响,能适用于多种数据分布类型的聚类。
[0009]第一方面,本专利技术所述的一种众包地图道路对象要素聚类方法,包括以下步骤:
[0010]S1:获取众包地图的道路对象数据,对道路对象要素进行归类,随机选择一种类型的道路对象数据,计算道路对象的质心坐标,并将位于同一类别的道路对象的质心坐标放入一列表type_dblist中;
[0011]S2:定义参数:设定初始聚类中心与聚类样本点之间的带宽距离band_width、相交面积与较小面积之比的阈值Inter0、两个质心坐标的距离阈值epsilon、较小面积与较大面积之比的阈值min_max0,以及cluster_id的初始值,其中,cluster_id为聚类类别标签;
[0012]S3:当列表type_dblist不为空时,在列表type_dblist中随机选择一个点作为初始的聚类中心,若该聚类中心为无效值,则结束此次循环,并重新选取一个点;否则将该聚类中心的质心坐标放入列表sample_count1,将该聚类中心的原始数据放入列表sample_count2;
[0013]S4:以聚类中心为圆心,带宽距离band_width为半径画圆,循环计算位于圆内的点与聚类中心之间的质心距离dis_e、相交面积与较小面积之比Inter、较小面积与较大面积之比min_max,将同时满足dis_e<epsilon,Inter<Inter0,且min_max<min_max0的圆内点的质心坐标和原始数据分别放入列表sample_count1、列表sample_count2中,循环完圆内点后,若列表sample_count1的长度大于预设长度,则根据列表sample_count1内的点计算平均偏移值,得到新的聚类中心;若当前的聚类中心与新的聚类中心之间的距离≥epsilon时,则进入步骤S5;反之,则以新的聚类中心为圆心,重复执行步骤S4;
[0014]S5:判断列表sample_count1的长度,若列表sample_count1的长度>预设长度,将聚类结果进行保存,将列表sample_count1、列表sample_count2存放的聚类结果分别对应放入列表groups1、列表groups2中,此时认为同属于第一个簇的样本已全部找到,将cluster_id增加1;若列表sample_count1的长度≤预设长度,则认为是异常点,不作为聚类成果存储进列表groups1、列表groups2中;最后将列表type_dblist与列表sample_count1作差,将作差后的结果作为新的列表type_dblist,循环步骤S3

S5,直到同一类型的所有的
样本都聚类完成,并进入步骤S6;
[0015]S6:循环列表groups1,获取groups本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种众包地图道路对象要素聚类方法,其特征在于,包括以下步骤:S1:获取众包地图的道路对象数据,对道路对象要素进行归类,随机选择一种类型的道路对象数据,计算道路对象的质心坐标,并将位于同一类别的道路对象的质心坐标放入一列表type_dblist中;S2:设定初始聚类中心与聚类样本点之间的带宽距离band_width、相交面积与较小面积之比的阈值Inter0、两个质心坐标的距离阈值epsilon、较小面积与较大面积之比的阈值min_max0,以及聚类类别标签cluster_id的初始值;S3:当列表type_dblist不为空时,在列表type_dblist中随机选择一个点作为初始的聚类中心,若该聚类中心为无效值,则结束此次循环,并重新选取一个点;否则将该聚类中心的质心坐标和原始数据分别放入列表sample_count1、列表sample_count2;S4:以聚类中心为圆心,带宽距离band_width为半径画圆,循环计算位于圆内的点与聚类中心之间的质心距离dis_e、相交面积与较小面积之比Inter、较小面积与较大面积之比min_max,将同时满足dis_e<epsilon,Inter<Inter0,且min_max<min_max0的圆内点的质心坐标和原始数据分别放入列表sample_count1、列表sample_count2中,循环完圆内点后,若列表sample_count1的长度>预设长度,则根据列表sample_count1内的点计算平均偏移值,得到新的聚类中心;若当前的聚类中心与新的聚类中心之间的距离≥epsilon时,则进入步骤S5;反之,则以新的聚类中心为圆心,重复执行步骤S4;S5:若列表sample_count1的长度>预设长度,将列表sample_count1、列表sample_count2存放的聚类结果分别对应放入列表groups1、列表groups2中,将cluster_id增加1;若列表sample_count1的长度≤预设长度,则不作为聚类成果存储进列表groups1、列表groups2中;将列表type_dblist与列表sample_count1作差,将作差后的结果作为新的列表type_dblist,循环步骤S3

S5,直到同一类型的所有的样本都聚类完成;S6:获取列表groups1中第一个簇的质心坐标,与其他任意簇的质心坐标进行欧式距离计算,若距离小于带宽距离band_width,则合并为同一簇,并取较长簇的cluster_id作为新的cluster_id;循环列表groups1,直到列表groups1中的簇均判断完为止;S7:循环步骤S1

S6,直到所有类型的样本均聚类完成。2.根据权利要求1所述的众包地图道路对象要素聚类方法,其特征在于:所述步骤S1中,获取众包地图的道路对象数据,对道路对象要素进行归类,具体包括:S11:采集众包地图道路要素对象数据,经数据清洗、数据标定得到道路对象要素;S12:将道路对象要素按照预设对象要素分类规则进行归类,得到不同类型的道路对象数据。3.根据权利要求1或2所述的众包地图道路对象要素聚类方法,其特征在于:所述步骤S4中,质心距离dis_e的计算方法,具体为:假设当前的质心坐标点为d维空间中的X(x,x2,...,x
i
,...,x
d
),i=1,2,...,d,待聚类列表中的样本点为Y=[Y1,Y2,...,Y
j
,...,Y
n
],j=1,2,...,n,其中,n为样本数量,Y
j
(y,y2,...,y
i
...,y
d
);则质心距离的计算公式如下:
其中,dis(X,Y
j
)表示质心距离。4.根据权利要求1或2所述的众包地图道路对象要素聚类方法,其特征在于:所述步骤S4中,相交面积与最小面积之...

【专利技术属性】
技术研发人员:石作琴
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1