一种基于K-means算法的交通事故场景聚类方法技术

技术编号:43813200 阅读:71 留言:0更新日期:2024-12-27 13:28
本发明专利技术涉及车辆安全技术领域,尤其是一种基于K‑means算法的交通事故场景聚类方法,所述方法包括以下步骤:从事故数据库中筛选事故数据字段,并进行数据清洗和重编码;基于贝叶斯优化的随机森林模型对数据变量进行重要度排序,选择重要度高的数据变量;通过Cramer's V检验对选定的数据变量进行相关性分析,筛选得到特征变量;根据筛选得到的特征变量,采用轮廓系数和簇最小样本数的方法联合确定K‑means算法的最佳聚类数;根据确定的最佳聚类值确定初始聚类中心;进行K‑means聚类,确定各场景的边界条件。本发明专利技术提出一种基于K‑means算法的交通事故场景聚类方法,通过自适应选取特征参数,能在大量复杂数据中提高确定测试场景边界的效率。

【技术实现步骤摘要】

本专利技术涉及交通安全,尤其是一种基于k-means算法的交通事故场景聚类方法。


技术介绍

1、随着城市化进程的加快和汽车保有量的急剧增加,交通事故的发生率也在不断上升。传统的车辆安全性能测试方法主要依赖于预设的标准场景,这些场景往往无法覆盖所有可能的交通事故类型和复杂的交通环境。现有的测试场景过于简单,难以全面反映现实生活中的多样性和复杂性,从而导致车辆在真实事故场景中的表现与测试结果之间存在较大差距。

2、目前,在确定车辆主动安全测试场景方面,主要采用两种方法。一种是传统的统计方法,通过概率分布分析、极值分析、众数分析等手段,结合领域专家的知识来确定场景边界条件。这种方法虽然能够一定程度上反映真实交通事故的特征,但存在工作量巨大、依赖专家经验等问题,难以全面覆盖真实事故数据。另一种方法是利用机器学习技术,通过特征选择算法、逻辑回归、决策树和支持向量机等方法来确定测试场景的边界条件。机器学习方法在处理大规模数据和自动识别关键特征方面具有优势,但其模型的可解释性较差,结果难以直观理解或解释,可能在确定测试场景时引入不确定性和混淆。因此,亟需提出本文档来自技高网...

【技术保护点】

1.一种基于K-means算法的交通事故场景聚类方法,其特征在于,包括以下步骤:从事故数据库中筛选事故数据字段,并进行数据清洗和重编码;基于贝叶斯优化的随机森林模型对数据的多个变量进行重要度排序,选择重要度高的数据变量;通过Cramer's V检验对选定的数据变量进行相关性分析,筛选得到特征变量;根据筛选得到的特征变量,采用轮廓系数和簇最小样本数的方法联合确定K-means算法的最佳聚类数;根据确定的最佳聚类值确定初始聚类中心;进行K-means聚类,确定各场景的边界条件。

2.根据权利要求1所述的基于K-means算法的交通事故场景聚类方法,其特征在于,所述数据重编码步骤包...

【技术特征摘要】

1.一种基于k-means算法的交通事故场景聚类方法,其特征在于,包括以下步骤:从事故数据库中筛选事故数据字段,并进行数据清洗和重编码;基于贝叶斯优化的随机森林模型对数据的多个变量进行重要度排序,选择重要度高的数据变量;通过cramer's v检验对选定的数据变量进行相关性分析,筛选得到特征变量;根据筛选得到的特征变量,采用轮廓系数和簇最小样本数的方法联合确定k-means算法的最佳聚类数;根据确定的最佳聚类值确定初始聚类中心;进行k-means聚类,确定各场景的边界条件。

2.根据权利要求1所述的基于k-means算法的交通事故场景聚类方法,其特征在于,所述数据重编码步骤包括对分类变量进行独热编码,对于连续变量进行归一化处理。

3.根据权利要求2所述的基于k-means算法的交通事故场景聚类方法,其特征在于,所述基于贝叶斯优化的随机森林模型的参数包括基学习器数量、是否进行有放回的抽样、袋外数据评估和节点可划分的最小样本数量。

【专利技术属性】
技术研发人员:叶彬万鑫铭刘煜王国杰龙永程洪程彭锟余海龙
申请(专利权)人:中国汽车工程研究院股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1