一种交通事故预测模型建立方法及模型特征分析方法技术

技术编号：36539078 阅读：14 留言：0更新日期：2023-02-01 16:32

本发明专利技术涉及一种交通事故预测模型建立方法及模型特征分析方法，对原始交通事故数据进行预处理，使用随机森林算法填充特征的缺失值；使用SMOTEENN算法对训练集进行累不平衡处理；基于XGBoost建立道路交通事故预测模型，对交通事故的严重等级进行预测，并使用精确率，召回率，F1分数和AUC评价模型的分类性能；基于SHAP对整体预测模型、单个样本和单个特征分别进行解释，找出了对整体预测模型影响较大的特征、对一起交通事故的发生影响较大的特征，以及单个特征的不同取值对道路交通事故的影响。本发明专利技术方法不仅有较高的预测准确率，还提升了模型的可解释性，找出了对交通事故影响较大的因素，可以为交通管理部门制定更加科学可靠的决策提供依据。决策提供依据。决策提供依据。

全部详细技术资料下载

【技术实现步骤摘要】
一种交通事故预测模型建立方法及模型特征分析方法

[0001]本专利技术涉及一种交通安全技术，特别涉及一种交通事故预测模型建立方法及模型特征分析方法。

技术介绍

[0002]道路交通事故预测是提升道路交通安全水平的方式之一，是保障人民群众生命和财产安全的基础。近年来，随着汽车保有量的增加，道路交通事故的数量也在不断增加。如何科学准确地对交通事故进行预测并找出导致事故发生的主要因素是一个亟待解决的现实问题，在交通安全领域受到越来越多的关注。
[0003]对道路交通事故进行预测是减少交交通事故发生、提升交通出行安全水平的重要手段。但由于交通事故发生的时间、地点等因素不可控，导致一些道路交通事故的相关数据未能及时记录，道路交通事故数据集中会存在一些确实值；此外，在日常出行中发生的较多是轻微的交通事故，会造成道路交通事故数据集中存在类不平衡的现象；最后，现有的交通事故预测模型几乎是一个黑盒模型，例如集成学习模型或深度学习模型，即使是专家也难以对模型进行准确的解释。因此，亟待提出一种可解释性的预测模型道路交通事故进行预测和可解释性分析。
[0004]极端梯度提升算法(eXtreme Gradient Boosting,XGBoost)属于机器学习算法中的集成学习算法，属于Boosting算法的一种。Boosting算法的原理就是组合多个基学习器，以获得更好的效果，使组合后的模型具有更强的泛化能力。XGBoost本质上就是多个CART树，是一种决策树，既能做分类任务也能做回归任务，分类树输出是样本的类别，回归树输出...

【技术保护点】

【技术特征摘要】
1.一种交通事故预测模型建立方法，其特征在于，具体包括如下步骤：1)选取历史交通事故数据作为原始交通事故数据集，对原始交通事故数据集的缺失值进行填充；针对原始道路交通事故数据集中缺失值较多的问题，使用无缺失的特征作为样本，基于随机森林算法去预测有缺失的特征值，对数据集中的缺失值进行填充；2)把已经填充完缺失值的数据集划分为测试集和训练集，使用SOMTEENN算法对训练集进行类不平衡处理；对处理后训练集和测试集数据集中连续类型的特征进行归一化，离散类型的特征转化为独热码的形式；3)基于XGBoost建立道路交通事故预测模型，使用步骤2)处理后训练集对道路交通事故预测模型进行训练，使用网格搜索法对道路交通事故预测型的参数进行调整以获得最优的交通事故预测模型；4)使用步骤2)测试集对训练后交通事故预测模型进行验证，使用精确率、召回率、F1分数和AUC对训练后交通事故预测模型的性能进行评估；5)基于SHAP对训练后交通事故预测模型、单个样本和单个特征进行解释性分析，找出对整体预测模型影响大的特征、对一起交通事故的发生影响大的特征，以及单个特征的不同取值对道路交通事故的影响，用于对预测模型预测结果进行可解释性分析。2.根据权利要求1所述交通事故预测模型建立方法，其特征在于，所述步骤2)使用SOMTEENN算法对训练集进行类不平衡处理：首先使用SMOTE对训练集样本进行过采样，然后使用ENN删除类别与其最近的三个紧邻样本中两个或以上类别不同的样本，通过对数据集进行负采样与过采样结合的处理，实现数据集中正样本和负样本中比例均衡的目标样本。3.根据权利要求1或2所述交通事故预测模型建立方法，其特征在于，所述步骤3)XGBoost工具包定义模型基学习器的个数、分类树生成参数和树的最大深度参数，构建XGBoost预测模型，并采用网格搜索法在各个参数范围内...

【专利技术属性】
技术研发人员：陈丽琼，汤镇西，
申请(专利权)人：上海应用技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人