基于决策树模型的高速路出口匝道事故严重程度预测方法技术

技术编号:22784230 阅读:20 留言:0更新日期:2019-12-11 04:25
本发明专利技术属于交通安全领域,具体涉及一种基于决策树模型的高速路出口匝道事故严重程度预测方法,首先从交通管理部门搜集高速公路出口匝道的事故数据,根据实际情况选择选择自变量,再根据所需自变量的特征在原始数据中进行整合与筛选,选择满足要求的完整事故样本建立事故数据库。用训练集样本对决策树进行训练。在该决策树预测模型中,引入灵敏度分析来降低决策树预测模型的“黑匣子”问题,改变网络中的每个输入变量并观察输出结果的变化,最后对该预测模型的预测精度进行分析。本发明专利技术可以提高高速公路出口匝道区域事故严重程度的预测精度,这对提高出口匝道以及整个高速公路安全性具有重要意义。

The prediction method of the accident severity of freeway off ramp based on decision tree model

The invention belongs to the field of traffic safety, in particular to a method for predicting the severity of Expressway off ramp accidents based on the decision tree model. Firstly, the accident data of Expressway off ramp is collected from the traffic management department, the independent variables are selected according to the actual situation, and then the required independent variables are integrated and screened in the original data according to the characteristics of the required independent variables, so as to select the completion meeting the requirements Establish the accident database for the whole accident sample. The decision tree is trained with training set samples. In the decision tree prediction model, sensitivity analysis is introduced to reduce the \black box\ problem of the decision tree prediction model, change each input variable in the network and observe the change of the output results. Finally, the prediction accuracy of the prediction model is analyzed. The invention can improve the prediction accuracy of the accident severity of the expressway off ramp area, which is of great significance for improving the safety of the off ramp and the whole expressway.

【技术实现步骤摘要】
基于决策树模型的高速路出口匝道事故严重程度预测方法
本专利技术属于交通安全领域,具体涉及一种基于决策树(DecisionTree)模型的高速路出口匝道事故严重程度预测方法。
技术介绍
随着我国交通运输事业的发展,高速公路交通运输量快速增长,带来了很大的交通安全隐患。高速公路匝道区域是交通事故易发地带,据资料统计,匝道的路线长度占整个高速公路长度不足5%,但匝道区域发生的交通事故约占整个高速公路交通事故的40%,其中出口匝道交通事故数约是进口匝道区域的2倍。原则上,有一些方法可以减少道路交通事故中遇难或受伤的人数。降低事故严重程度就是其中之一,事故严重程度是指人员或财产方面的受损情况,主要受人、车、路和环境等因素的影响。高速公路出口匝道区域系统复杂,影响因素多。如今,许多交通安全管理者、研究人员以及车辆厂家对高速公路出口匝道区域事故严重程度预测模型非常感兴趣。事故严重程度模型可以预测事故发生的严重程度,这有助于医院尽快提供适当的医疗护理,同时可以诊断出口匝道存在的交通安全问题,提高出口匝道以及整个高速公路安全性具有重要意义。现有的交通事故严重程度研究中常用的方法是使用统计建模模型,例如有序概率模型和嵌套逻辑模型。统计模型具有以下优点:输出自变量与因变量的关系公式,结果阐述清晰。但是,统计模型有一些局限性。例如,统计建模技术需要假设数据分布,并且线性函数用于将因变量映射到自变量。这些假设可能并非总是成立。如果违反此类假设,将生成错误的参数估计。此外,其他问题如多重共线性,事故内部因素相关性和未观测到的异质性可能影响模型估计。通常需要一些复杂的框架来减少这些问题造成的负面影响,这使得这些统计模型难以解决并且难以在实践中使用。目前机器学习模型开始应用于事故严重程度预测,机器学习模型不需要确定自变量和因变量之间线性关系。机器学习模型比统计模型具有更高的预测精度。但其主要缺陷是它们内部运作通常像“黑匣子”,不直接输出事故严重程度和自变量之间的相关性。这种方法不能用于探索变量之间的非线性关系。
技术实现思路
本专利技术提供一种基于决策树模型的高速路出口匝道事故严重程度预测方法,在预测高速公路出口匝道区域的事故严重程度具有较高的精度。为了实现本专利技术的目的,所采用的技术方案是:基于决策树模型的高速路出口匝道事故严重程度预测方法,包括以下步骤:1)获取高速公路出口匝道区域事故数据;2)从高速公路出口匝道交通事故影响因素中选取若干因素作为自变量,根据所需自变量的特征对步骤1)的数据进行整合与筛选,选择满足要求的完整事故样本建立事故严重程度预测数据库,且将数据随机划分为训练集和测试集;3)将步骤2)所整理的数据按事故严重程度划分等级;4)训练算法:构造决策树的数据结构,建立高速公路出口匝道区域事故严重程度决策树预测模型;5)进行事故预测模型灵敏度分析,逐个改变自变量,使用决策树预测模型预测按事故严重程度所划分的每个等级的事故比例,将输出的斜率视为自变量的平均可变影响,以预测结果的直线拟合线的非二元离散变量R2表示自变量对预测结果的非线性影响;检验决策树预测模型的预测精度:当错误率达到可接受范围,该决策树可应用于实际数据的高速公路出口匝道事故严重程度预测。作为本专利技术的优化方案,步骤2)包括以下步骤:21)对步骤1)搜集到的高速公路出口匝道区域事故数据进行线性转换,采用极小-极大规范化,将结果映射到[0,1];22)将按步骤21)规范化后的数据按选取的自变量进行分类,典型自变量包括:出口匝道类型、主线车道数、出口匝道车道数、减速车道长度、匝道总长度、路面类型、肩型、肩宽、主路后限制速度、主路与出口匝道限速差异、照明情况、天气情况、土地使用类型、主路平均日交通量、匝道平均日交通量、有无涉及酒驾/毒驾以及事故类型中的一种或几种组合;23)对按步骤22)处理后的数据建立事故严重程度预测数据库,所述的测试集显著大于训练集。作为本专利技术的优化方案,在步骤23)中将事故严重程度数据随机分成十组训练集和十组测试集。作为本专利技术的优化方案,步骤4)包括:41)特征选择:按照高速公路出口匝道交通事故影响因素对数据集划分之后,各数据子集的纯度要比划分前的数据集的纯度高的原则进行特征选择,子集的纯度由信息增益率来度量,将选取的自变量作为候选特征,从候选特征中找出信息增益高于平均水平的特征,然后在这些特征中再选择信息增益率最高的特征;42)生成决策树:输入:训练数据集D,特征集A,阈值ε;输出:决策树T;421)如果D中所有实例属于同一类Ck,则置T为单节点树,并将Ck作为该节点的类,返回T;422)如果则置T为单节点树,并将D中实例树最大的类Ck作为该节点的类,返回T;423)如果计算A中各特征对D的信息增益比,选择信息增益比最大的特征Ag;424)如果Ag的信息增益比小于阈值ε,则置T为单节点树,并将D中实例数最大的类Ck作为该节点的类,返回T;425)如果Ag的信息增益比大于或等于阈值ε,对Ag的每一可能值ai,依Ag=ai将D分割为子集若干非空Di,将Di中实例数大的类作为标记,构建子节点,由节点及其子节点构成数T,返回T;对节点i,以Di为训练集,以A-{Ag}为特征集,递归地调用步骤421)~425),得到子树Tj,返回Tj;43)剪支算法:利用统计学置信区间的估计方法,直接在高速公路出口匝道事故训练样本集上估计误差,设训练的决策树中第i个节点包含Ni个预测结果,其中有Ei个错误预测,误差率fi=Ei/Ni,则对节点i的真实误差ei在置信度1-α有:则节点i真实误差ei的置信区间上限值为:在对每个节点进行误差估计的基础上,对叶节点计算加权误差i=1,2,...k,k为父节点包含的全部叶节点个数,Pi为i节点的样本量占整个分枝样本量的比例;e为父节点的误差估计,若待剪子树中叶节点的加权误差大于父节点误差,则修剪。作为本专利技术的优化方案,步骤42)中决策树中的每个节点代表一个事故严重程度预测因子,每个分支代表该预测因子的特征的一个状态,树叶或终端节点表示预期的事故严重性。作为本专利技术的优化方案,在所述步骤42)中,当获得测试数据集中新的事故样本时,可以通过使用划分特征值遵循树中从根到叶的路径来做出关于事故严重程度的预测。作为本专利技术的优化方案,在所述步骤42)中,分支节点中的样本属于同一类别,节点的纯度最高。作为本专利技术的优化方案,在所述步骤5)中,输出的斜率通过最小二乘法确定,该方法使用样本数据来提供斜率值,该斜率值最小化观察到的y与估计的偏差之间的偏差的平方和,计算公式如下:其中,xi为第i个观测数据的自变量的值;yi为第i个观测数据的因变量的值;为自变量的平均值;为因变量的平均值;N为总的数据量。作为本专利技术的优化方案,在所述步骤5)中,为了评估自变量对事故严重程度影响的非本文档来自技高网
...

【技术保护点】
1.基于决策树模型的高速路出口匝道事故严重程度预测方法,其特征在于:包括以下步骤:/n1)获取高速公路出口匝道区域事故数据;/n2)从高速公路出口匝道交通事故影响因素中选取若干因素作为自变量,根据所需自变量的特征对步骤1)的数据进行整合与筛选,选择满足要求的完整事故样本建立事故严重程度预测数据库,且将数据随机划分为训练集和测试集;/n3)将步骤2)所整理的数据按事故严重程度划分等级;/n4)训练算法:构造决策树的数据结构,建立高速公路出口匝道区域事故严重程度决策树预测模型;/n5)进行事故预测模型灵敏度分析,逐个改变自变量,使用决策树预测模型预测按事故严重程度所划分的每个等级的事故比例,将输出的斜率视为自变量的平均可变影响,以预测结果的直线拟合线的非二元离散变量R

【技术特征摘要】
1.基于决策树模型的高速路出口匝道事故严重程度预测方法,其特征在于:包括以下步骤:
1)获取高速公路出口匝道区域事故数据;
2)从高速公路出口匝道交通事故影响因素中选取若干因素作为自变量,根据所需自变量的特征对步骤1)的数据进行整合与筛选,选择满足要求的完整事故样本建立事故严重程度预测数据库,且将数据随机划分为训练集和测试集;
3)将步骤2)所整理的数据按事故严重程度划分等级;
4)训练算法:构造决策树的数据结构,建立高速公路出口匝道区域事故严重程度决策树预测模型;
5)进行事故预测模型灵敏度分析,逐个改变自变量,使用决策树预测模型预测按事故严重程度所划分的每个等级的事故比例,将输出的斜率视为自变量的平均可变影响,以预测结果的直线拟合线的非二元离散变量R2表示自变量对预测结果的非线性影响;
6)检验决策树预测模型的预测精度:当错误率达到可接受范围,该决策树可应用于实际数据的高速公路出口匝道事故严重程度预测。


2.根据权利要求1所述的基于决策树模型的高速路出口匝道事故严重程度预测方法,其特征在于:所述的步骤2)包括以下步骤:
21)对步骤1)搜集到的高速公路出口匝道区域事故数据进行线性转换,采用极小-极大规范化,将结果映射到[0,1];
22)将按步骤21)规范化后的数据按选取的自变量进行分类,典型自变量包括:出口匝道类型、主线车道数、出口匝道车道数、减速车道长度、匝道总长度、路面类型、肩型、肩宽、主路后限制速度、主路与出口匝道限速差异、照明情况、天气情况、土地使用类型、主路平均日交通量、匝道平均日交通量、有无涉及酒驾/毒驾以及事故类型中的一种或几种组合;
23)对按步骤22)处理后的数据建立事故严重程度预测数据库,采用随机抽样构建测试集和训练集。


3.根据权利要求2所述的基于决策树模型的高速路出口匝道事故严重程度预测方法,其特征在于:在步骤23)中将事故严重程度数据随机分成十组训练集和十组测试集。


4.根据权利要求2所述的基于决策树模型的高速路出口匝道事故严重程度预测方法,其特征在于:所述的步骤4)包括:
41)特征选择:按照高速公路出口匝道交通事故影响因素对数据集划分之后,各数据子集的纯度要比划分前的数据集的纯度高的原则进行特征选择,子集的纯度由信息增益率来度量,将选取的自变量作为候选特征,从候选特征中找出信息增益高于平均水平的特征,然后在这些特征中再选择信息增益率最高的特征;
42)生成决策树:
输入:训练数据集D,特征集A,阈值ε;
输出:决策树T;
421)如果D中所有实例属于同一类Ck,则置T为单节点树,并将Ck作为该节点的类,返回T;
422)如果则置T为单节点树,并将D中实例树最大的类Ck作为该节点的类,返回T;
423)如果计算A中各特征对D的信息增益比,选择信息增益...

【专利技术属性】
技术研发人员:李志斌
申请(专利权)人:南京东控智能交通研究院有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1