当前位置: 首页 > 专利查询>同济大学专利>正文

一种山区高速公路事故多发路段识别方法技术

技术编号:31826220 阅读:11 留言:0更新日期:2022-01-12 12:53
本发明专利技术涉及一种山区高速公路事故多发路段识别方法,包括:步骤1:获取山区高速公路相关数据;步骤2:根据步骤1采集的数据,将山区高速公路划分为同质路段;步骤3:构建样本数据集;步骤4:针对山区高速公路事故总数构建负二项安全分析模型;步骤5:计算安全可提高空间PSI;步骤6:利用高斯混合聚类模型GMM对PSI高危路段进行聚类,获得事故多发路段识别结果。与现有技术相比,本发明专利技术具有可靠性高、更加合理等优点。理等优点。理等优点。

【技术实现步骤摘要】
一种山区高速公路事故多发路段识别方法


[0001]本专利技术涉及交通安全管理
,尤其是涉及一种山区高速公路事故多发路段识别方法。

技术介绍

[0002]高速公路具有交通设施完善、交通流量大、运行速度高等优点,而山区高速公路以其复杂的地理特征和特殊的自然环境,较高的运行速度导致其交通事故多发且严重程度处于较高的水平。山区高速公路交通安全已越来越受到管理者的重视,其中,事故多发路段判别是山区高速公路交通安全管理的重要内容之一。
[0003]事故多发路段判别就是基于路段安全性确定高速公路危险路段。主要可以分成三类:基于观测数据直接判别法、事故预测模型法和空间分析判别法。基于观测数据的直接判别法,包括事故数法、事故率法等,我国交通部门在开展事故多发路段排查工作时常常采用此类方法,但是该方法忽略了事故的空间集聚性和随机波动性,易导致判别结果出现偏差。事故预测模型法通过构建交通安全模型分析事故的影响因素,并进行事故预测,基于事故预测值或构造其他指标如安全可提高空间,最终判别事故多发路段,考虑了影响事故的道路几何、交通运行和控制特征。空间分析法利用空间分析技术识别点的集聚特征,从而判断事故的多发路。
[0004]高斯混合聚类模型(Gaussian Mixture Model,GMM)在聚类中引入了概率的概念。和传统的k

means聚类法通过计算每个对象与各个种子聚类中心之间的距离,再把每个对象分配给距离它最近的聚类中心不同,高斯混合聚类模型给出每一个数据点被指定到每个簇类中概率。通常而言,事故数据分布离散程度较大,事故多发道路相比普通道路事故数离差较多,使用传统聚类模型不能很好捕捉事故多发道路特质。因而,相比传统的k

means或hierarchical clustering采用欧式距离进行相似度度量,高斯混合聚类模型更适用于存在极端值或过度离散分布的数据聚类,通过对每一个路段赋以相应分布,计算得到该路段是事故多发路段的概率。
[0005]现有事故多发路段判别工作多采用事故数法或安全可提高空间法进行判别,判别结果是离散的,不适用于实际道路改善治理工作。实际工作中往往根据经验对高危路段进行链接,缺乏客观性,难以量化。故应在此基础上,考虑空间特征,采用机器学习算法代替人工进行聚类,得到最终的事故多发路段判别结果。

技术实现思路

[0006]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种可靠性高、更加合理的山区高速公路事故多发路段识别方法。
[0007]本专利技术的目的可以通过以下技术方案来实现:
[0008]一种山区高速公路事故多发路段识别方法,所述的事故多发路段识别方法包括:
[0009]步骤1:获取山区高速公路相关数据;
[0010]步骤2:根据步骤1采集的数据,将山区高速公路划分为同质路段;
[0011]步骤3:构建样本数据集;
[0012]步骤4:针对山区高速公路事故总数构建负二项安全分析模型;
[0013]步骤5:计算安全可提高空间PSI;
[0014]步骤6:利用高斯混合聚类模型GMM对PSI高危路段进行聚类,获得事故多发路段识别结果。
[0015]优选地,所述的步骤1中山区高速公路相关数据包括:山区高速公路道路几何数据、交通运行数据、天气数据、路面抗滑性能数据及交通事故数据。
[0016]更加优选地,所述的道路几何数据包括道路横断面、纵断面及平面几何数据。
[0017]更加优选地,所述的步骤2具体为:
[0018]根据步骤1获取的道路横断面、纵断面及平面几何数据,将山区高速公路划分为若干个同质路段,每个同质路段内道路横断面、纵断面及平面几何数据一致。
[0019]优选地,所述的步骤3具体为:
[0020]提取各同质路段的道路几何设计变量、交通运行变量、天气变量、路面抗滑性能变量及事故总数,构建交通安全分析的样本数据集。
[0021]优选地,所述的步骤4具体为:
[0022]假设路段交通事故数服从负二项分布,即
[0023][0024]模型方程为:
[0025]log(θ)=β0+β1X1+


n
X
n
[0026]其中i为该山区高速公路上从1开始的同质路段编号;为路段i的事故预测值;变量X
i
为影响交通事故的因素;β
n
为变量对应的系数;α为负二项模型的离散系数。
[0027]优选地,所述的步骤5具体为:
[0028]安全可提高空间以事故预测期望值与同类路段平均期望值的差值作为安全指标,判定路段安全性,计算方法为:
[0029]PSI=E[r|x]‑
E[r][0030]其中,E[r|x]为预测的路段事故数;E[r]为同类型路段的事故期望值,通过负二项安全分析模型得到;
[0031]将样本数据集中的数据代入计算公式,计算安全可提高空间,并进行降序排列,获得高危路段。
[0032]优选地,所述的步骤6具体为:
[0033]高斯混合聚类模型GMM由k个Gaussian分布组成,将每个Gaussian视为一个Component,高斯混合聚类模型GMM的概率密度函数为:
[0034][0035]其中,π
k
为每个Component被选中的概率;μ
k
为均值向量;∑k为协方差矩阵。
[0036]更加优选地,所述的步骤6采用期望

最大化方法求解。
[0037]更加优选地,所述的步骤6中使用期望

最大化方法求解的方法具体为:
[0038]步骤6

1:估计数据由Component生成的概率;
[0039]对于每个数据X
i
,它由第k个Component生成的概率为:
[0040][0041]步骤6

2:根据概率值和最大似然估计找到参数;
[0042]假设步骤6

1中得到的γ(i,k)x
i
是由Componentk生成的,集中考虑所有的数据点,即由Component生成了γ(i,k)x
i

γ(N,k)x
N

[0043]由于每个Component都是一个标准的Gaussian分布,可求出最大似然所对应的参数值:
[0044][0045][0046]其中,并且π
k
可估计为N
k
/N;
[0047]步骤6

3:重复迭代步骤6

1和步骤6

2,直到似然函数的值收敛为止;
[0048]步骤6

4:采用AIC准则判别聚类个数的合理性;
[0049]AIC=2k
...

【技术保护点】

【技术特征摘要】
1.一种山区高速公路事故多发路段识别方法,其特征在于,所述的事故多发路段识别方法包括:步骤1:获取山区高速公路相关数据;步骤2:根据步骤1采集的数据,将山区高速公路划分为同质路段;步骤3:构建样本数据集;步骤4:针对山区高速公路事故总数构建负二项安全分析模型;步骤5:计算安全可提高空间PSI;步骤6:利用高斯混合聚类模型GMM对PSI高危路段进行聚类,获得事故多发路段识别结果。2.根据权利要求1所述的一种山区高速公路事故多发路段识别方法,其特征在于,所述的步骤1中山区高速公路相关数据包括:山区高速公路道路几何数据、交通运行数据、天气数据、路面抗滑性能数据及交通事故数据。3.根据权利要求2所述的一种山区高速公路事故多发路段识别方法,其特征在于,所述的道路几何数据包括道路横断面、纵断面及平面几何数据。4.根据权利要求3所述的一种山区高速公路事故多发路段识别方法,其特征在于,所述的步骤2具体为:根据步骤1获取的道路横断面、纵断面及平面几何数据,将山区高速公路划分为若干个同质路段,每个同质路段内道路横断面、纵断面及平面几何数据一致。5.根据权利要求1所述的一种山区高速公路事故多发路段识别方法,其特征在于,所述的步骤3具体为:提取各同质路段的道路几何设计变量、交通运行变量、天气变量、路面抗滑性能变量及事故总数,构建交通安全分析的样本数据集。6.根据权利要求1所述的一种山区高速公路事故多发路段识别方法,其特征在于,所述的步骤4具体为:假设路段交通事故数服从负二项分布,即模型方程为:log(θ)=β0+β1X1+


n
X
n
其中i为该山区高速公路上从1开始的同质路段编号;为路段i的事故预测值;变量X
i
为影响交通事故的因素;β
n
为变量对应的系数;α为负二项模型的离散系数。7.根据权利要求1所述的一种山区高速公路事故多发路段识别方法,其特征在于,所述的步骤5具体为:安全可提高空间以事故预测期望值与同类路段平均期望值的差值作为安全指标,判定路段安全性,计算方法为:PSI=E[r|x]

E[r]其中,E[r|x]为预测的路段事故数;E[r]为同类型路段的事故期望值,通过负...

【专利技术属性】
技术研发人员:王雪松蔡博文张琪
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1