当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于RSF模型的交通事故持续时间影响因素分析方法技术

技术编号:33149547 阅读:33 留言:0更新日期:2022-04-22 14:03
本发明专利技术涉及一种基于RSF算法的交通事故持续时间影响因素分析方法,该方法包括以下步骤:步骤S1、获取轨道交通事故数据,预处理后得到原始数据集;步骤S2、构建基于随机生存森林模型的事故持续时间预测模型;步骤S3、基于C

【技术实现步骤摘要】
一种基于RSF模型的交通事故持续时间影响因素分析方法


[0001]本专利技术涉及轨道交通领域,尤其是涉及一种基于RSF模型的交通事故持续时间影响因素分析方法。

技术介绍

[0002]轨道交通具有运量大、效率高、节能环保的优势。随着我国城市化进程的不断推进,城区的轨道交通网络也得到了大幅地发展,轨道交通正在逐步成为城市居民的主要出行方式。但随着轨道交通的不断发展,轨道交通事故的发生频率也在不断增加。由于轨道交通具有高峰期站点客流量大、列车乘客密度高的特点,一旦轨道交通中断事件发生,将导致城市交通系统的中断,并形成大量的乘客滞留,甚者将导致严重的人员伤亡。在世界各地,轨道交通运营商和乘客都被日益严重的轨道交通事故所困扰。
[0003]因此,轨道交通事故持续时间的准确预测对于应急响应决策至关重要。有关事故的持续时间的研究,现有研究主要针对城市道路事故预测,例如城市快速路与高速公路等。有关于轨道交通事故持续时间相关研究较少,且主要使用对于数据要求较高、预测准确率相对较低的参数模型,对于存在删失数据的事故数据集,现有的方法在预测准确性上有一定局限本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于RSF算法的交通事故持续时间影响因素分析方法,其特征在于,该方法包括以下步骤:步骤S1、获取轨道交通事故数据,预处理后得到原始数据集;步骤S2、构建基于随机生存森林模型的事故持续时间预测模型;步骤S3、基于C

index求得的预测误差率选取最优随机生存森林模型;步骤S4、通过变量重要性VIMP指标确定轨道交通事故持续时间的影响因素,并计算重要程度。2.根据权利要求1所述的一种基于RSF算法的交通事故持续时间影响因素分析方法,其特征在于,所述步骤S1具体为:采用爬虫算法提取轨道交通事故数据,包括事故持续时间、事故类型、事故区段以及发布信息;对于轨道交通事故数据进行文本信息提取,并剔除重复、缺失和异常的数据并对于事故数据进行拓展,增加路线相关变量、环境变量、站点相关变量、事故相关变量、事故类型变量进行分析,获得原始数据集D。3.根据权利要求1所述的一种基于RSF算法的交通事故持续时间影响因素分析方法,其特征在于,所述步骤S2包括以下子步骤:步骤S21、利用bootstrap法从原始数据集D中分离出训练数据集L以及测试数据集L

;步骤S22、构建二元递归生存树,随机选取预定数量的特征进行拆分,并对比不同节点拆分规则,选择对子节点生存值差异最大的节点拆分规则进行拆分,尽可能地生长生存树,直到每个末端节点的样本数不低于最小默认值;步骤S23、在生成预设数量的生存树后,采用Nelson

Aalen方法估计随机生存森林模型的总累积风险。4.根据权利要求3所述的一种基于RSF算法的交通事故持续时间影响因素分析方法,其特征在于,所述步骤S21中原始数据集D表示为(X1,T1,δ1),...,(X
n
,T
n
,δ
n
),其中,X表示事件影响因素对应的特征向量,T表示事件的持续时间,δ表示删失状态。5.根据权利要求4所述的一种基于RSF算法的交通事故持续时间影响因素分析方法,其特征在于,所述步骤S22中的不同节点拆分规则包括Log

rank拆分法、Log

rank score拆分法以及Random拆分法。6.根据权利要求3所述的一种基于RSF算法的交通事故持续时间影响因素分析方法,其特征在于,所述步骤S23具体为:对于终端节点h,第l棵树的CHF累积危险函数为:其中,为终端节点h,第l棵树的CHF累积危险函数值;d
l,h
为终端节点h中事故持续时间大于t
l,h
的样本数,Y
l,h
为终端节点h中事故持续时间大于t
l,h
时发生事件的样本数;则对于整个随机森林模型样本的总累积风险为:
其中,L为生存树数目;x...

【专利技术属性】
技术研发人员:李健王歆远
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1