一种基于XGBoost的公路阻断损失预测方法及系统技术方案

技术编号:34829235 阅读:14 留言:0更新日期:2022-09-08 07:21
本发明专利技术公开一种基于XGBoost的公路阻断损失预测方法及系统,方法包括以下步骤:获取原始公路阻断事件数据;对所述原始公路阻断事件数据进行清洗,获得公路阻断事件数据集;对所述公路阻断事件数据集进行预处理;将预处理后的所述公路阻断事件数据集输入极限梯度提升网络XGBoost,构建公路阻断损失预测模型;利用所述公路阻断损失预测模型对公路阻断损失进行预测,获得预测结果。本发明专利技术能够对公路阻断损失进行准确预测,填补了目前对于公路阻断事件损失金额预测的空白。件损失金额预测的空白。件损失金额预测的空白。

【技术实现步骤摘要】
一种基于XGBoost的公路阻断损失预测方法及系统


[0001]本专利技术涉及公路人工智能领域,特别是涉及一种基于XGBoost的公路阻断损失预测方法及系统。

技术介绍

[0002]公路阻断事件是指因滑坡、泥石流、塌方、雪灾、滚石等因素导致的公路交通阻断,公路阻断事件损失的预测,可以作为公路及时抢修抢通的有力依据,同时也能为工程施工、财政预算、审计等相关工作提供重要参考。因此,对于公路阻断事件的数据挖掘和信息处理具有相当大的意义和价值。公路阻断事件损失预测作为公路事故应急管理的重要前提,有利于道路交通管理部门针对已发生的交通事件做出合理的决策,展开相应的道路疏通工作,合理配置最优保障资源,减少事故发生后可能带来的后续损失,也有助于出行者合理规划自己的行程线路,同时可以为阻断事件中造成的损失统计和后续采取抢修措施、工程施工、财务、审计等相关工作提供有力支持。
[0003]公路阻断事件损失的预测指的是在公路阻断事件数据资料的基础上对阻断事件变化规律的研究,以及阻断事件损失变化趋势的预测。目前常用的研究方法有数理统计法、回归法、时间序列法、马尔科夫链法、灰色预测法、神经网络法及其他非线性预测方法等。对于公路阻断损失的预测主要是基于事件线的逻辑因果关系,对阻断事件的文本数据资料统计、分析、数据挖掘和基于时间序列等方法进行的预测。公路阻断事件作为一种随机事件,其发生和变化受各种客观因素的影响,如:天气、地质、路况、自然灾害等,其趋势特征虽然不受人们主观因素所控制,但是却存在着客观的逻辑关系,由此可以通过历史数据对其建模研究,以达到预测其变化趋势和规律的目的。
[0004]目前直接针对公路交通阻断所造成损失金额进行预测的相关研究还比较少,但是国内外对于各种公路事件预测的研究已经取得不俗的成果,主要的研究方向为针对交通事故发生的预测、交通事故持续时间的预测、交通动态流量的预测和交通事故持续时间的预测。对相关研究文献进行归纳后,这些研究可分为三种主要的研究方法,第一:基于概率与数理统计的预测模型研究,其优点在于可以利用数据信息进行建模,数据逻辑关系明显,可解释性强,但是需要大量的统计数据,求解模型较复杂,泛化性差;第二:基于传统机器学习的预测研究,如SVM、朴素贝叶斯等,易于实现,计算复杂度较低,速度快,存储资源低,但是对数据的表达形式很敏感,需要特征独立,对缺失数据的处理困难,容易过拟合等不足;第三:基于深度学习的预测研究,其学习能力强,覆盖范围广,适应力强,可移植性好等,但是深度学习需要大量的训练数据和很高的算力,硬件要求很高,便携性差,成本很高,计算量大,模型设计复杂。
[0005]通常大量的公路阻断事件信息被记录在文本中,难以全部数值化处理,因此,现有的研究方法由于受数据类型和数据精度的影响,无论是在时效性和预测精度上还是对数据本身挖掘程度上都难以满足实际需要。
[0006]因此,亟需一种结合数据清洗、文本向量化和极限梯度提升网络的公路阻断损失
预测方法。

技术实现思路

[0007]本专利技术的目的是提供一种基于XGBoost的公路阻断损失预测方法及系统,以解决上述现有技术存在的问题,使在公路阻断损失预测任务中,进行公路阻断损失预测,填补了目前对于公路阻断事件损失金额预测的空白。
[0008]为实现上述目的,本专利技术提供了如下方案:本专利技术提供一种基于XGBoost的公路阻断损失预测方法,包括以下步骤:
[0009]获取原始公路阻断事件数据;
[0010]对所述原始公路阻断事件数据进行清洗,获得公路阻断事件数据集;
[0011]对所述公路阻断事件数据集进行预处理;
[0012]将预处理后的所述公路阻断事件数据集输入极限梯度提升网络XGBoost,构建公路阻断损失预测模型;
[0013]利用所述公路阻断损失预测模型对公路阻断损失进行预测,获得预测结果。
[0014]可选地,对所述原始公路阻断事件数据进行清洗,获得所述公路阻断事件数据集包括:
[0015]整理所述原始公路阻断事件数据,统一所述原始公路阻断事件数据的格式,填补缺失值,进行一致性检查,删除重复值、无效值,获得所述公路阻断事件数据集。
[0016]可选地,所述公路阻断事件数据集包括路线编号、起点桩号和止点桩号、公路阻断发生地点、采取抢修措施、塌方处、塌方数量。
[0017]可选地,对所述公路阻断事件数据集进行预处理包括:区分所述公路阻断事件数据的类型,根据所述类型分别进行预处理,包括文本one

hot编码处理、时间信息分箱处理和数据权重赋值。
[0018]可选地,所述将预处理后的所述公路阻断事件数据集输入极限梯度提升网络XGBoost,构建公路阻断损失预测模型包括:
[0019]构建极限梯度提升网络XGBoost,设置初始化参数,其中所述参数包括最大深度、学习率、迭代次数,构建目标函数,将所述预处理后的所述公路阻断事件数据输入所述极限梯度提升网络XGBoost进行训练,获得初始公路阻断损失预测模型,对所述初始公路阻断损失预测模型进行优化,获得公路阻断损失预测模型。
[0020]可选地,所述损失预测方法还包括对所述公路阻断损失预测模型进行评价。
[0021]可选地,对所述公路阻断损失预测模型进行评价的过程中,以均方根误差RMSE平均绝对误差MAE和R2_score对所述公路阻断损失预测模型进行评价。
[0022]还提供一种基于XGBoost的公路阻断损失预测系统,包括数据获取模块、数据清洗模块、数据预处理模块和分析预测模块,
[0023]所述数据获取模块,用于获取原始公路阻断事件数据;
[0024]所述数据清洗模块,用于对所述原始公路阻断事件数据进行清洗,获得公路阻断事件数据;
[0025]所述数据预处理模块,用于对所述公路阻断事件数据进行预处理;
[0026]所述分析预测模块,用于将预处理后的所述公路阻断事件数据输入极限梯度提升
网络XGBoost,构建公路阻断损失预测模型;
[0027]利用所述公路阻断损失预测模型对公路阻断损失进行预测,获得预测结果。
[0028]可选地,所述预测系统还包括评价模块,所述评价模块用于对所述公路阻断损失预测模型进行评价。
[0029]本专利技术公开了以下技术效果:
[0030]本专利技术提供的一种基于XGBoost的公路阻断损失预测方法及系统,有效地结合了数据清洗模块保证了数据可用性,清除不符合要求的数据得到可用数据集,可以节省时间并提高效率;将包括文本one

hot编码处理、时间信息分箱处理、部分数据权重赋值等多种方法用于数据预处理,以生成模型的训练集;基于XGBoost网络搭建专利技术的主模型,有效地提高了公路阻断损失预测的效率及准确性。
附图说明
[0031]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于XGBoost的公路阻断损失预测方法,其特征在于,包括以下步骤:获取原始公路阻断事件数据;对所述原始公路阻断事件数据进行清洗,获得公路阻断事件数据集;对所述公路阻断事件数据集进行预处理;将预处理后的所述公路阻断事件数据集输入极限梯度提升网络XGBoost,构建公路阻断损失预测模型;利用所述公路阻断损失预测模型对公路阻断损失进行预测,获得预测结果。2.根据权利要求1所述的基于XGBoost的公路阻断损失预测方法,其特征在于,对所述原始公路阻断事件数据进行清洗,获得所述公路阻断事件数据集包括:整理所述原始公路阻断事件数据,统一所述原始公路阻断事件数据的格式,填补缺失值,进行一致性检查,删除重复值、无效值,获得所述公路阻断事件数据集。3.根据权利要求1或2所述的基于XGBoost的公路阻断损失预测方法,其特征在于,所述公路阻断事件数据集包括路线编号、起点桩号和止点桩号、公路阻断发生地点、采取抢修措施、塌方处、塌方数量。4.根据权利要求3所述的基于XGBoost的公路阻断损失预测方法,其特征在于,对所述公路阻断事件数据集进行预处理包括:区分所述公路阻断事件数据的类型,根据所述类型分别进行预处理,包括文本one

hot编码处理、时间信息分箱处理和数据权重赋值。5.根据权利要求1或4所述的基于XGBoost的公路阻断损失预测方法,其特征在于,所述将预处理后的所述公路阻断事件数据集输入极限梯度提升网络XGBoost,构建公路阻断损失预测模型包括:构建极限梯度...

【专利技术属性】
技术研发人员:张家洪郭红烈李英娜赵振刚
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1