一种铁路施工进度指标预测和在线更新方法技术

技术编号:34367103 阅读:66 留言:0更新日期:2022-07-31 09:19
本发明专利技术公开了一种铁路施工进度指标预测和在线更新方法,所述方法包括:建立铁路施工进度指标分析的初始数据集,将初始数据集按照指定的比例划分为训练数据集和测试数据集;将训练数集作为随机森林回归模型的输入变量,得到最优特征变量集;将最优特征变量集作为XGboost模型的输入变量,得到预测结果,然后采用测试数集验证预测结果;对预测结果进行分析;获取新的工期进度数据后,对XGboos模型进行更新和修正。本发明专利技术分利用了随机森林能够有效处理有多个维度、噪声干扰的样本数据,筛选有用特征变量的特点,创新性地提高了XGboost模型的预测精度,使得铁路施工进度指标的预测结果更加准确可靠。结果更加准确可靠。结果更加准确可靠。

A method of railway construction progress index prediction and online update

【技术实现步骤摘要】
一种铁路施工进度指标预测和在线更新方法


[0001]本专利技术属于铁路施工进度管理
,更具体地,涉及一种铁路施工进度指标预测和在线更新方法。

技术介绍

[0002]目前铁路建设单位在工程进度管控和工程计划实时调整的过程中存在着难题,因为各地区铁路工程建设推进各有特点,工程中各步骤耗时大不相同,难以使用规定好的标准限定,导致在管控中基本依靠经验来判断工程进度,难以实现铁路工程全过程的精益管控。同时由于无法用准确的数据来定量分析工程各阶段进度的滞后或者超前,导致工程计划的制定和变更比较粗糙,工程完工的实际耗时与计划安排难以匹配。
[0003]随着计算机技术的不断进步,一些专家也开始将目光转向智能算法领域,尝试结合智能算法来进行工期预测的研究,但目前对于智能算法的应用还处于起步阶段,大多采用的是单一的回归预测模型,虽然有效地解决了研究中出现的一些复杂问题,减小了误差,提高了研究效率,但是单一模型存在高度依赖于数据库的准确性,收敛速度较慢,易陷入局部最优等固有缺陷,可能会导致不恰当和不可靠的预测结果。此外,铁路施工进度指标预测存在影响因素本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种铁路施工进度指标预测和在线更新方法,其特征在于,包含以下步骤:S1:采集工期影响因素的样本数据,建立铁路施工进度指标分析的初始数据集,将初始数据集按照指定的比例划分为训练数据集和测试数据集;S2:将所述训练数集作为随机森林回归模型的输入变量,对工期影响因素进行重要性评价,根据该变量重要性评价的结果对工期影响因素进行特征选择,选出随机森林回归模型误差最小的影响因素集合,并将该影响因素集合作为最优特征变量集;S3:将所述最优特征变量集作为XGboost模型的输入变量,对XGboost模型进行训练,得到预测结果,然后采用所述测试数集验证预测结果;S4:对所述预测结果进行分析,验证XGboost模型预测铁路施工进度的效果;S5:获取新的工期进度数据后,利用新的工期进度数据进行增量学习,对XGboos模型进行更新和修正。2.如权利要求1所述的铁路施工进度指标预测和在线更新方法,其特征在于,所述步骤S2具体包括以下子步骤:S21:将所述训练数据集作为随机森林回归模型的输入,对于随机森林回归模型中的每一棵决策树,采用该决策树相应的袋外数据计算其袋外数据误差;S22:随机将上述决策树相应的袋外数据中所有样本数据的一个变量作为特征X,并对该特征X加入噪声干扰,然后再次计算该决策树相应的袋外数据误差;S23:构建重要性计算模型,并根据所述重要性计算模型对上述特征X进行变量重要性评价,重要度计算模型I为:其中,r1为使用相应的袋外数据计算的袋外误差,r2为随机变换袋外数据中某个特征的顺序后再次计算的袋外误差,N表示数据集的个数,i为数据序号;S24:重复步骤S21至步骤S23,直至输出所述训练数集中所有变量的变量重要性评价,然后绘制变量重要性评价的可视化绘图,并将所有变量的变量重要性评价按降序排列,并根据排序结果对变量进行重要性度量的初步筛选,获得初步筛选后的变量集;S25:利用递归特征后向消除法从初步筛选后的变量集中逐次去除指定比例的变量,每次去除得到一个变量,对比除去该变量后剩余变量对应的袋外误差率,将袋外误差率最小的变量集作为最优特征变量集,并以此确定最优特征变量集中最优特征的...

【专利技术属性】
技术研发人员:刘延宏汤友富魏强陈亮桂婞陈云王鹏余小周郭亚娟游江寇智聪邢众一田圆圆
申请(专利权)人:中国铁路建设管理有限公司中铁第五勘察设计院集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1