一种基于强化学习的路面养护决策方法技术

技术编号:43134821 阅读:29 留言:0更新日期:2024-10-29 17:40
本发明专利技术公开了一种基于强化学习的路面养护决策方法,首先构建路面养护决策模型,并设定其约束条件,之后基于DDQN强化学习算法对道路养护决策模型进行迭代求解,得到最优的路面养护决策。本发明专利技术的路面养护决策方法基于强化学习自动化决策过程,在试错中学习,通过与环境的交互自主学习,提供全局最优解,减少了人为干预,寻求最大化长期收益,适用于广泛的路网管理,提高了决策整体的效率。

【技术实现步骤摘要】

本专利技术属于路面养护领域,具体涉及一种基于强化学习的路面养护决策方法


技术介绍

1、在当今的大数据时代,路面养护决策的复杂性和挑战性日益增加。伴随着城市化进程的加速和交通网络的持续扩张,海量的数据被生成,这包括了养护措施效益、路面状况以及养护成本等多维度信息。这些信息的有效整合和分析对于提高路面养护的决策效率至关重要。然而,传统的决策方法往往无法有效处理这种规模的数据,无法实时适应快速变化的环境条件。因此,探索一种能够有效处理大数据,同时提高决策效率的方法显得尤为迫切。

2、也有学者提出一种路面养护维修智能决策系统。中国专利号cn113723753a号所公开的“一种路面养护维修智能决策系统”(申请号:202110843921.4)。该系统通过收集道路状态参数,计算各个参考方案的奖励值,针对奖励值达到特定阈值的参考方案,运用强化学习模型进行深入分析,综合考量养护维修参考因素,确定各参考方案的优先级,把优先级最高的参考方案作为最优养护方案。

3、但该系统的运作机制依赖于预先设定的一系列参考方案。若最优的养护方案未被包含在这些预设参考本文档来自技高网...

【技术保护点】

1.一种基于强化学习的路面养护决策方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于强化学习的路面养护决策方法,其特征在于,所述步骤1中的路面养护决策模型,具体为:

3.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述状态空间用于表征路面状态,采用路段和年份表示路面状态:

4.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述动作空间用于表征选择的路面养护措施;

5.根据权利要求4所述的基于强化学习的路面养护决策方法,其特征在于,所述路面养护决策模型的约束条件为:

6.根据权利要...

【技术特征摘要】

1.一种基于强化学习的路面养护决策方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于强化学习的路面养护决策方法,其特征在于,所述步骤1中的路面养护决策模型,具体为:

3.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述状态空间用于表征路面状态,采用路段和年份表示路面状态:

4.根据权利要求2所述的基于强化学习的路面养护决策方法,其特征在于,所述动作空间用于表征选择的路面养护措施;

5.根据权利要求4所述的基于强化学习的路面养护决策方法,其特征在于,所...

【专利技术属性】
技术研发人员:石文康王永刘星华飞飞戴仁礼常伟陈静
申请(专利权)人:江苏宁宿徐高速公路有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1