一种基于强化学习的集装箱码头自动化调度方法及系统技术方案

技术编号:43531435 阅读:42 留言:0更新日期:2024-12-03 12:16
本发明专利技术公开了基于一种基于强化学习的集装箱码头自动化调度方法及系统,所述方法包括:获取港口和船舶信息,根据港口和船舶信息进行环境初始化,构建待模拟的集装箱码头环境;响应于智能体通过将集装箱码头环境输入预构建的策略网络中生成的当前策略调度指令,按照马尔可夫决策过程模拟未来集装箱码头环境的状态以完成泊位和岸桥分配;其中,智能体根据当前策略进行泊位和岸桥调度更新码头状态并检查是否有船舶待调度,如果有,智能体根据环境反馈和奖励生成新的调度指令,直到所有船舶都完成调度和卸货任务,完成最终的泊位和岸桥分配。本发明专利技术能够减少船舶在集装箱码头的总停留时间,自动化完成船舶的调度和卸货。

【技术实现步骤摘要】

本专利技术涉及一种基于强化学习的集装箱码头自动化调度方法及系统,属于自动化集装箱码头。


技术介绍

1、集装箱码头的船舶泊位分配及岸桥分配优化问题(bacap)的核心在于如何有效地减少船舶在码头卸货时的总停留时间,以缩短货物交付的延迟。为了达到这个目标,需要对到达码头的船舶进行合理的泊位分配,并协调码头上的岸桥资源以提高卸货效率。

2、现有的解决bacap问题的方法主要分为两大类:数学求解器和启发式算法。数学求解器通过构建详尽的数学模型来表达问题,并利用如cplex这样高效求解器进行求解。但这种方法在处理大规模问题时面临建模和计算过程复杂、求解速度缓慢的问题,难以满足实时性要求。此外,当问题的约束条件发生变化时,需要对模型进行重构,进一步降低了计算效率。

3、启发式算法则是基于特定规则探索问题的可行解,相较于数学方法,启发式算法因其实用性和高效性而更受欢迎。这些算法包括动态规划、蒙特卡洛树搜索、滚动时域优化等。近年来,基于种群的元启发式算法,特别是进化算法和群体智能,已经被广泛研究和应用。这些算法通过评估函数来衡量种群中各解的效用,并本文档来自技高网...

【技术保护点】

1.一种基于强化学习的集装箱码头自动化调度方法,其特征在于,包括:

2.根据权利要求1所述的基于强化学习的集装箱码头自动化调度方法,其特征在于,所述港口和船舶信息包括岸桥、可停泊泊位区域以及船舶计划安排表;

3.根据权利要求1所述的基于强化学习的集装箱码头自动化调度方法,其特征在于,所述智能体通过将所述集装箱码头环境输入预构建的策略网络中所生成的当前策略调度指令,包括:

4.根据权利要求1所述的基于强化学习的集装箱码头自动化调度方法,其特征在于,所述根据当前策略调度指令进行调度后,更新集装箱码头环境的状态,判断是否存在等待调度的船舶,若存在等待调度的船...

【技术特征摘要】

1.一种基于强化学习的集装箱码头自动化调度方法,其特征在于,包括:

2.根据权利要求1所述的基于强化学习的集装箱码头自动化调度方法,其特征在于,所述港口和船舶信息包括岸桥、可停泊泊位区域以及船舶计划安排表;

3.根据权利要求1所述的基于强化学习的集装箱码头自动化调度方法,其特征在于,所述智能体通过将所述集装箱码头环境输入预构建的策略网络中所生成的当前策略调度指令,包括:

4.根据权利要求1所述的基于强化学习的集装箱码头自动化调度方法,其特征在于,所述根据当前策略调度指令进行调度后,更新集装箱码头环境的状态,判断是否存在等待调度的船舶,若存在等待调度的船舶,则将更新后的集装箱码头环境的状态和相应的奖励反馈给智能体,通过智能体生成新的策略调度指令,具体包括:

5.根据权利要求4所述的基于强化学习的集装箱码头自动化调度方法,其特征...

【专利技术属性】
技术研发人员:许沛澜李晟畅
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1