基于深度强化学习与异构图神经网络的动态调度优化方法技术

技术编号:46450858 阅读:8 留言:0更新日期:2025-09-23 22:18
本发明专利技术公开了基于深度强化学习与异构图神经网络的动态调度优化方法。本发明专利技术首先将柔性作业车间调度问题转换为马尔可夫决策过程,设置状态、动作、状态转移以及奖励函数;然后构建基础异构图和增强异构图,定义节点和边的类型和数量,边之间的有向关系;采用异构图注意力网络进行三阶段特征嵌入,获得机器节点嵌入、操作节点嵌入、分配实例节点嵌入和全局状态特征;输入各个特征处理后形成的动作状态向量,根据奖励函数优化决策网络,更新参数得到柔性作业车间调度模型,完成FJSP求解。本发明专利技术方法可以有效考虑运输时间与机器可达性约束下的柔性作业车间调度问题,还可以处理不同规模的调度问题,具有较好的泛化能力,在大规模应用中表现出色。

【技术实现步骤摘要】

本专利技术属于工业自动化与智能制造,具体涉及一种基于深度强化学习(deep reinforcement learning,drl)与异构图神经网络(heterogeneous graph neuralnetwork, hgnn)的柔性作业车间动态调度优化方法及系统,尤其适用于运输时间与机器可达性约束下的复杂生产环境。


技术介绍

1、柔性作业车间调度问题(flexible job shop scheduling problem, fjsp)是工业生产的核心挑战之一,其核心任务是为多操作作业动态分配兼容设备并优化调度顺序,从而最小化完工时间(makespan)。传统方法如启发式规则(如spt、fifo)缺乏全局优化能力,而混合整数规划(mip)虽能获得精确解,但计算复杂度高,难以应对大规模动态场景。现有基于图神经网络的方法多采用静态同质图建模,无法有效处理运输时间、机器可达性约束及动态调度过程中的级联影响,导致调度冲突与资源浪费。同时其优化目标大多只考虑完工时间影响,无法统筹完工时间缩短、操作等待公平性及设备负载均衡。


>技术实现思路本文档来自技高网...

【技术保护点】

1.基于深度强化学习与异构图神经网络的动态调度优化方法,其特征在于:

2.如权利要求1所述的基于深度强化学习与异构图神经网络的动态调度优化方法,其特征在于,步骤(1)中所述的马尔可夫决策过程的设置具体如下:

3.如权利要求2所述的基于深度强化学习与异构图神经网络的动态调度优化方法,其特征在于:步骤(2)中所述的基础异构图表示为;表示操作节点集,包含所有作业操作及虚拟起止节点;表示机器节点集,每台物理设备对应独立节点;为边集,如表示有向时序约束边集,用来描述作业内操作的加工顺序,而则代表无向设备关联边集,表示操作与兼容机器的可分配关系;

<p>4.如权利要求3...

【技术特征摘要】

1.基于深度强化学习与异构图神经网络的动态调度优化方法,其特征在于:

2.如权利要求1所述的基于深度强化学习与异构图神经网络的动态调度优化方法,其特征在于,步骤(1)中所述的马尔可夫决策过程的设置具体如下:

3.如权利要求2所述的基于深度强化学习与异构图神经网络的动态调度优化方法,其特征在于:步骤(2)中所述的基础异构图表示为;表示操作节点集,包含所有作业操作及虚拟起止节点;表示机器节点集,每台物理设备对应独立节点;为边集,如表示有向时序约束边集,用来描述作业内操作的加工顺序,而则代表无向设备关联边集,表示操作与兼容机器的可分配关系;

4.如权利要求3所述的基于深度强化学习与异构图神经网络的动态调度优化方法,其特...

【专利技术属性】
技术研发人员:刘闯陈涛黄伟詹秀秀张建章
申请(专利权)人:杭州师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1