一种基于强化学习方法和规则进化的可重构车间动态调度方法技术

技术编号:43356326 阅读:53 留言:0更新日期:2024-11-19 17:42
本发明专利技术公开了基于强化学习方法和规则进化的可重构车间动态调度方法,属于车间调度领域,包括:以最小化工件总拖期成本为目标,利用遗传规划算法对启发式调度规则进行选择和组合,得到了指导加工工件选择的复合调度规则,构建了效率优先的拓扑单元分配与重组的分层策略,融合了Double DQN、dueling DQN和优先经验回放机制提高DQN算法的寻优能力,并搭建了融合循环神经网络与多层感知机的智能体神经网络模型,在训练过程中提取车间加工任务分配的时序信息,同时建立了面向新工件到达的动态事件响应机制。本发明专利技术能够提高可重构车间调度的实时性和优化质量,并提高制造资源利用率,从而降低企业的生产成本,保证制造系统的稳定运行。

【技术实现步骤摘要】

本专利技术属于车间调度领域,更具体地,涉及一种基于强化学习方法和规则进化的可重构车间动态调度方法


技术介绍

1、全球制造业的快速发展和科技的日新月异的趋势下,智能制造的重要性日益凸显。智能制造作为新一代信息技术与制造业深度融合的产物,其核心在于通过智能化手段实现制造过程的自动化、信息化、网络化和柔性化。在智能制造的众多领域中,车间调度问题一直备受学术界和工业界的关注。车间调度作为优化生产流程、提高生产效率的重要手段,不仅能够提升生产效率、降低生产成本,还能有效应对市场需求的快速变化,推动企业实现可持续发展,其研究价值和应用前景日益凸显。

2、在实际的生产制造过程中,可重构车间是一种新颖高效的生产模式,能够满足多样化的制造需求,在多型混线装调车间中得到广泛应用。可重构车间能够对车间设备资源进行高效重组,进而提高制造资源的利用率。相较于传统作业车间,可重构车间的调度具有更复杂的问题空间。在考虑加工工艺流程柔性的基础上,可重构车间还需制定设备资源的重组策略。重构问题的引入,在提高制造车间生产能力的同时,也给调度带来了更大的不确定性。因此,研究可重构本文档来自技高网...

【技术保护点】

1.一种基于强化学习方法和规则进化的可重构车间动态调度方法,其特征在于,包括:初始化任务池和设备池,分别用于实时存放所述可重构车间中的所有待加工工件和空闲的设备单元,并构建基于DQN算法的决策智能体;所述决策智能体的优化目标为最小化工件加工的总拖期,动作空间由预设的工件选择启发式规则经遗传规划算法进化得到的多个复合调度规则构成;

2.如权利要求1所述的基于强化学习方法和规则进化的可重构车间动态调度方法,其特征在于,所述复合调度规则以二叉树结构表示;

3.如权利要求1所述的基于强化学习方法和规则进化的可重构车间动态调度方法,其特征在于:针对每一个拓扑单元,维护一个缓...

【技术特征摘要】

1.一种基于强化学习方法和规则进化的可重构车间动态调度方法,其特征在于,包括:初始化任务池和设备池,分别用于实时存放所述可重构车间中的所有待加工工件和空闲的设备单元,并构建基于dqn算法的决策智能体;所述决策智能体的优化目标为最小化工件加工的总拖期,动作空间由预设的工件选择启发式规则经遗传规划算法进化得到的多个复合调度规则构成;

2.如权利要求1所述的基于强化学习方法和规则进化的可重构车间动态调度方法,其特征在于,所述复合调度规则以二叉树结构表示;

3.如权利要求1所述的基于强化学习方法和规则进化的可重构车间动态调度方法,其特征在于:针对每一个拓扑单元,维护一个缓冲区,用于存放已分配给相应拓扑单元但当前无法进行加工的工件工序;

4.如权利要求3所述的基于强化学习方法和规则进化的可重构车间动态调度方法,其特征在于,所述分层策略还包括:

5.如权利要求1所述的基于强化学习方法和规则进化的可重构车间动态调度方法,其特征在于,所述可重构车间的...

【专利技术属性】
技术研发人员:李新宇迟秀雯刘齐浩王喆陈祥臻冯靖凯崔航浩李育鑫柳再为周金龙
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1