基于深度强化学习的两阶段装配流水车间动态调度方法技术

技术编号:40076234 阅读:40 留言:0更新日期:2024-01-17 01:21
本发明专利技术公开了一种基于深度强化学习的两阶段装配流水车间动态调度方法,包括:构建基于深度强化学习的实时调度框架,其中,实时调度框架包括调度智能体和环境状态,基于实时调度框架,将生产调度问题转化成调度智能体基于环境状态实时排序工件的问题;将调度智能体基于环境状态实时排序工件的过程建模为马尔可夫决策过程,对状态空间、动作空间和奖励函数进行定义;基于马尔可夫决策过程采用深度强化学习算法对调度智能体进行训练,得到训练好的调度智能体;工件需求实时到达时获取当前调度区域环境状态信息,将当前调度区域环境状态信息输入训练好的调度智能体得到实时调度结果。

【技术实现步骤摘要】

本专利技术涉及一种基于深度强化学习的两阶段装配流水车间动态调度方法,属于装配流水车间动态调度。


技术介绍

1、两阶段装配流水车间调度问题是生产调度中一类被广泛研究的问题,已被证明是np难问题。该问题考虑一批待生产的工件,每个工件由多个零部件组装而成。每个零组件在第一阶段特定的机器上进行加工,待所有零件加工完毕后再被送至第二阶段进行装配。

2、求解两阶段装配流水车间调度问题的热门方法主要分为精确算法和启发式算法。但是,现有关于两阶段装配流水车间调度的研究很少考虑复杂动态的实际生产环境。在实际生产环境中,经常发生工件随机到达、机器故障等动态事件。当工件随机到达时,调度计划应进行调整和重新安排。整个过程既要保证快速求解,还要保证所求解的质量。精确算法虽然能够求解得到最优解,但是求解时间随问题规模增大而急速增加。启发式算法能够在有限时间给出一个较优的可行解,但是算法性能不够稳定。针对动态调度问题,传统的实时调度仅仅考虑静态调度规则,产生调度方案的效果往往不能让人满意。

3、随着人工智能技术的快速发展,深度强化学习(deep reinforc本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习的两阶段装配流水车间动态调度方法,其特征在于,包括:

2.根据权利要求1所述的基于深度强化学习的两阶段装配流水车间动态调度方法,其特征在于,所述调度区域环境信息包括:初始工件数量、陆续到达的工件数量、工件包含的零件数、装配机器的数量、零件加工时间、工件装配时间、机器准备时间和新工件到达时间。

3.根据权利要求2所述的基于深度强化学习的两阶段装配流水车间动态调度方法,其特征在于,所述实时调度框架的实施过程包括:

4.根据权利要求3所述的基于深度强化学习的两阶段装配流水车间动态调度方法,其特征在于,将调度智能体基于环境状态实时排序工...

【技术特征摘要】

1.一种基于深度强化学习的两阶段装配流水车间动态调度方法,其特征在于,包括:

2.根据权利要求1所述的基于深度强化学习的两阶段装配流水车间动态调度方法,其特征在于,所述调度区域环境信息包括:初始工件数量、陆续到达的工件数量、工件包含的零件数、装配机器的数量、零件加工时间、工件装配时间、机器准备时间和新工件到达时间。

3.根据权利要求2所述的基于深度强化学习的两阶段装配流水车间动态调度方法,其特征在于,所述实时调度框架的实施过程包括:

4.根据权利要求3所述的基于深度强化学习的两阶段装配流水车间动态调度方法,其特征在于,将调度智能体基于环境状态实时排序工件的过程建模为马尔可夫决策过程,对状态空间、动作空间和奖励函数进行定义;

5.根据权利要求4所述的基于深度强化学习的两阶段装配流水车间动态调度方法,其特征在于,所述动作空间包括:最短加工时间优先、最早交货期优先、关键比率优先、...

【专利技术属性】
技术研发人员:陈剑张晗磊马文静叶旭栋周鸿
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1