【技术实现步骤摘要】
一种基于深度强化学习的航天起爆器生产调度方法
本专利技术涉及机器学习与智能制造领域,具体是一种基于深度强化学习的航天起爆器生产调度方法。
技术介绍
随着航天事业的快速发展,航天火工品需求量不断增加,传统基于手工生产的生产模式远远不能达到发展需求。目前,生产航天火工品的离散制造企业正处于自动化生产的转型期,正由传统的大批量生产模式向小批量、多批次的柔性生产模式转型。柔性生产加工调度比传统生产调度更加灵活,更能适应外部环境的动态变化。在复杂动态场合加工,调度方案及参数通常由工人的主观经验及知识进行组织生产,需要耗费巨大的时间和劳动力且生产效率及稳定性也难以保证。因此,深入了解起爆器生产加工调度现状,分析整个生产结构与功能需求,优化起爆器柔性生产车间生产调度对企业具有重要意义。在复杂动态场合加工,传统的调度方案及参数的制定通常由工人的主观经验及知识进行组织生产,需要耗费巨大的时间和劳动力且生产效率及稳定性也难以保证。而现有的生产调度算法,如运筹学调度算法、启发式搜索算法以及群体算法等,都能够对生产加工进行有效调度,在调度问 ...
【技术保护点】
1.一种基于深度强化学习的航天起爆器生产调度方法,其特征在于,包括步骤:/nS1、从起爆器生产车间获取生产加工的实时信息;/nS2、根据起爆器生产车间收集的实时信息,确定起爆器柔性生产车间调度问题描述和相关假设;/nS3、确定起爆器生产车间调度优化的目标函数及约束条件;/nS4、将起爆器生产调度问题构造为马尔科夫决策模型,将实时信息转化为实时状态;/nS5、将实时状态信息存储在记忆库中,作为深度强化学习DQN算法训练的输入;/nS6、深度强化学习DQN算法的训练;/nS7、起爆器生产实时调度。/n
【技术特征摘要】
1.一种基于深度强化学习的航天起爆器生产调度方法,其特征在于,包括步骤:
S1、从起爆器生产车间获取生产加工的实时信息;
S2、根据起爆器生产车间收集的实时信息,确定起爆器柔性生产车间调度问题描述和相关假设;
S3、确定起爆器生产车间调度优化的目标函数及约束条件;
S4、将起爆器生产调度问题构造为马尔科夫决策模型,将实时信息转化为实时状态;
S5、将实时状态信息存储在记忆库中,作为深度强化学习DQN算法训练的输入;
S6、深度强化学习DQN算法的训练;
S7、起爆器生产实时调度。
2.根据权利要求1所述的一种基于深度强化学习的航天起爆器生产调度方法,其特征在于:步骤S1中,所述实时信息包括机器设备总台数、生产加工计划、各生产工序加工时间、工件加工工序数以及各加工工序开完工时间。
3.根据权利要求1所述的一种基于深度强化学习的航天起爆器生产调度方法,其特征在于:步骤S1中,所述起爆器柔性生产车间调度问题描述为合理地将每道工序分配到一个具体的设备,同时排列设备上工件的加工顺序,并确定开始加工的时间,使其满足调度优化目标。
4.根据权利要求1所述的一种基于深度强化学习的航天起爆器生产调度方法,其特征在于:步骤S2中,所述相关假设包括第一假设、第二假设、第三假设;
所述第一假设为:各生产机器设备相互独立,加工过程中互不影响;
所述第二假设为:在零时刻,任意设备和工件均准备就绪;
所述第三假设为:每台设备在任意时刻正在加工的产品只能有一个。
5.根据权利要求1所述的一种基于深度强化学习的航天起爆器生产调度方法,其特征在于:步骤S3中,所述目标函数为:
其中,
MinmizeW表示最小化机器总负荷;MinmizeM表示最少加工等待时间;A表示需要生产加工的起爆器的数量;m表示第m个工件,m∈(1,2,…A);sj表示每个起爆器需要多少道加工工序;n表示第n道工序,n∈(1,2,…sj);Q表示设备数量;q表示第q台设备,q∈(1,2,…Q);
Omn表示加工工件m的第n道工序;Gmnq表示设备q加工工序Omn的加工时间;Umnq表示工件m在q设备上进行n工序的加工,当工序Omn选择设备q加工,则Umnq=1,其它则为0;Em表示加工工件m的的总加工时间;Nmn表示工序...
【专利技术属性】
技术研发人员:魏善碧,余笑,王昱,肖勇,王辉阳,吴睿,
申请(专利权)人:重庆大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。