【技术实现步骤摘要】
本申请涉及车间自适应调度,特别是涉及一种柔性车间的零件加工调度方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
技术介绍
1、在工厂柔性车间任务中,每个零件要经过不同工序的加工,而每道工序又包含不同设备可供选择。工厂在接到一批零件加工订单后,如何确定该订单中零件的生产加工顺序,以及在每道工序上分配到哪台机器上,会对工厂柔性车间的利用效率和最终产能有着较大的影响。
2、通常的,在工厂柔性车间的调度任务中,单纯依靠人工进行排产,排产效率低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高排产效率的柔性车间的零件加工调度方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种柔性车间的零件加工调度方法。所述方法包括:
3、获取生产订单,并基于所述生产订单中的零件和所述零件对应的工序构建析取图;其中,所述析取图中的节点表征零件与工序之间的关系;
4、从所述析取图中提取当前时刻的动作集,获得所述当前时刻的动作集中的各节点对应的全局特征和节点特征,并聚合所述节点特征和所述全局特征,获得所述当前时刻的动作集中的各节点对应的状态特征;
5、基于所述当前时刻的动作集中的各节点对应的状态特征,获得所述当前时刻的动作集中的各节点对应的第一选择概率,并将第一选择概率最大时所对应的节点作为所述当前时刻的第一动作;
6、获得所述当前时刻的第一动作中的工序、所对应的设备集合
7、基于所述当前时刻的第一动作和所述第二动作,更新所述析取图,以基于更新的析取图获得所有时刻的第一动作和第二动作,以基于所有时刻的第一动作和第二动作对所述生产订单进行处理。
8、在其中一个实施例中,所述获得所述当前时刻的动作集中的各节点的全局特征,包括:
9、获取零件工作时间表,所述零件工作时间表包括不同零件在不同设备上的预估处理时间以及不同零件在不同工序上的设备之间的移动时间;
10、基于所述零件工作时间表中与所述当前时刻的动作集中的各节点中的零件对应的预估处理时间和移动时间,获得所述当前时刻的动作集中的各节点对应的第一特征;所述全局特征包括所述第一特征,所述第一特征表征节点中的零件的工作时间;
11、基于所述当前时刻的动作集中的各节点中的零件被对应的工序上的设备加工完成的预设时间、各节点中的零件离开对应的工序上的设备的离开时间,获得所述当前时刻的动作集中的各节点对应的第二特征;所述全局特征还包括所述第二特征,所述第二特征用于表征节点中的工序上的设备的等待时间。
12、在其中一个实施例中,所述基于所述当前时刻的动作集中的各节点对应的状态特征,获得所述当前时刻的动作集中的各节点对应的第一选择概率,包括:
13、将所述当前时刻的动作集中的各节点对应的状态特征输入策略网络,获得所述当前时刻的动作集中的各节点对应的第一输出特征;
14、基于所述当前时刻的动作集中的各节点对应的第一输出特征、以及归一化指数函数,获得所述当前时刻的动作集中的各节点对应的第一选择概率。
15、在其中一个实施例中,所述基于所述当前时刻的动作集中的各节点对应的第一输出特征、以及归一化指数函数,获得所述当前时刻的动作集中的各节点对应的第一选择概率,包括:
16、基于所述当前时刻的动作集中的各节点对应的第一输出特征、以及归一化指数函数,获得所述当前时刻的动作集中的各节点对应的第一参考概率;
17、基于所述当前时刻的动作集中的各节点中的工序的工作状态、以及所述当前时刻的动作集中的各节点对应的第一参考概率,获得所述动作集中的各节点对应的第一选择概率。
18、在其中一个实施例中,所述获得所述当前时刻的第一动作中的工序、所对应的设备集合中的各设备对应的第二选择概率,包括:
19、基于所述当前时刻的第一动作中的节点对应的状态特征、以及用于表征所述当前时刻的第一动作中的节点中的零件的工作时间的第一特征,获得所述当前时刻的设备集合中的各设备对应的设备选择特征;
20、将所述当前时刻的各设备对应的设备选择特征输入策略网络,获得所述当前时刻的各设备对应的第二输出特征,并基于所述当前时刻的各设备对应的第二输出特征、以及归一化指数函数,获得当前时刻的各设备对应的第二选择概率。
21、在其中一个实施例中,所述基于所述当前时刻的各设备对应的第二输出特征和归一化指数函数,获得当前时刻的各设备对应的第二选择概率,包括:
22、基于所述当前时刻的各设备对应的第二输出特征、以及归一化指数函数,获得所述当前时刻的各设备对应的第二参考概率;
23、基于所述当前时刻的各设备的工作状态、以及所述当前时刻的各设备对应的第二参考概率,获得所述当前时刻的各设备对应的第二选择概率。
24、在其中一个实施例中,所述所有时刻包括相邻的第一时刻和第二时刻,所述方法还包括:
25、基于所述第二时刻的第一动作中的零件对应的预设加工完成时间、以及所述第一时刻的第一动作中的零件对应的预设加工完成时间,获得相邻时刻的奖励特征;
26、将所述第一时刻的第一动作中的节点对应的状态特征、以及所述第二时刻的第一动作中的节点对应的状态特征分别输入价值网络,获得所述第一时刻的第一动作中的节点对应的第一状态值特征、以及所述第二时刻的第一动作中的节点对应的第二状态值特征;
27、基于所述第一时刻的第二动作对应的设备对应的设备选择特征,获得所述第一时刻的第二动作对应的第三状态值特征;
28、将所述第一时刻的第一动作中的节点对应的状态特征输入策略网络,获得所述第一时刻的第一动作中的节点对应的第一输出特征,并基于所述第一时刻的第一动作中的节点对应的第一输出特征、归一化指数函数、以及所述第一时刻的第一动作对应的节点中的工序的工作状态,获得所述第一时刻的第一动作中的节点对应的第一选择概率;
29、将所述第一时刻的第二动作对应的设备对应的设备选择特征输入策略网络,获得所述第一时刻的第二动作对应的设备对应的第二输出特征,并基于所述第一时刻的设备对应的第二输出特征、归一化指数函数、以及所述第一时刻的第二动作对应的设备的工作状态,获得所述第一时刻的第二动作对应的设备对应的第二选择概率;
30、基于所述第一时刻的第一动作中的节点对应的第一选择概率、所述奖励特征、所述第一状态值特征、所述第一时刻的第二动作对应的设备对应的第二选择概率、所述第三状态值特征、以及所述第二状态值状态,构建损失函数;
31、更新策略网络和价值网络,在满足损失函数最小化的情况下,获得更新后的策略网络和价值网络。
32、第二方面,本申请提供一种柔性车间的零件加工调度装置,所述装置包括:
33本文档来自技高网...
【技术保护点】
1.一种柔性车间的零件加工调度方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获得所述当前时刻的动作集中的各节点的全局特征,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述当前时刻的动作集中的各节点对应的状态特征,获得所述当前时刻的动作集中的各节点对应的第一选择概率,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述当前时刻的动作集中的各节点对应的第一输出特征、以及归一化指数函数,获得所述当前时刻的动作集中的各节点对应的第一选择概率,包括:
5.根据权利要求1所述的方法,其特征在于,所述获得所述当前时刻的第一动作中的工序、所对应的设备集合中的各设备对应的第二选择概率,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述当前时刻的各设备对应的第二输出特征和归一化指数函数,获得当前时刻的各设备对应的第二选择概率,包括:
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述所有时刻包括相邻的第一时刻和第二时刻,所述方法还包括:
8
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种柔性车间的零件加工调度方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获得所述当前时刻的动作集中的各节点的全局特征,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述当前时刻的动作集中的各节点对应的状态特征,获得所述当前时刻的动作集中的各节点对应的第一选择概率,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述当前时刻的动作集中的各节点对应的第一输出特征、以及归一化指数函数,获得所述当前时刻的动作集中的各节点对应的第一选择概率,包括:
5.根据权利要求1所述的方法,其特征在于,所述获得所述当前时刻的第一动作中的工序、所对应的设备集合中的各设备对应的第二选择概率,包括:...
【专利技术属性】
技术研发人员:黄坤,石竹青,
申请(专利权)人:湖南视比特机器人有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。