车间排产方法、装置、存储介质及电子设备制造方法及图纸

技术编号:39315056 阅读:17 留言:0更新日期:2023-11-12 15:58
本发明专利技术涉及计算机技术领域,具体涉及一种车间排产方法、装置、存储介质及电子设备。该方法包括:获取车间内待排产的初始状态信息;根据所述初始状态信息获取所述车间的初始析取图;将所述初始析取图和所述初始状态信息输入预先训练的车间排产模型,以对所述车间进行排产,得到车间排产结果,所述车间排产模型为多层多智能体近端策略优化模型。本发明专利技术能够得到的全局较优的车间排产结果,并且排产速度更快。快。快。

【技术实现步骤摘要】
车间排产方法、装置、存储介质及电子设备


[0001]本专利技术涉及计算机领域,尤其涉及一种车间排产方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着制造业的快速发展,车间排产的规模越来越大,工艺也越来越复杂。因此,对车间排产时,约束条件也越来越多,优化目标也越来越多样。而现有的进阶生产规划及排程系统(Advanced Planning and Scheduling,APS)排产软件无法完全满足车间排产的需求,运算速度慢、优化目标单一、无法同时满足多种约束条件,因此亟需一种能快速给出可行解、满足生产排产需求的方法。
[0003]目前,对于柔性车间排产,通常采用遗传算法。遗传算法(Genetic Algorithm,GA)最早是由美国的 John holland于20世纪70年代提出,该算法是根据大自然中生物体进化规律而设计提出的。是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,能够通过模拟自然进化过程搜索最优解的方法。该算法通过数学的方式,利用计算机仿真运算,将问题的求解过程转换成类似生物进化中的染色体基因的交叉、变异等过程。但是,遗传算法容易过早收敛,因此,采用遗传算法进行排产时,通常得到的排产结果为局部最优解。另外,遗传算法通常运算效率较低,使得排产速度慢。

技术实现思路

[0004]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种车间排产方法,具有能够得到的全局较优的车间排产结果,并且排产速度更快的优点。
[0005]根据本专利技术实施例的第一方面,提供一种车间排产方法,包括:获取车间内待排产的初始状态信息;根据所述初始状态信息获取所述车间的初始析取图;将所述初始析取图和所述初始状态信息输入预先训练的车间排产模型,以对所述车间进行排产,得到车间排产结果,所述车间排产模型为多层多智能体近端策略优化模型。
[0006]本专利技术的一种示例性实施例中,所述多层多智能体近端策略优化模型包括演员网络和与所述演员网络连接的评论家网络,所述将所述初始析取图和初始状态信息输入预先训练的车间排产模型,以对所述车间进行排产,得到车间排产结果包括:将所述初始析取图和所述初始状态信息输入所述演员网络,以获取所述车间内的当前选择动作;循环执行预设步骤,直至所述车间内待排产的下一状态信息为空时,输出所述车间排产结果,所述预设步骤包括:将所述当前选择动作输入所述评论家网络,以确定所述车间内待排产的下一状态信息;
将所述下一状态信息作为所述车间的当前状态信息;根据所述当前状态信息获取所述车间的当前析取图;将所述当前析取图和所述当前状态信息输入所述演员网络,以获取所述车间内的当前选择动作。
[0007]本专利技术的一种示例性实施例中,所述演员网络包括工件工序演员网络和设备演员网络,所述当前选择动作包括工件工序的当前选择动作和设备的当前选择动作,所述将所述初始析取图和所述初始状态信息输入所述演员网络,以获取所述车间内当前选择动作包括:将所述初始析取图和所述初始状态信息输入所述工件工序演员网络,以获取所述车间内所述工件工序的当前选择动作;将所述初始析取图和所述初始状态信息输入所述设备演员网络,以获取所述车间内所述设备的当前选择动作。
[0008]本专利技术的一种示例性实施例中,所述演员网络包括编码器和与所述编码器连接的解码器,所述解码器与所述评论家网络连接,所将所述当前析取图和所述当前状态信息输入所述演员网络,以获所述当前选择动作包括:将所述当前析取图和所述当前状态信息输入所述编码器,以获取所述当前选择动作的概率分布;将所述概率分布输入所述解码器,以获取所述当前选择动作。
[0009]本专利技术的一种示例性实施例中,所述将所述初始析取图和所述初始状态信息输入预先训练的车间排产模型前,所述方法还包括:获取训练集,所述训练集包括多个已排产车间在排产前的初始状态信息以及所述已排产车间在排产过程中每个时间步的状态信息;采用所述训练集对所述车间排产模型进行训练。
[0010]本专利技术的一种示例性实施例中,所述多层多智能体近端策略优化模型包括演员网络和与所述演员网络连接的评论家网络,所述采用所述训练集对所述车间排产模型进行训练包括:根据所述演员网络的第一参数和所述训练集确定所述演员网络的总损失函数;根据所述评论家网络的第二参数和所述训练集确定所述评论家网络的评价损失函数;采用策略梯度算法分别确定所述总损失函数的最小值和所述评价损失函数的最小值;根据所述总损失函数的最小值和所述评价损失函数的最小值分别更新所述第一参数和所述第二参数。
[0011]本专利技术的一种示例性实施例中,所述初始状态信息包括车间内待排产的初始工件工序的初始工件工序信息和所述车间内待排产初始工件设备的初始设备信息,所述获取车间内待排产的初始状态信息包括:获取所述车间内所有的工件工序的工件工序信息以及所述车间内所有设备的设备信息;获取所述车间内正在排产的目标工件工序的工件工序信息以及目标设备的设备
信息;根据所述目标工件工序的工件工序信息以及所述目标设备的设备信息和所述车间内所有的工件工序的工件工序信息以及所述车间内所有设备的设备信息确定所述初始工件工序信息和所述初始设备信息。
[0012]根据本专利技术的第二方面,提供一种车间排产装置,包括:状态信息获取模块,用于获取车间内待排产的初始状态信息;初始析取图获取模块,用于根据所述初始状态信息获取所述车间的初始析取图;车间排产模块,用于将所述初始析取图和所述初始状态信息输入预先训练的车间排产模型,以对所述车间进行排产,得到车间排产结果,所述车间排产模型为多层多智能体近端策略优化模型。
[0013]根据本专利技术的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面中任一项所述的车间排产方法。
[0014]根据本专利技术的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面中任一项所述的车间排产方法。
[0015]本专利技术提供的方法,通过获取所述车间的初始析取图,并将所述初始析取图和所述初始状态信息输入预先训练的结构多层多智能体近端策略优化模型的车间排产模型,对所述车间进行排产,能够采用多层多智能体近端策略优化模型配合析取图实现柔性车间排产,能够实现车间排产的全局较优,并且大大提升了车间排产运算速度以及使用场景。
[0016]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0017]图1是根据一示例性实施例提供的一种车间排产方法的流程图;图2是根据一示例性实施例提供的一种车间排产系统的架构图;图3是根据一示例性实施例提供的一种析取图的示意图;图4是根据一示例性实施例提供的一种车间排产模型的结构图;图5是根据一示例性实施例提供的一种车间排产装置的方框图;图6是根据一示例性实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车间排产方法,其特征在于,包括:获取车间内待排产的初始状态信息;根据所述初始状态信息获取所述车间的初始析取图;将所述初始析取图和所述初始状态信息输入预先训练的车间排产模型,以对所述车间进行排产,得到车间排产结果,所述车间排产模型为多层多智能体近端策略优化模型。2.根据权利要求1所述的方法,其特征在于,所述多层多智能体近端策略优化模型包括演员网络和与所述演员网络连接的评论家网络,所述将所述初始析取图和初始状态信息输入预先训练的车间排产模型,以对所述车间进行排产,得到车间排产结果包括:将所述初始析取图和所述初始状态信息输入所述演员网络,以获取所述车间内的当前选择动作;循环执行预设步骤,直至所述车间内待排产的下一状态信息为空时,输出所述车间排产结果,所述预设步骤包括:将所述当前选择动作输入所述评论家网络,以确定所述车间内待排产的下一状态信息;将所述下一状态信息作为所述车间的当前状态信息;根据所述当前状态信息获取所述车间的当前析取图;将所述当前析取图和所述当前状态信息输入所述演员网络,以获取所述车间内的当前选择动作。3.根据权利要求2所述的方法,其特征在于,所述演员网络包括工件工序演员网络和设备演员网络,所述当前选择动作包括工件工序的当前选择动作和设备的当前选择动作,所述将所述初始析取图和所述初始状态信息输入所述演员网络,以获取所述车间内当前选择动作包括:将所述初始析取图和所述初始状态信息输入所述工件工序演员网络,以获取所述车间内所述工件工序的当前选择动作;将所述初始析取图和所述初始状态信息输入所述设备演员网络,以获取所述车间内所述设备的当前选择动作。4.根据权利要求2所述的方法,其特征在于,所述演员网络包括编码器和与所述编码器连接的解码器,所述解码器与所述评论家网络连接,所述将所述当前析取图和所述当前状态信息输入所述演员网络,以获取所述车间内的当前选择动作包括:将所述当前析取图和所述当前状态信息输入所述编码器,以获取所述当前选择动作的概率分布;将所述概率分布输入所述解码器,以获取所述当前选择动作。5.根据权利要求1所述的方法,其特征在于,所述将所述初始析取图和所述初始状态信息输入预先训练的车间排产模型前,所述方法还...

【专利技术属性】
技术研发人员:梁礼欣王昊陈广裕
申请(专利权)人:美云智数科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1