【技术实现步骤摘要】
一种基于深度强化学习的作业车间自适应调度方法
[0001]本专利技术属于作业车间自适应调度
,涉及一种基于深度强化学习的作业车间自适应调度方法。
技术介绍
[0002]随着信息技术在制造业中的发展,智能制造和可重构制造应运而生。作业车间调度问题由于能够最优地分配有限的资源,提高生产效率而备受关注。JSSP本质上是一个组合优化问题,传统上区分精确算法(数学方法)和近视算法方法。解决JSSP的精确算法主要基于运筹学产生,如数学规划法,拉格朗松弛法以及分支界限法等。这些方法从理论上可以得出最优解。然而因为该方法需要精准的建模和大量的计算,所有多数还停留在理论层面而不能应用于实际生产。
[0003]为了解决这一问题,许多学者将目光转移到了近似算法,如优先规则或元启发式算法。这些优先规则,如先进先出(First In First,FIFO)、最长处理时间(Longest Processing Time,LPT)、大部分剩余操作(Most Operation Remaining,MOPR)、大部分剩余处理时间(Most W ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的作业车间自适应调度方法,其特征在于:该方法包括以下步骤:(1)构建作业车间调度问题的调度函数模型:设有以n个作业和m台机器,每个作业包括m个不同的工序,在作业车间调度中,n个作业J={J1,J2......,J
n
}必须在m台机器m={M1,M2……
,M
m
}上按照预先知道的不同顺序进行处理,设O
k,b
表示为工件b第k个工序,每个工序O
k,b
都必须在特定的时间段内在特定的机器上执行,工件b在机器M
k
上的处理时间用t
b,k
标记,t
b,k
是预先确定的,工件b在M
k
机器上的实际完成时间用C
b,k
表示,它等于A
b,k
+t
b,k
,,其中A
b,k
表示工件b在M
k
机器上的开始处理时间,一个工件在它最后一个工序完成之后就全部完成,所有的调度目标都取决于所有工件的完成时间;最小化最大完工时间的目标函数对应调度的长度;作业车间调度问题的调度函数模型定义为:C
max
=min max{C
b,k
}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,b=1,2
……
n;k=1,2
……
,m;C
bk
‑
t
bk
+M(1
‑
y
bhk
)≥C
bh
ꢀꢀꢀꢀꢀꢀꢀ
(2)其中,M是一个极大值,b=1,2
……
n;h,k=1,2
……
,m;C
bk
表示工件b在M
k
机器上的实际完成时间;t
b,k
表示工件b在机器M
k
上的处理时间;C
bh
表示工件b在M
h
机器上的实际完成时间;y
bhk
表示条件函数如(4),若工件b在机器h上加工先于机器k,y
bhk
等于1,否则等于0.C
ak
‑
C
bk
+M(1
‑
x
bak
)≥t
ak
ꢀꢀꢀꢀꢀ
(3)其中,M是一个极大值,a,b=1,2
……
n;k=1,2
……
,m;C
ak
表示工件a在M
k
机器上的实际完成时间,C
bk
表示工件b在M
k
机器上的实际完成时间;t
a,k
表示工件a在机器M
k
上的处理时间;x...
【专利技术属性】
技术研发人员:干雪梅,李少波,张钧星,张安思,左颖,
申请(专利权)人:贵州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。