基于深度强化学习的云订单动态接受与调度方法技术

技术编号:31904820 阅读:43 留言:0更新日期:2022-01-15 12:42
本发明专利技术公开了一种基于深度强化学习的云订单动态接受与调度方法,按如下步骤:步骤一,接单智能体根据车间的信息反馈,以最大利润为目标制定订单接受策略;步骤二,当云订单接受后,排单智能体将当前时刻剩余工序和云订单以最小拖期时间和最小扰动为整合目标重调度;调度结束后将车间的生产能力反馈给接单智能体。本发明专利技术可对动态到达的云订单实现调度优化,能在正常生产自有订单的同时提高车间资源利用率,提升企业的利润。提升企业的利润。提升企业的利润。

【技术实现步骤摘要】
基于深度强化学习的云订单动态接受与调度方法


[0001]本专利技术涉及一种基于深度强化学习的云订单动态接受与调度方法。

技术介绍

[0002]云制造是利用网络和服务平台,为顾客需求提供各类按需制造服务的一种智能化制造新模式。云制造具有“分散资源集中使用”和“集中资源分散服务”的特点,为企业和顾客提供制造能力,实现资源共享。云平台接收到制造任务后,寻找符合用户需求的生产企业,高效的服务资源分配方法才能保障云制造模式推广与应用。云制造环境下,企业如何分配资源,适应动态到达的订单,提高自身的利润,成为企业参与云制造模式关注的关键核心问题之一。现有的研究大多集中在有关云制造平台的架构、功能、技术实现等方面,关于云制造背景下企业车间的生产调度问题的研究还较为缺乏。
[0003]参与云制造的生产型企业的订单可以分为两类:其自有订单和云订单,其中自有订单可视为是确定的,而云订单具有极高的不确定性。顾客将订单提交至云平台,平台将订单分配给合适的企业,企业对该订单是否接收做出决策,以及安排接收的订单进行生产。在接收云订单后,企业根据其自身的剩余能力安排所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于深度强化学习的云订单动态接受与调度方法,其特征是按如下步骤:步骤一,接单智能体根据车间的信息反馈,以最大利润为目标制定订单接受策略;步骤二,当云订单接受后,排单智能体将当前时刻剩余工序和云订单以最小拖期时间和最小扰动为整合目标重调度;调度结束后将车间的生产能力反馈给接单智能体。2.如权利要求1所述基于深度强化学习的云订单动态接受与调度方法,其特征是,步骤一中,利润的目标函数如下:步骤一中,利润的目标函数如下:其中,p
b
、v、d
b
、F
b
、c
b
分别表示第b(b=1,2,

g)个云订单的价格、单位延期时间的惩罚因子、延期时间、固定生产成本,机器生产成本;p
Q
、d
Q
、F
Q
、c
Q
分别表示第Q(Q=1,2,

h)个自有订单的价格、延期时间、固定生产成本、机器生产成本;车间调度中,所有订单延期累计时间最小目标函数为:车间生产扰动最小的目标函数为新旧调度方案的工序加工时间差异累和:式中,表示第z(z=1,2,

L)个订单的第w(w=1,2,

u)道工序新调度与旧调度方案的开始加工时间差值,表示第z个订单的第w道工序新调度方案与旧调度的结束加工时间差值。3.如权利要求2所述基于深度强化学习的云订单动态接受与调度方法,其特征是,步骤一中,接单智能体的状态空间为各机器的加工结束时间O
i
(1≤i≤m)、各机器的加工累计时间T
i1
(1≤i≤m)、云订单工件数量n
b
、工件类型type(b)、交货期D
b
、价格P
b
;步骤二中,排单智能体的状态空间为各机器的加工结束时间O
i
(1≤i≤m)、各机器的加工累计时间T
i1
(1≤i≤m)、各工件当前最迟加工结束时间各工件剩余工序E
e
(1≤e≤n)、各工件类型在机器上的加工时间表JM。4.如权利要求3所述基于深度强化学习的云订单动态接受与调度方法,其特征是,步骤一中,接单智能体的调度动作为接受订单和拒绝订单,定义为:步骤二中,...

【专利技术属性】
技术研发人员:张梦钗刘项刘春来丁祥海韩杰田徐鸿王璐佳
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1