动态调度方法、系统、电子设备及计算机存储介质技术方案

技术编号:34950892 阅读:12 留言:0更新日期:2022-09-17 12:27
本发明专利技术涉及一种动态调度方法、系统、电子设备及计算机存储介质,其方法包括:获取智能车间的当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值;将所述当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值输入到预先建立的调度模型中,输出调度规则;执行所述调度规则,并更新执行所述调度规则之后的下一步调度析取图、AGV下一步位置信息及预设状态特征下一步状态特征值;将更新后的下一步调度析取图、AGV下一步位置信息及预设状态特征下一步状态特征值重新输入至所述预先建立的调度模型中,迭代输出并执行新的调度规则,直至所述待处理工件处理完成。本发明专利技术提高了调度效率。本发明专利技术提高了调度效率。本发明专利技术提高了调度效率。

【技术实现步骤摘要】
动态调度方法、系统、电子设备及计算机存储介质


[0001]本专利技术涉及调度管理
,尤其涉及一种AGV调度系统及方法。

技术介绍

[0002]随着科学技术的发展,人工智能逐渐应用到各行各业。许多制造业企业的生产车间也开始引进自动化的设备,进行智能化的生产。其中AGV(Automated Guided Vehicle,自动导引运输车)作为工业机器人的一种,它具有可编程、自动导航、网络交互等功能,能够自动进行各种物料的搬运和路径导航,可以说只要有搬运需要的场所,就有应用AGV的需求。
[0003]在智能车间中的柔性生产线需要AGV进行原料输送和成品的搬运,所以需要对AGV进行调度,而如何对AGV小车进行动态调度是亟待解决的问题。

技术实现思路

[0004]有鉴于此,有必要提供一种动态调度方法、系统、电子设备及计算机存储介质,用以提高AGV小车的动态调度的效率,增加订单的准点完工率,减少订单的延迟时间。
[0005]为了实现上述目的,第一方面,本专利技术提供了一种动态调度方法,包括:
[0006]获取智能车间的当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值;
[0007]将所述当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值输入到预先建立的调度模型中,输出调度规则,其中,所述调度规则包括待处理工件在机器的处理顺序及运输所述待处理工件的AGV的调度顺序;
[0008]执行所述调度规则,并更新执行所述调度规则之后的下一步调度析取图、AGV下一步位置信息及预设状态特征下一步状态特征值;
[0009]将更新后的下一步调度析取图、AGV下一步位置信息及预设状态特征下一步状态特征值重新输入至所述预先建立的调度模型中,迭代输出并执行新的调度规则,直至所述待处理工件处理完成。
[0010]可选的,调度析取图包括机器及工件的状态信息;
[0011]所述预设状态特征包括机器平均利用率、机器利用率的标准差、调度动作的平均完成率、工件平均完成率、工件完成率的标准差、估计迟到率和实际迟到率。
[0012]可选的,所述预先建立的调度模型是基于改进型DQN网络进行建立的,其中,所述改进型DQN网络的结构包括图神经网络、在线网络、目标网络、经验回放池和损失函数。
[0013]可选的,所述预先建立的调度模型的训练过程,包括:
[0014]获取历史调度析取图、AGV历史位置信息及预设状态特征的历史状态特征值,并将所述历史调度析取图输入到图神经网络中得到机器与工件的历史状态信息;
[0015]将所述历史状态信息、AGV历史位置信息及预设状态特征的历史状态特征值作为历史状态输入到在线网络中进行迭代训练得到历史经验数据,并将所述历史经验数据存储到经验回放池,其中,所述历史经验数据包括历史状态、历史调度动作及下一步历史状态;
[0016]选取所述历史经验数据中的历史状态输入到在线网络中,输出历史估计Q值;
[0017]选取所述历史经验数据中的下一步历史状态输入到目标网络中,输出历史目标Q值;
[0018]利用BP算法计算所述历史估计Q值与所述历史目标Q值的损失函数,并更新所述在线网络的参数;
[0019]重复上述步骤,并根据所述在线网络的参数调整所述目标网络的参数,直至损失函数的损失结果在预设范围内。
[0020]可选的,所述将所述当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值输入到预先建立的调度模型中,输出调度规则,包括:
[0021]将所述当前调度析取图输入到图神经网络中得到机器与工件的当前状态信息,并将当前状态信息、AGV当前位置信息及预设状态特征的当前状态特征值作为当前状态输入到在线网络中进行计算,输出当前状态下每一候选调度规则的估计Q值;
[0022]根据所述每一候选调度规则的估计Q值确定所述调度规则。
[0023]可选的,所述将所述当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值输入到预先建立的调度模型中,还包括:
[0024]确定在当前状态执行所述调度规则后进入的下一步状态,其中,所述下一步状态包括机器与工件的下一步状态信息、AGV下一步位置信息及预设状态特征的下一步状态特征值,并将当前状态、所述调度规则与下一步状态输入经验回放池;
[0025]将下一步状态输入到目标网络中,输出每一候选调度规则的目标Q值;
[0026]计算所述估计Q值与所述目标Q值在所述损失函数中的损失结果;
[0027]基于所述损失结果更新所述在线网络的参数,并间隔预设循环步数更新目标网络的参数。
[0028]可选的,所述执行所述调度规则,包括:
[0029]确定所述调度规则中包括的调度目标,并基于所述调度目标按照待处理工件在机器的处理顺序及运输所述待处理工件的AGV的调度顺序执行相应的调度动作;
[0030]所述更新执行所述调度规则之后的下一步调度析取图、AGV下一步位置信息及预设状态特征下一步状态特征值,包括:
[0031]确定执行所述调度规则后的AGV下一步位置信息,根据所述AGV下一步位置信息计算工件送达机器的第一时间和机器完成加工的第二时间,基于所述第一时间和所述第二时间更新下一步调度析取图及预设状态特征下一步状态特征值。
[0032]第二方面,本专利技术还提供一种动态调度系统,包括:
[0033]获取模块,用于获取智能车间的当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值;
[0034]输出模块,用于将所述当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值输入到预先建立的调度模型中,输出调度规则,其中,所述调度规则包括待处理工件在机器的处理顺序及运输所述待处理工件的AGV的调度顺序;
[0035]执行模块,用于执行所述调度规则,并更新执行所述调度规则之后的下一步调度析取图、AGV下一步位置信息及预设状态特征下一步状态特征值;
[0036]迭代模块,用于将更新后的下一步调度析取图、AGV下一步位置信息及预设状态特
征下一步状态特征值重新输入至所述预先建立的调度模型中,迭代输出并执行新的调度规则,直至所述待处理工件处理完成。
[0037]第三方面,本专利技术还提供一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述动态调度方法中的步骤。
[0038]第四方面,本专利技术还提供一种计算机存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述动态调度方法中的步骤。
[0039]采用上述实施例的有益效果是:本专利技术通过利用智能车间的当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值,详细反映了生产车间当前的生产环境,并且根据预先建立的调度模型,输出调度规则,由于调度模型和调度规则中涵盖了工件的工序约束和机器约束,使得将调度问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种动态调度方法,其特征在于,包括:获取智能车间的当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值;将所述当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值输入到预先建立的调度模型中,输出调度规则,其中,所述调度规则包括待处理工件在机器的处理顺序及运输所述待处理工件的AGV的调度顺序;执行所述调度规则,并更新执行所述调度规则之后的下一步调度析取图、AGV下一步位置信息及预设状态特征下一步状态特征值;将更新后的下一步调度析取图、AGV下一步位置信息及预设状态特征下一步状态特征值重新输入至所述预先建立的调度模型中,迭代输出并执行新的调度规则,直至所述待处理工件处理完成。2.根据权利要求1所述的方法,其特征在于,调度析取图包括机器及工件的状态信息;所述预设状态特征包括机器平均利用率、机器利用率的标准差、调度动作的平均完成率、工件平均完成率、工件完成率的标准差、估计迟到率和实际迟到率。3.根据权利要求2所述的方法,其特征在于,所述预先建立的调度模型是基于改进型DQN网络进行建立的,其中,所述改进型DQN网络的结构包括图神经网络、在线网络、目标网络、经验回放池和损失函数。4.根据权利要求3所述的方法,其特征在于,所述预先建立的调度模型的训练过程,包括:获取历史调度析取图、AGV历史位置信息及预设状态特征的历史状态特征值,并将所述历史调度析取图输入到图神经网络中得到机器与工件的历史状态信息;将所述历史状态信息、AGV历史位置信息及预设状态特征的历史状态特征值作为历史状态输入到在线网络中进行迭代训练得到历史经验数据,并将所述历史经验数据存储到经验回放池,其中,所述历史经验数据包括历史状态、历史调度动作及下一步历史状态;选取所述历史经验数据中的历史状态输入到在线网络中,输出历史估计Q值;选取所述历史经验数据中的下一步历史状态输入到目标网络中,输出历史目标Q值;利用BP算法计算所述历史估计Q值与所述历史目标Q值的损失函数,并更新所述在线网络的参数;重复上述步骤,并根据所述在线网络的参数调整所述目标网络的参数,直至损失函数的损失结果在预设范围内。5.根据权利要求4所述的方法,其特征在于,所述将所述当前调度析取图、AGV当前位置信息及预设状态特征的当前状态特征值输入到预先建立的调度模型中,输出调度规则,包括:将所述当前调度析取图输入到图神经网络中得到机器与工件的当前状态信息,并将当前状态信息、AGV当前位置信息及预设状态特征的当前状态特征值作为当前状态输入到在线网络中进行计算,输出当前状态下每一候选调度规则的估计Q值;根据所述每一候...

【专利技术属性】
技术研发人员:吕雅琼张嘉桐白玥
申请(专利权)人:武汉理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1