行车调度方法、介质和电子设备技术

技术编号:31588615 阅读:20 留言:0更新日期:2021-12-25 11:34
本申请涉及物流技术领域,公开了一种行车调度方法、介质和电子设备。该方法基于一个行车调度模型实现,电子设备利用行车调度模型对待出库的多个委托单进行多次模拟调度,生成多个模拟调度方案,并以多个模拟调度方案中各委托单的回报值最高的方案作为出库方案。期间,电子设备每完成一次模拟调度,即根据该次模拟调度中各委托单的回报值和评价值更新行车调度模型的参数,并以更新后的参数进行下一次模拟调度。通过本申请提供的行车调度方法,可以减小行车在运送货物出库过程中的等待时间,提高行车运送货物出库的效率,降低钢铁成品仓储作业成本、提升仓储整体作业效率。提升仓储整体作业效率。提升仓储整体作业效率。

【技术实现步骤摘要】
行车调度方法、介质和电子设备


[0001]本申请涉及物流
,特别涉及一种行车调度方法、介质和电子设备。

技术介绍

[0002]随着物流行业的飞速发展,人们对物流的时效的要求越来越高。为了提高仓库中货物入库/出库的速度,目前的仓库中采用智能机器人对仓库中的物品进行分拣、存放和运出。但是,对于存放重型货物的仓库,例如存放钢卷的仓库,由于开发能够运输钢卷等重型货物的智能机器人的成本较高,目前依然采用多个行车将仓库中的货物运送到装货区进行出库或从仓库入口运送到仓储区进行存放。但是,在通过行车进行货物入库/出库的过程中,由于行车车体只能沿同一个方向移动,行车在运送货物过程中常需要等待其他行车完成货物运送才进行下一个货物的运送,使得行车运送货物出库的过程中部分行车闲置,降低货物出库的效率。因此,如何更好地确定仓库中各货物的出库顺序以及运送货物的行车,以提高行车出库的效率,是亟需解决的问题。

技术实现思路

[0003]有鉴于此,本申请实施例提供行车调度方法、介质和电子设备。基于一种行车调度模型对待出库的委托单进行多次模拟调度生成多个模拟调度方案,并以该多个模拟调度方案中最优的一个作为调度行车出库的方案,从而可以减小行车在运送货物出库过程中的等待时间,提高行车运送货物出库的效率。
[0004]第一方面,本申请实施例提供了一种行车调度方法,应用于电子设备,方法包括:利用第一调度模型对待出库的多个委托单进行模拟调度,生成第一调度方案以及各委托单的第一回报值;对第一调度方案进行评价,生成各委托单的评价结果,并基于各委托单的第一回报值和评价结果确定第二调度模型;利用第二调度模型对待出库的多个委托单进行模拟调度,生成第二调度方案和各委托单的第二回报值,其中各第二回报值之和大于各第一回报值之和;根据第二调度方案调度行车对待出库的委托单进行出库。
[0005]即是电子设备可以利用第一调度模型,例如下文中的行车调度模型200,对待出库的多个委托单进行多次模拟调度,生成多个模拟调度方案,并根据多个模拟调度方案中各委托单的累计回报值最大的一个模拟调度方案调度行车对待出库的委托单进行出库。电子设备在通过行车调度模型200对待出库的多个委托单进行模拟调度的过程中,每完成一次模拟调度,即根据本次调度中各委托单的回报值和评价结果调整行车调度模型200的网络参数,并在下一次模拟调度中使用新的网络参数进行模拟调度,从而可以获取各委托单的回报值之和更好的调度方案。
[0006]通过本申请实施例提供的行车调度方法,可以减小行车在运送货物出库过程中的等待时间,提高行车运送货物出库的效率,降低钢铁成品仓储作业成本、提升仓储整体作业效率。
[0007]结合上述第一方面的第一种可能实现中,上述基于各委托单的第一回报值和评价
结果确定第二调度模型,包括:根据各委托单的第一回报值和评价结果,将第一调度模型的参数调整至第二调度模型的参数。
[0008]也即是说在本申请实施例中,第二调度模型是通过更新第一调度模型参数得到,例如在第一调度模型为行车调度模型200的情况下,基于下文步骤S506中方法更新行车调度模型200的参数即可得到第二调度模型。
[0009]结合上述第一方面的第一种可能实现的第二种可能实现中,上述第一调度模型包括任务调度网络和调度评价网络。
[0010]也即是第一调度模型包括两个网络,用于实现不同的功能,例如下文中的行车调度模型200包括任务调度网络201和调度评价网络202,任务调度网络201用于对待出库的委托单进行模拟调度并生成各委托单的回报值,调度评价网络202用于对任务调网络201的调度进行评价,生成各委托单的评价结果,以便于行车调度模拟200可以根据各委托单的回报值和评价结果调整任务调度网络201和调度评价网络202的参数,以在下一次模拟调度过程中获取各委托单的回报值之和更大的调度方案。
[0011]结合上述第一方面的第二种可能实现的第三种可能实现中,上述第一调度方案由任务调度网络生成。
[0012]结合上述第一方面的第三种可能实现的第四种可能实现中,上述任务调度网络通过循环执行以下操作生成第一调度方案:确定未确定出库顺序的各委托单的策略梯度,并以策略梯度最大的一个作为下一个出库的委托单。
[0013]例如,参考下文步骤S502中的方法,任务调度网络可以计算还未确定出库顺序的各委托单的策略梯度,以策略梯度最大的一个作为下一个出库的委托单,并将该委托单标记为已确定出库顺序(如下文中的更新调度参数)。
[0014]结合上述第一方面的第二种可能实现的第五种可能实现中,上述各第一回报值由调度评价网络生成,其中调度评价网络包括对待出库的多个委托单进行出库时各行车的等待时间进行预测的规则。
[0015]也即是说,调度评价网络(例如下文中的调度评价网络202)可以为预先训练好的的网络,用于可以下文所述的出库任务参数为输入,输出该出库任务参数对应的行车等待时间的预测值(以下简称预测值),并以通过确定一个委托单后的出库任务参数对应的预测值减去确定该委托单前的出库任务参数对应的预测值差值作为该委托单的评价结果。
[0016]在对调度评价网络202预先训练过程中,可以以预设的调度方案为输入,并且以该预设的调度方案中各行车的理想等待时间为训练目标,例如0,从而拟合出对出库任务参数对应的预测值进行计算的规则。
[0017]结合上述第一方面及上述第一方面的任一种可能实现的第六种可能实现中,上述第二调度方案包括各委托单的出库顺序、执行各委托单的行车标识、各委托单对应的货物的起点位置和目标位置。
[0018]结合上述第一方面的第六种可能实现的第七种可能实现中,上述根据第二调度方案调度行车对待出库的委托单进行出库,包括:根据各委托单的出库顺序和执行各委托单的行车标识向执行各委托单的行车发送出库指令。
[0019]结合上述第一方面的第七种可能实现的第八种可能实现中,在待出库的委托单有变化的情况下,利用第一调度模型对待出库的委托单进行模拟调度,生成第一调度方案以
及各委托单的第一回报值。
[0020]也即是说,在本申请实施例中,电子设备在检测到待出库的委托单有变化的情况下,例如取消部分委托单、新增部分委托单的情况下,可以重新对待出库的委托单进行模拟调度,从而可以根据待出库的委托单的状态,实时调整行车调度方案,进一步提高行车运送货物出库的效率。
[0021]第二方面,本申请实施例提供了一种可读介质,该可读介质上存储有指令,指令在电子设备上执行时使电子设备实现上述第一方面及其可能实现提供的任一种行车调度方法。
[0022]第三方面,本申请实施例提供了一种电子设备,该电子设备包括:存储器,用于存储由电子设备的一个或多个处理器执行的指令;以及处理器,是电子设备的处理器之一,用于执行存储器中存储的指令以实现上述第一方面及其可能实现提供的任一种行车调度方法。
附图说明
[0023]图1根据本申请的一些实施例,示出了一种通过行车运送货物出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行车调度方法,应用于电子设备,其特征在于,所述方法包括:利用第一调度模型对待出库的多个委托单进行模拟调度,生成第一调度方案以及各所述委托单的第一回报值;对所述第一调度方案进行评价,生成各所述委托单的评价结果,并基于各所述委托单的所述第一回报值和所述评价结果确定第二调度模型;利用第二调度模型对所述待出库的多个委托单进行模拟调度,生成第二调度方案和各所述委托单的第二回报值,其中各所述第二回报值之和大于各所述第一回报值之和;根据所述第二调度方案调度行车对所述待出库的委托单进行出库。2.根据权利要求1所述的方法,其特征在于,所述基于各所述委托单的所述第一回报值和所述评价结果确定第二调度模型,包括:根据各所述委托单的所述第一回报值和所述评价结果,将所述第一调度模型的参数调整至所述第二调度模型的参数。3.根据权利要求2所述的方法,其特征在于,所述第一调度模型包括任务调度网络和调度评价网络。4.根据权利要求3所述的方法,其特征在于,所述第一调度方案由所述任务调度网络生成。5.根据权利要求4所述的方法,所述任务调度网络通过循环执行以下操作生成所述第一调度方案:确定未确定出库顺序的各所述委托单的策略梯度,并以策略梯度最大的一个作为下一个出库的委托单。6....

【专利技术属性】
技术研发人员:彭剑蔡序庆陈媛媛李勤英
申请(专利权)人:上海欧冶物流股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1