【技术实现步骤摘要】
车辆路径确定方法、装置、设备及存储介质
[0001]本专利技术涉及物流
,尤其涉及一种车辆路径确定方法、装置、设备及存储介质。
技术介绍
[0002]车辆路径问题一直是物流调度领域中的研究热点,车辆路径规划得当可以实现有效分配物流资源,减少物流运输成本。车辆路径问题(Vehicle Routing Problem,简称:VRP)最早于20世纪60年代提出,其基本问题是有容量限制的车辆路径问题(Capacitated Vehicle Routing Problem,简称:CVRP)。该问题是指,在满足车载量约束条件下,使得服务所有客户点的车辆行驶距离最小化,达到降低物流配送成本为目的。
[0003]目前在解决车辆路径问题时可以采用蚁群算法、模拟退火算法、粒子群算法等。这些算法在训练过程中均需要利用仓库和客户的地点。
[0004]但是,在训练过程利用仓库和客户的地点,这使得针对仓库节点或者客户节点增加的情况下,均需要重新迭代搜索,训练出的模型的复制性较差,从而导致确定车辆路径的效率较低。
技术实现思路
[0005]本专利技术提供了一种车辆路径确定方法、装置、设备及存储介质,以解决相关技术中由于模型的复制性差而导致车辆路径的确定效率较低的技术问题。
[0006]根据本专利技术的一方面,提供了一种车辆路径确定方法,包括:
[0007]确定各个客户的信息、各个车辆的容量以及仓库的位置信息;其中,各个客户的信息包括:各个客户的位置信息以及各个客户的服务时间窗口;
[0 ...
【技术保护点】
【技术特征摘要】
1.一种车辆路径确定方法,其特征在于,包括:确定各个客户的信息、各个车辆的容量以及仓库的位置信息;其中,各个客户的信息包括:各个客户的位置信息以及各个客户的服务时间窗口;将所述各个客户的位置信息、所述各个客户的服务时间窗口、所述各个车辆的容量以及所述仓库的位置信息,输入预先训练好的车辆路径确定模型中,得到所述车辆路径确定模型输出的每个车辆的路径信息;其中,所述每个车辆的路径信息包括:每个所述车辆对应的各目标客户,以及,在不超过所述车辆的容量并且不超出各所述目标客户的服务时间窗口的前提下,对各所述目标客户的运输顺序,所述车辆路径确定模型为采用强化学习算法,以降低训练车辆的训练路径的总距离为指标,并且,在训练过程中以每个训练车辆的训练路径的相关统计量为状态信息,训练得到的模型,在训练过程中,所述强化学习算法根据启发式算子对所述状态信息进行调整。2.根据权利要求1所述的方法,其特征在于,所述车辆路径确定模型还为以降低每个训练车辆的总等待时间为指标训练得到的模型。3.根据权利要求1所述的方法,其特征在于,所述客户的信息还包括:所述客户的需求量以及所述客户的服务时长。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:确定训练数据;其中,所述训练数据包括:各个训练客户的信息、各个训练车辆的容量以及训练仓库的位置信息,各个所述训练客户的信息包括:各个所述训练客户的位置信息、各个训练客户的服务时间窗口、各个训练客户的需求量以及各个训练客户的服务时长;根据所述训练数据,获取初始状态信息;其中,所述初始状态信息包括:每个训练车辆的初始路径的相关统计量;将所述初始状态信息输入初始车辆路径确定模型中,得到所述初始车辆路径确定模型中输出的新状态信息以及初始启发式算子;其中,所述新状态信息包括:每个训练车辆的更新路径的相关统计量,所述初始启发式算子用于对所述初始状态信息进行调整得到所述新状态信息;根据所述新状态信息与基准状态信息,确定奖励值;其中,所述奖励值与所述新状态信息对应的所有训练车辆的更新路径的总距离相对于基准状态信息对应的所有训练车辆的基准路径的总距离的减小程度成正比,所述基准状态信息为训练过程中对应的总距离第一次降低的状态信息或者初始状态信息;根据所述奖励值,确定更新后的初始车辆路径确定模型;若未满足预设的训练结束条件,则将所述新状态信息确定为更新后的初始状态信息,返回执行“将所述初始状态信息输入所述初始车辆路径确定模型中,得到所述初始车辆路径确定模型中输出的新状态信息以及初始启发式算子”的步骤;若满足所述预设的训练结束条件,则将更新后的初始车辆路径确定模型确定为所述车辆路径确定模型。5.根据权利要求4所述的方法,其特征在于,所述奖励值还与所述新状态信息对应的所有训练车辆的总等待时间相对于基准状态信息对应的所有训练车辆的总等待时间的减小程度成正比,以及,与所述新状态信息对应的所有训练车辆的更新路径的距离形成的距离序列的标准差,相对于基准状态信息对应的所有训练车辆的基准路径的距离形成的距离序
列的标准差的减小程度成正比。6.根据权利要求5所述的方法,其特征在于,所述根据所述新状态信息与基准状态信息,确定奖励值,包括:将所述新状态信息对应的所有训练车辆的更新路径的总距离、所述新状态信息对应的所有训练车辆的更新路径的距离形成的距离序列的标准差以及所述新状态信息对应的所有训练车辆的总等待时间进行预设处理后作为所述新状态信息对应的目标函数;将所述基准状态信息对应的所有训练车辆的基准路径的总距离、所述基准状态信息对应的所有训练车辆的基准路径的距离形成的距离序列的标准差以及所述基准状态信息对应的所有训练车辆的总等待时间进行预设处理后作为所述基准状态信息对应的目标函数;若所述新状态信息对应的...
【专利技术属性】
技术研发人员:谢海琴,吴佳霖,何梁,
申请(专利权)人:卡奥斯工业智能研究院青岛有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。