车辆路径规划方法、装置、可读存储介质及电子设备制造方法及图纸

技术编号:31316549 阅读:11 留言:0更新日期:2021-12-12 23:54
本申请公开了车辆路径规划方法、装置,方法包括:创建路径规划模型;将各个客户的用户信息和各个车辆的初始信息输入路径规划模型中;根据模型中的预设参数和输入的各个客户的用户信息进行计算得到各个客户的用户结果数据;在预设的时间步时刻内,为各个车辆设置基于门控循环单元的路径记录器,根据模型中的预设参数和各个车辆的路径记录器得到各个车辆的当前状态值;根据各个车辆的当前状态值和各个客户的用户结果数据计算各个车辆选择各个客户的概率;根据概率为各个车辆选择符合条件的客户;所述路径规划模型通过第一预设方法将路径选择结果输出。通过本发明专利技术的技术方案,进行少量的计算能够快速给出响应的解,得到高效的路径选择策略。的路径选择策略。的路径选择策略。

【技术实现步骤摘要】
车辆路径规划方法、装置、可读存储介质及电子设备


[0001]本专利技术涉及车辆派送控制
,尤其涉及一种车辆路径规划方法、装置、可读存储介质及电子设备。

技术介绍

[0002]现有技术中,车辆派送服务的应用越来越普遍,通常,在车辆派送服务过程中,包括若干个顾客和若干辆车,每个顾客都有一个软时间窗约束,需要车辆尽量在规定时间窗内服务顾客,在时间窗外服务顾客将受到一定的惩罚,具体地,惩罚的大小和顾客被服务的时间与顾客时间窗的距离呈线性关系,每辆车具有额定的载重,每辆车服务的顾客货物需求量之和不能超过车辆的最大载重,如何使所有顾客被服务后的所有车辆路径长度与违背时间窗的惩罚之和最小?
[0003]为了解决这个问题,目前常用的方法是启发式算法,其中一类方法是智能优化算法,此类方法求解问题往往需要大量的时间来迭代地搜索解空间,时间开销大且容易陷入局部最优解。另一类方法是局部搜索法,从一个初始解出发,每一步从当前解的邻域中搜索并选择最优解。解的质量非常依赖于初始解的质量。还有一类构造算法通过特定的规则生成问题对应的解。上述几类方法往往需要大量的计算开销或难以获得高质量的解。因此,如何获得一个高效的分配策略进而生成高质量的解则成为亟待解决的问题。

技术实现思路

[0004]本专利技术提供一种车辆路径规划方法、装置、可读存储介质及电子设备,可通过路径规划模型进行少量的计算快速给出响应的解,得到高效的路径选择策略。
[0005]第一方面,本专利技术提供了一种车辆路径规划方法,包括:
[0006]创建路径规划模型;
[0007]将各个客户的用户信息和各个车辆的初始信息输入路径规划模型中;
[0008]根据模型中的预设参数和输入的各个客户的用户信息进行计算得到各个客户的用户结果数据;
[0009]在预设的时间步时刻内,为各个车辆设置基于门控循环单元的路径记录器,根据模型中的预设参数和各个车辆的路径记录器得到各个车辆的当前状态值;
[0010]根据各个车辆的当前状态值和各个客户的用户结果数据计算各个车辆选择各个客户的概率;
[0011]根据概率为各个车辆选择符合条件的客户;
[0012]通过第一预设方法将所述路径规划模型中的路径选择结果输出。
[0013]可选地,所述根据模型中的预设参数和输入的各个客户的用户信息进行计算得到各个客户的用户结果数据,具体包括:
[0014]通过矩阵计算方法根据所述预设参数对所述各个客户的用户信息进行初始编码;
[0015]利用注意力机制对所述初始编码得到的数据进行处理得到各个客户的结果数据。
[0016]可选地,所述为各个车辆设置基于门控循环单元的路径记录器,具体包括:
[0017]设置各个车辆的起点位置信息;
[0018]为各个车辆分配一个局部路径记录器,并设置一个全局路径记录器。
[0019]优选的,所述根据模型中的预设参数和各个车辆的路径记录器得到各个车辆的当前状态值,具体包括:
[0020]获取每一辆车上的局部路径记录器的值和全局路径记录器的值;
[0021]根据每一辆车上的局部路径记录器的值和全局路径记录器的值依次得到每一辆车的当前状态值。
[0022]进一步优选地,根据各个车辆的当前状态值和各个客户的用户结果数据计算各个车辆选择各个客户的概率,具体包括:
[0023]根据所述每一辆车的当前状态值、所述各个客户的结果数据和预设参数得到当前车辆将要服务的初始顾客概率值;
[0024]当客户为已经被服务过的客户或需求量超过车辆剩余载重的客户时,设定初始顾客概率值为预设值,根据所述初始顾客概率值按照预设算法计算得到各个车辆选择各个客户的概率。
[0025]可选地,所述路径规划模型通过第一预设方法将路径选择结果输出之后,还包括:
[0026]所述路径规划模型根据路径选择结果通过目标函数表达式计算得到各个车辆的路径长度、选择路径中各个车辆服务客户时违背时间窗所受到的惩罚值;
[0027]根据各个车辆的路径长度和各个车辆服务客户时违背时间窗所受到的惩罚值通过目标函数表达式计算得到目标函数值;
[0028]其中,所述目标函数表达式如下:
[0029]选择路径中各个车辆的路径长度
[0030]选择路径中各个车辆服务客户时违背时间窗所受到的惩罚值选择路径中各个车辆服务客户时违背时间窗所受到的惩罚值
[0031]根据各个车辆的路径长度和各个车辆服务客户时违背时间窗所受到的惩罚值得到目标函数值
[0032]其中,r
i
表示第i辆车的路径,表示车辆i路径中的第j个点,t
i,j
表示车辆i到达其路径中第j个客户的时间,e
j
,l
j
表示各个车辆对应的时间窗,α、β为惩罚项的系数,当t
i,j
<e
j
时,k
e
=1,否则为0,当t
i,j
>l
j
时,k
l
=1,否则为0。
[0033]可选地,所述方法还包括:
[0034]采用第二预设方法、第三预设方法对路径规划模型中的预设参数进行训练,以使所述路径规划模型得到最佳结果。
[0035]第二方面,本专利技术提供了一种车辆路径规划装置,包括:
[0036]创建模块,用于创建路径规划模型;
[0037]管理模块,用于将各个客户的用户信息和各个车辆的初始信息输入路径规划模型中;
[0038]策略模块,用于根据模型中的预设参数和输入的各个客户的用户信息进行计算得到各个客户的用户结果数据;还用于通过第一预设方法将所述路径规划模型中的路径选择结果将输出;
[0039]所述策略模块,还用于在预设的时间步时刻内,为各个车辆设置基于门控循环单元的路径记录器,根据模型中的预设参数和各个车辆的路径记录器得到各个车辆的当前状态值;还用于根据各个车辆的当前状态值和各个客户的用户结果数据计算各个车辆选择各个客户的概率;还用于根据概率为各个车辆选择符合条件的客户。
[0040]可选地,所述装置还包括:训练模块,用于采用第二预设方法、第三预设方法对路径规划模型中的预设参数进行训练,以使所述路径规划模型得到最佳结果。
[0041]第三方面,本专利技术提供了一种计算机可读存储介质,用于存储计算机可读指令,当所述计算机可读指令由计算机执行时,使得所述计算机执行所述车辆路径规划的方法。
[0042]第四方面,本专利技术提供了一种电子设备,包括:处理器、存储器和总线;所述存储器用于存储执行指令,所述处理器与所述存储器通过所述总线连接,当所述电子设备运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述处理器执行所述车辆路径规划的方法。
[0043]本专利技术提供了一种车辆路径规划方法、装置、可读存储介质及电子设备,该方法通过创建路径规划本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车辆路径规划方法,其特征在于,包括:创建路径规划模型;将各个客户的用户信息和各个车辆的初始信息输入路径规划模型中;根据模型中的预设参数和输入的各个客户的用户信息进行计算得到各个客户的用户结果数据;在预设的时间步时刻内,为各个车辆设置基于门控循环单元的路径记录器,根据模型中的预设参数和各个车辆的路径记录器得到各个车辆的当前状态值;根据各个车辆的当前状态值和各个客户的用户结果数据计算各个车辆选择各个客户的概率;根据概率为各个车辆选择符合条件的客户;通过第一预设方法将所述路径规划模型中的路径选择结果输出。2.根据权利要求1所述的方法,其特征在于,所述根据模型中的预设参数和输入的各个客户的用户信息进行计算得到各个客户的用户结果数据,具体包括:通过矩阵计算方法根据所述预设参数对所述各个客户的用户信息进行初始编码;利用注意力机制对所述初始编码得到的数据进行处理得到各个客户的结果数据。3.根据权利要求1所述的方法,其特征在于,所述为各个车辆设置基于门控循环单元的路径记录器,具体包括:设置各个车辆的起点位置信息;为各个车辆分配一个局部路径记录器,并设置一个全局路径记录器。4.根据权利要求3所述的方法,其特征在于,所述根据模型中的预设参数和各个车辆的路径记录器得到各个车辆的当前状态值,具体包括:获取每一辆车上的局部路径记录器的值和全局路径记录器的值;根据每一辆车上的局部路径记录器的值和全局路径记录器的值依次得到每一辆车的当前状态值。5.根据权利要求4所述的方法,其特征在于,根据各个车辆的当前状态值和各个客户的用户结果数据计算各个车辆选择各个客户的概率,具体包括:根据所述每一辆车的当前状态值、所述各个客户的结果数据和预设参数得到当前车辆将要服务的初始顾客概率值;当客户为已经被服务过的客户或需求量超过车辆剩余载重的客户时,设定初始顾客概率值为预设值,根据所述初始顾客概率值按照预设算法计算得到各个车辆选择各个客户的概率。6.根据权利要求1所述的方法,其特征在于,所述路径规划模型通过第一预设方法将路径选择结果输出之后,还包括:所述路径规划模型根据路径选择结果通过目标函数表达式计算得到各个车辆的路径长度、选择路径中各个车辆服务客户时违背时间窗所受到的惩罚值;根据各个车辆的路径长度和各个车辆服务客户时违背时间窗所受到的惩罚值通过目标函数表达式计算得到目标函数值;其中,所述目标函数表...

【专利技术属性】
技术研发人员:崔晋范骁阳任磊
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1