基于双重指针网络的车货匹配方法组成比例

技术编号:31980577 阅读:35 留言:0更新日期:2022-01-20 01:37
本发明专利技术提供了一种基于双重指针网络的车货匹配方法,对车货匹配问题建模,得到车货匹配问题数学模型,生成车货匹配情况,对车货匹配情况进行预处理;然后使用Critic网络与双重指针网络对抗的方法,训练双重指针网络,训练数据使用生成的预处理模拟车货匹配情况,得到优化的双重指针网络并用以求解实际车货匹配情况,求解后采用映射方法将优化车辆序列和优化货物序列映射成车货匹配问题的结果。本发明专利技术通过对车货匹配问题进行数学建模,然后生成多个车货匹配情况并采用对抗的方法来训练双重指针网络,最后使用训练后优化的双重指针网络来求解实际车货匹配问题,解决现有车货匹配问题中无法解决两个分属不同问题但相关的序列决策的问题。决策的问题。决策的问题。

【技术实现步骤摘要】
基于双重指针网络的车货匹配方法


[0001]本专利技术涉及一种基于双重指针网络的车货匹配方法,属于深度学习领域。

技术介绍

[0002]车货供需匹配作为组合优化的一种特殊问题,实质上是一种集TSP(旅行商问题)、VRP(车辆路由问题)、背包问题、装箱问题、带时间窗等的复杂组合优化问题,近几年于国内形成一个新的研究领域。
[0003]在早期研究的TSP与VRP问题中,模拟退火算法(SAA)、粒子群算法(PSO)、遗传算法(GA)等是常见的启发式算法。近年来出现了将梯度策略算法应用于组合优化算法,并使用神经网络和强化学习同时求解TSP问题与背包问题,取得了满意的结果。如今,深度强化学习(DRL)在组合优化领域得被广泛研究与应用。与早期启发算法相比,深度强化学习方法充分利用了历史样本。对存在样本饥荒现象的问题有着更优结果。此外,大部分启发式算法对于不同规模的问题存在“瓶颈问题”,处理更大规模的问题时,对算法优化效果并不明显且需要耗费更长的时间与资源。而深度强化学习在不同规模问题的处理上,泛化性能良好。
[0004]其中,车货匹配的场景通过建模转换为序列决策问题,而序列决策问题可以看作一个seq2seq模型。传统的seq2seq模型的处理方法是无法解决输出序列的词汇表会随着输入序列长度的改变而改变的问题的。指针网络解决了这样的问题,但是无法解决两个分属不同问题但相关的序列决策问题,而车货匹配就是这样的一个问题。
[0005]有鉴于此,确有必要提出一种新的基于双重指针网络的车货匹配方法,以解决上述问题。

技术实现思路

[0006]本专利技术的目的在于提供一种基于双重指针网络的车货匹配方法,以解决现有车货匹配问题中无法解决两个分属不同问题但相关的序列决策问题。
[0007]为实现上述目的,本专利技术提供了一种基于双重指针网络的车货匹配方法,采用双重指针网络,包括以下步骤:
[0008]步骤1:获取车货匹配问题并对车货匹配问题建模,得到车货匹配问题数学模型;
[0009]步骤2:根据步骤1中的车货匹配问题数学模型,生成车货匹配情况,包括实际车货匹配情况和至少一种模拟车货匹配情况;
[0010]步骤3:对步骤2中所述车货匹配情况进行预处理,得到预处理模拟车货匹配情况和预处理实际车货匹配情况;
[0011]步骤4:输入步骤3中的所述预处理模拟车货匹配情况,使用Critic网络与双重指针网络对抗的方法,来训练所述双重指针网络,最终得到训练后优化的双重指针网络;
[0012]步骤5:使用步骤4中所述优化的双重指针网络,求解步骤3中所述预处理实际车货匹配情况,得到优化车辆序列以及优化货物序列;
[0013]步骤6:采用映射方法将步骤5得到的所述优化车辆序列和所述优化货物序列映射
为所述实际车货匹配情况的匹配结果。
[0014]作为本专利技术的进一步改进,步骤1中所述车货匹配问题数学模型包括:
[0015]定义1:将货物属性设定为六维向量[m
c
,v
c
,p
c
,d
c
,f
c
,c
c
],对应单位为(t,m3,元,/,h,元);其中m
c
为货物质量,v
c
为货物体积,p
c
为货物运费,d
c
为目的城市编号,目的城市编号无单位,用/表示,f
c
为最晚到达时间,c
c
为违约金;
[0016]定义2:将车辆属性设定为六维向量[m
t
,v
t
,p
t
,s
t
,a
t
,b
t
],对应单位为(t,m3,元/km,km/h,t,m3),其中m
t
为车辆载重上限,v
t
为车辆容积上限,p
t
为车辆每千米单价,s
t
为车辆平均速度,a
t
为车辆载重的使用情况,b
t
为车辆容积的使用情况,而且a
t
≤m
t
,b
t
≤v
t

[0017]定义3:设货物数量为n,货物序列Cseq=[cargo1,cargo2,

,cargo
n
],其中cargo
i
为定义1中所述货物属性向量,设判别变量d
ij
,d
ij
定义为:
[0018][0019]定义4:设车辆数量为e,车辆序列Tseq=[truck1,truck2,

,truck
e
],其中truck
i
为定义2中所述车辆属性向量,设判别变量o
i
,该变量定义如下:
[0020][0021]定义5:由d
ij
组成的e行n列的矩阵为车货匹配矩阵D,由o
i
组成的n维向量为超时判别向量记为列向量o,设第i个货物超时违约金为w
i
,由w
i
组成的n维向量为违约金列向量记为w,第i辆车的单价为p
i
元/km,第i辆车需要行驶的距离为l
i
,车辆单价和车辆行驶距离分别组成维度为e的列向量l和c,为一个维度与相乘的向量或者矩阵相容的元素全为1的列向量,p为一个由货物运费组成的n维列向量,其中第i个元素为第i个货物的运费,类似的方式定义货物质量列向量m和货物体积列向量v,车辆载重列向量m

和车辆容积列向量v


[0022]所述车货匹配问题数学模型需要优化解决的问题为:
[0023][0024]其中
[0025][0026]的结果为车辆运输利润,为所有匹配货物的运费收入,l
T
c为车辆的成本,w
T
o为需要赔付的违约金,并有约束条件:
[0027][0028]Dm≤m

[0029]Dv≤v

[0030]其中
[0031][0032]表示实现约束匹配结果中每一个货物最多由一辆车服务,一辆车服务至少一个货物,Dm≤m

表示车辆不能超载,Dv≤v

表示给车辆匹配到的货物不超过车辆的容积。
[0033]作为本专利技术的进一步改进,步骤2中生成所述车货匹配情况具体为将所述车货匹配问题数学模型中的车辆序列和货物序列映射为一种车货匹配情况,然后将所述车货匹配情况映射为车辆运输利润,使得所述模拟车货匹配情况的优化目标将所述车辆运输利润最大化,所述车货匹配问题数学模型中的所述车辆序列和所述货物序列映射为所述车货匹配情况的具体步骤为:
[0034]步骤21:遍历货物序列Cseq=[ca本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双重指针网络的车货匹配方法,采用双重指针网络,其特征在于,包括以下步骤:步骤1:获取车货匹配问题并对车货匹配问题建模,得到车货匹配问题数学模型;步骤2:根据步骤1中的车货匹配问题数学模型,生成车货匹配情况,包括实际车货匹配情况和至少一种模拟车货匹配情况;步骤3:对步骤2中所述车货匹配情况进行预处理,得到预处理模拟车货匹配情况和预处理实际车货匹配情况;步骤4:输入步骤3中的所述预处理模拟车货匹配情况,使用Critic网络与双重指针网络对抗的方法,来训练所述双重指针网络,最终得到训练后优化的双重指针网络;步骤5:使用步骤4中所述优化的双重指针网络,求解步骤3中所述预处理实际车货匹配情况,得到优化车辆序列以及优化货物序列;步骤6:采用映射方法将步骤5得到的所述优化车辆序列和所述优化货物序列映射为所述实际车货匹配情况的匹配结果。2.根据权利要求1所述的基于双重指针网络的车货匹配方法,其特征在于:步骤1中所述车货匹配问题数学模型包括:定义1:将货物属性设定为六维向量[m
c
,v
c
,p
c
,d
c
,f
c
,c
c
],对应单位为(t,m3,元,/,h,元);其中m
c
为货物质量,v
c
为货物体积,p
c
为货物运费,d
c
为目的城市编号,目的城市编号无单位,用/表示,f
c
为最晚到达时间,c
c
为违约金;定义2:将车辆属性设定为六维向量[m
t
,v
t
,p
t
,s
t
,a
t
,b
t
],对应单位为(t,m3,元/km,km/h,t,m3),其中m
t
为车辆载重上限,v
t
为车辆容积上限,p
t
为车辆每千米单价,s
t
为车辆平均速度,a
t
为车辆载重的使用情况,b
t
为车辆容积的使用情况,而且a
t
≤m
t
,b
t
≤v
t
;定义3:设货物数量为n,货物序列Cseq=[cargo1,cargo2,

,cargo
n
],其中cargoi为定义1中所述货物属性向量,设判别变量d
ij
,d
ij
定义为:定义4:设车辆数量为e,车辆序列Tseq=[truck1,truck2,

,truck
e
],其中truck
i
为定义2中所述车辆属性向量,设判别变量o
i
,该变量定义如下:定义5:由d
ij
组成的e行n列的矩阵为车货匹配矩阵D,由oi组成的n维向量为超时判别向量记为列向量o,设第i个货物超时违约金为w
i
,由w
i
组成的n维向量为违约金列向量记为w,第i辆车的单价为p
i
元/km,第i辆车需要行驶的距离为li,车辆单价和车辆行驶距离分别组成维度为e的列向量l和c,为一个维度与相乘的向量或者矩阵相容的元素全为1的列向量,p为一个由货物运费组成的n维列向量,其中第i个元素为第i个货物的运费,类似的方式定义货物质量列向量m和货物体积列向量v,车辆载重列向量m

和车辆容积列向量v

;所述车货匹配问题数学模型需要优化解决的问题为:
其中的结果为车辆运输利润,为所有匹配货物的运费收入,l
T
c为车辆的成本,w
T
o为需要赔付的违约金,并有约束条件:Dm≤m

Dv≤v

其中表示实现约束匹配结果中每一个货物最多由一辆车服务,一辆车服务至少一个货物,Dm≤m

表示车辆不能超载,Dv≤v

表示给车辆匹配到的货物不超过车辆的容积。3.根据权利要求2所述的基于双重指针网络的车货匹配方法,其特征在于:步骤2中生成所述车货匹配情况具体为将所述车货匹配问题数学模型中的车辆序列和货物序列映射为一种车货匹配情况,然后将所述车货匹配情况映射为车辆运输利润,使得所述模拟车货匹配情况的优化目标将所述车辆运输利润最大化,所述车货匹配问题数学模型中的所述车辆序列和所述货物序列映射为所述车货匹配情况的具体步骤为:步骤21:遍历货物序列Cseq=[cargo1,cargo2,

,cargo
n
],取出Cseq中元素cargo
i
,其中1≤i≤n;步骤22:遍历车辆序列Tseq=[truck1,truck2,

,truck
e
],取出Tseq中元素truck
i
,其中1≤i≤n;步骤23:提取元素cargo
i
的六维向量[m
ci
,v
ci
,p
ci
,d
ci
,f
ci
,c
ci
]中的(m
ci
,v
ci
)属性;提取元素truck
i
六维向量[m
ti

【专利技术属性】
技术研发人员:孙知信蔡岳王恩良孙哲宫婧赵学健胡冰汪胡青
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1