综合深度神经网络与强化学习的车辆路径问题求解方法技术

技术编号：36166265 阅读：5 留言：0更新日期：2022-12-31 20:15

本发明专利技术公开了综合深度神经网络与强化学习的车辆路径问题求解方法，涉及强化学习技术领域，利用Strutc2Vec图结构对实际路网进行特征提取，并更新不同状态下路径图的特征信息；构建Actor

全部详细技术资料下载

【技术实现步骤摘要】
综合深度神经网络与强化学习的车辆路径问题求解方法

[0001]本专利技术属于强化学习以及车辆路径领域，涉及强化学习技术，具体是综合深度神经网络与强化学习的车辆路径问题求解方法。

技术介绍

[0002]由于近十年电子商务行业的快速发展，物流运输业作为货物运输的渠道越来越受到重视庞大的物流行业对应着巨大的物流需求，随之而来的是我国的年度物流总成本一年比一年高；如何优化物流配送，减少物流总成本非常重要；车辆路径问题通常可以描述为：给定一组需求点，一队同类型运输车辆从物流中心出发，为所有需求点提供送货服务；需求点的订单需求和服务时间窗口已知；问题以优化车辆行驶距离、车辆使用数或运输总费用为目标；车辆路径问题已经被证明是一个NP
‑
hard问题，即无法找到可在多项式时间复杂度内求解的方法；因此传统方案只能获得近似最优解或启发式算法；但是传统的启发式算法对于求解大规模需求点来说无法应对，过长的求解时长不能让物流企业实时制定合理的车辆配送方案；随着深度学习与强化学习的发展，基于分布式神经网络的强化学习算法能够更好的解决这些难题，在车辆路径领域已经有多种强化学习方法被广泛使用，从而进一步减少对大规模车辆路径算例的求解时长；为此，提出综合深度神经网络与强化学习的车辆路径问题求解方法。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题之一；为此，本专利技术提出综合深度神经网络与强化学习的车辆路径问题求解方法，该综合深度神经网络与强化学习的车辆路径问题求解方法将实际货物运输路线抽象...

【技术保护点】

【技术特征摘要】
1.综合深度神经网络与强化学习的车辆路径问题求解方法，其特征在于，包括以下步骤：步骤一：将车辆路径抽象为一个无向图的形式；将无向图标记为G；其中，无向图中的每个节点分别代表具有货物需求的收货点；无向图的每条边代表每个收货点之间的路径；步骤二：利用Strutc2Vec根据对应的无向图G的结构递归提取节点的特征；步骤三：构建Actor
‑
Critic网络；包括使用编码器将图信息、节点状态以及包括起始点的初始无向图作为输入，生成图形结构和节点特征的编码；以及使用解码器整合编码器的上下文信息、自身当前的上下文信息以及遍历过的部分旅行节点利用注意力机制产生权重最大的元素作为下一个旅行的节点；步骤四：训练Actor
‑
Critic网络；包括定义奖励函数，并使用随机策略梯度下降方法训练指针网络ActorNet；以及根据指针网络ActorNet输出的策略，使用随机梯度下降对每个策略产生的价值进行预测的方式训练价值网络CriticNet；再将指针网络ActorNet产生的实际奖励值与价值网络CriticNet产生的预估奖励值求得均方误差作为优化目标，采用随机梯度下降的方式进行训练Actor
‑
Critic网络；步骤五：使用训练好的Actor
‑
Critic网络求解车辆路径问题。2.根据权利要求1所述的综合深度神经网络与强化学习的车辆路径问题求解方法，其特征在于，Strutc2Vec提取节点特征的方式为对节点的属性和边的属性用不同的参数Θ进行非线性映射到神经网络中，经过r次迭代后得到每个节点点及其与邻点边的特征信息；r为预先设置的迭代次数参数；参数Θ根据每条边的距离以及来往时间按照一定比例通过指针网络训练而得；Strutc2Vec将算例中的每一个点嵌入一个初始化为0的P维特征；其中，P代表每个节点的属性的数量；然后对所有的嵌入特征进行同步更新。3.根据权利要求1所述的综合深度神经网络与强化学习的车辆路径问题求解方法，其特征在于，所述编码器将图信息、节点状态以及包括起始点的初始无向图经过LSTM网络转换为P维的特征信息，并经过LSTM处理后的原始数据作为解码器的初始输入；先将起始节点的信息输入指针网络，然后将其他节点的信息随机进行输入，最后，根据所有节点生成的P维的特征信息，编码器生成图形结构和节点特征的编码，...

【专利技术属性】
技术研发人员：陈荣元，邓乔木，周鲜成，申立智，李甜霞，何志雄，陈浪，
申请(专利权)人：湖南工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人