当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于深度强化学习的大规模旅行商问题求解方法技术

技术编号:43523998 阅读:18 留言:0更新日期:2024-12-03 12:12
本发明专利技术公开了一种基于深度强化学习的大规模旅行商问题求解方法,包括:(1)将大规模旅行商问题建模为马尔科夫决策过程;(2)随机生成一系列大规模旅行商问题实例并进行数据增强,得到训练数据;(3)构建基于端到端深度强化学习的大规模旅行商问题求解模型架构,该模型包括编码器和解码器,编码器采用快速注意力机制作为注意力层,解码器使用一个特殊的上下文节点来表示当前的解码状态;(4)设计决策网络,训练模型;决策网络选择REINFORCE,利用深度强化学习方法中的对称性对REINFORCE算法进行改进;(5)利用训练好的模型进行旅行商问题求解,并对求解结果进行优化。本发明专利技术可以解决大规模旅行商问题求解中时间效率和内存占用的双重挑战。

【技术实现步骤摘要】

本专利技术属于旅行商问题求解领域,尤其是涉及一种基于深度强化学习的大规模旅行商问题求解方法


技术介绍

1、旅行商问题是一个经典的组合优化问题,其定义是在给定一组城市及其两两之间的距离或费用矩阵的情况下,寻找一个能使总旅行距离或费用最小的回路,该回路必须经过每个城市且只经过一次。

2、旅行商问题在实际生活中有广泛的应用场景,如配送路径规划、包裹投递、商店补货等。尽管旅行商问题本身简单明了,但已被证明是一个np难问题,即在多项式时间内很难找到最优解。随着社会经济的快速发展,人们对各种物流配送效率和成本的要求越来越高,旅行商问题的求解也受到了日益广泛的关注。针对旅行商问题,研究人员提出了多种求解算法,主要包括精确算法、启发式算法和元启发式算法三大类。

3、精确算法能在解决质量方面取得优势,目前比较著名的是applegate等人于2006年发表的工作《the traveling salesman problem:a computational study.princetonuniversity press》。该工作提出concorde求解本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习的大规模旅行商问题求解方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于深度强化学习的大规模旅行商问题求解方法,其特征在于,步骤(1)中,所述的状态为已访问的城市集合,动作为下一个要访问的城市,策略为下一步选择每个城市的概率,奖励为路径长度。

3.根据权利要求1所述的基于深度强化学习的大规模旅行商问题求解方法,其特征在于,步骤(2)中,随机生成500-2000个城市,这些城市的坐标位置均匀分布在一个二维平面上。

4.根据权利要求1所述的基于深度强化学习的大规模旅行商问题求解方法,其特征在于,步骤(2)中通过旋转,平移...

【技术特征摘要】

1.一种基于深度强化学习的大规模旅行商问题求解方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于深度强化学习的大规模旅行商问题求解方法,其特征在于,步骤(1)中,所述的状态为已访问的城市集合,动作为下一个要访问的城市,策略为下一步选择每个城市的概率,奖励为路径长度。

3.根据权利要求1所述的基于深度强化学习的大规模旅行商问题求解方法,其特征在于,步骤(2)中,随机生成500-2000个城市,这些城市的坐标位置均匀分布在一个二维平面上。

4.根据权利要求1所述的基于深度强化学习的大规模旅行商问题求解方法,其特征在于,步骤(2)中通过旋转,平移,翻转,缩放等操作进行数据增强。

5.根据权利要求1所述的基于深度强化学习的大规模旅行商问题求解方法,其特征在于,步骤(3)中,编码器包括输入层、注意力层和前馈...

【专利技术属性】
技术研发人员:周于嵛潘伟航林彬彬蔡登何晓飞
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1