一种基于多目标深度强化学习的取送货顺序预测方法技术

技术编号:42409363 阅读:20 留言:0更新日期:2024-08-16 16:28
本发明专利技术公开了一种基于多目标深度强化学习的取送货顺序预测方法,针对考虑同时取送货的配送顺序预测模型,提出一种多目标深度强化学习框架,用于解决即时配送平台中同时取送货、多订单下的配送顺序预测问题,框架结合了两个深度强化学习网络,能够有效地进行多目标决策,以优化配送路径,并且方案中还结合考虑骑手偏好与配送总路径最短的规则进行预测,综合考虑了骑手的特征和偏好,兼顾了配送路径总路程最短和提高骑手满意度两个方面,使得生成的配送路径更加符合骑手的实际需求,提高了配送效率和骑手满意度。

【技术实现步骤摘要】

本专利技术属于深度学习,具体涉及一种基于多目标深度强化学习的取送货顺序预测方法


技术介绍

1、随着o2o电子商务的发展,即时配送这种点对点且高时效性的配送服务在人们的日常生活中扮演着越来越重要的角色,即时物流需求不断提升,场景也不断丰富。

2、许多物流平台通过解决给定时空约束下的组合优化问题,为快递员规划取件路线并推荐最佳路线,如行程距离最小的路线。与传统的vrpsdp不同,即时配送路径问题具有边取边送、强动态、大规模的特点。针对这些特点,现有技术提出了一种称为迭代物流解决方案规划的混合方法,它不仅可以快速找到一个好的物流解决方案,而且可以在满足实际物流约束的情况下迭代提高解决方案的质量。方法包含两个主要阶段,即初始物流解决方案生成和基于领域专家的智能和知识的迭代物流解决方案改进,设计了包划分、路径规划和质量改进的算法和策略。为最小化快递员的完工时间和顾客的总延迟时间这两个目标提出了一个理论上有保证的解决方案框架,利用一种称为分层分离树的空间索引,设计了一种有效的近似算法。即时配送路径规划必须在很短的时间内生成,提出一种简单有效的迭代贪婪算法本文档来自技高网...

【技术保护点】

1.一种基于多目标深度强化学习的取送货顺序预测方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的方法,其特征在于:所述采集骑手历史取送货特征数据并结合骑手取送货顺序问题构建预测输入样本,包括:

3.根据权利要求2所述的方法,其特征在于:所述采集骑手历史取送货特征数据并结合骑手取送货顺序问题构建预测输入样本,还包括:

4.根据权利要求3所述的方法,其特征在于:所述将所述预测输入样本输入预设深度学习模型进行学习训练,得到初始骑手取送货顺序,包括:

5.根据权利要求4所述的方法,其特征在于:所述构建多目标深度强化学习网络预测模型,包括:<...

【技术特征摘要】

1.一种基于多目标深度强化学习的取送货顺序预测方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的方法,其特征在于:所述采集骑手历史取送货特征数据并结合骑手取送货顺序问题构建预测输入样本,包括:

3.根据权利要求2所述的方法,其特征在于:所述采集骑手历史取送货特征数据并结合骑手取送货顺序问题构建预测输入样本,还包括:

4.根据权利要求3所述的方法,其特征在于:所述将所述预测输入样本输入预设深度学习模型进行学习训练,得到初始骑手取送货顺序,包括:

5.根据权利要求4所述的方法,其特征在于:所述构建多目标深度强化学习网络预测模型,包括:

6.根据权利要求5所述的...

【专利技术属性】
技术研发人员:张玉利马子椠张淼李猜
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1