一种融合组合优化与强化学习加速收敛的物流分拣方法技术

技术编号:40422697 阅读:26 留言:0更新日期:2024-02-20 22:42
本发明专利技术公开了一种融合组合优化与强化学习加速收敛的物流分拣方法,包括以下步骤:S1.统计历史班次的包牌所含货物件量比例数据,预测未来班次的货物件量比例数据;S2.通过目标组合优化,获得包牌所占格口数量最优分配;S3.基于分拣机的分拣格口的历史分拣数据,拟合格口处理效率函数;S4.获取包牌类别相似度矩阵和转移概率矩阵;S5.基于包牌类别的相似度和转移概率矩阵设计强化学习策略以及价值网络,构造蒙特卡洛树的叶节点;S6.通过对蒙特卡洛树的叶节点进行展开,获取最优的格口分拣策略。本发明专利技术降低分拣计划优化更新的复杂度,加快蒙特卡洛树搜索的搜索速度,实现满足较高时效要求的多目标分拣优化策略。

【技术实现步骤摘要】

本专利技术涉及物流分拣领域,特别是涉及一种融合组合优化与强化学习加速收敛的物流分拣方法


技术介绍

1、在物流中转场的货物分拣中,分拣格口作为物流分拣机的分拣落袋的最小单位,货物包牌作为中转场制定的货物流向与时效信息的货物聚类,两者的映射关系极大影响着整个物流分拣的效率。现有的物流分拣计划的优化更新通常基于每个班次之间进行迭代,通过对当前班次每个包牌所含货物的件量比例以及物流分拣机的格口处理效率的分析,进行每个包裹对应物流分拣机的格口落袋位置调整。这样的优化更新有很多缺陷:第一,当前的优化更新算法一般基于物流中转场人工分拣经验规则,只能寻找当前环境的局部最优分拣计划,无法寻找全局最优计划。第二,现有的优化更新算法只能根据当前班次的包牌所含货物件量比例来进行班次之间的调整,并未做到对历史货物的件量比例进行分析,使优化更新后的分拣计划普适性较差,难以适应多个分拣班次条件。第三,当前每个班次的分拣计划的优化更新时效要求较高,每个班次间隔时间为40分钟,在面临多个场地限制条件、多个分拣优化目标的极大搜索空间场景下,难以在40分钟内的时效要求下使用强化学习算法来寻找本文档来自技高网...

【技术保护点】

1.一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:步骤S1中所述历史班次的包牌类别所含货物件量比例数据是指:历史班次中每个包牌类别包含的货物件量站该班次中总货物件量的比例。

3.根据权利要求2所述的一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:所述步骤S1包括:

4.根据权利要求1所述的一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:所述步骤S2包括:

5.根据权利要求1所述的一种融合组合优化与...

【技术特征摘要】

1.一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:步骤s1中所述历史班次的包牌类别所含货物件量比例数据是指:历史班次中每个包牌类别包含的货物件量站该班次中总货物件量的比例。

3.根据权利要求2所述的一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:所述步骤s1包括:

4.根据权利要求1所述的一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:所述步骤s2包括:

5.根据权利要求1所述的一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:所述步骤s3包括:

6.根据权利要求1所述的一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:所述步骤s4包括:

7.根据权利要求1所述的一种融合组合优化与强化学习加速收敛的物流分拣方法,其特征在于:所述步骤s5包括:

【专利技术属性】
技术研发人员:黄川崔曙光张崴李然
申请(专利权)人:香港中文大学深圳未来智联网络研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1