【技术实现步骤摘要】
本专利技术涉及自动驾驶与路径规划,特别是涉及一种基于动态加权机制的无人夹抱车路径优化方法。
技术介绍
1、随着自动化仓储作业的普及,特别是棉花仓库中的夹包车在复杂环境中的路径规划成为研究热点。现有路径规划方法通常依赖于传统的图搜索算法和优化方法,如a*、dijkstra等,汤玉春等人将两种传统搜索算法融合,通过动态改变启发式函数权重,提高了灵活避障效率和搜索效率。葛杏卫等人提出在搜索初期更依赖启发式函数快速接近目标节点,而在接近目标节点时更依赖实际代价,确保找到最优路径。wang等人提出了一种改进的灰狼优化算法,在位置更新机制中引入了动态权重分配以适应不同的搜索阶段,在优化过程的后期,动态权重策略能够加速算法的收敛速度,帮助找到全局最优解。这些方法在处理动态环境和复杂场景时存在一定的局限性。
2、近年来基于学习的方法利用策略网络学习复杂的驾驶行为,被广泛应用于路径规划中。如曹诗瑶提出针对仓库中动态障碍物场景,改进近端策略优化(ppo)算法提高了对序列样本学习能力,提升训练效率,同时将人工势场法(apf)与多智能体近端策略优化
...【技术保护点】
1.一种基于动态加权机制的无人夹抱车路径优化方法,其特征在于,包括以下步骤:
2.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,步骤3中,评价网络Critic通过时序差分TD学习更新其估计值,路径质量损失Lcritic基于TD误差计算,表示为:
3.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,所述即时奖励rt由路径平滑性损失、避障安全性损失和终点接近性损失三部分计算得到,具体如下:
4.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,步骤3中图搜索生成的粗
...【技术特征摘要】
1.一种基于动态加权机制的无人夹抱车路径优化方法,其特征在于,包括以下步骤:
2.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,步骤3中,评价网络critic通过时序差分td学习更新其估计值,路径质量损失lcritic基于td误差计算,表示为:
3.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,所述即时奖励rt由路径平滑性损失、避障安全性损失和终点接近性损失三部分计算得到,具体如下:
4.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,步骤3中图搜索生成的粗略路径psearch与策略神经网络actor生成的路径pactor的相似性损失lsimilarity的计算如下式:
5.如权利要求1所述的基于动态加权机制的无人夹抱车路...
【专利技术属性】
技术研发人员:宋康,刘志强,陈云,张连会,贾岚博,谢辉,
申请(专利权)人:天津大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。