当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于动态加权机制的无人夹抱车路径优化方法技术

技术编号:45331386 阅读:33 留言:0更新日期:2025-05-23 16:59
本发明专利技术公开了一种基于动态加权机制的无人夹抱车路径优化方法,包括以下步骤:步骤1,使用图搜索算法生成一条粗略路径P<subgt;search</subgt;;步骤2,策略神经网络Actor根据实时障碍物信息、车辆状态基于当前策略优化后输出一条路径P<subgt;actor</subgt;;步骤3,动态加权机制:将图搜索生成的粗略路径P<subgt;search</subgt;作为参考路径,计算其与路径P<subgt;actor</subgt;的相似性损失L<subgt;similarity</subgt;,强化学习模型的评价网络Critic对Actor生成的路径P<subgt;actor</subgt;进行打分,生成路径质量损失L<subgt;critic</subgt;,将二者动态加权计算总损失L<subgt;total</subgt;,根据累计回报I<subgt;reward</subgt;、路径稳定性I<subgt;stability</subgt;和路径平滑性I<subgt;smoothness</subgt;,动态调整动态权重因子α。本发明专利技术根据实时环境动态调整权重,动态适应不同训练阶段的需求,从而优化路径规划质量和效率。

【技术实现步骤摘要】

本专利技术涉及自动驾驶与路径规划,特别是涉及一种基于动态加权机制的无人夹抱车路径优化方法


技术介绍

1、随着自动化仓储作业的普及,特别是棉花仓库中的夹包车在复杂环境中的路径规划成为研究热点。现有路径规划方法通常依赖于传统的图搜索算法和优化方法,如a*、dijkstra等,汤玉春等人将两种传统搜索算法融合,通过动态改变启发式函数权重,提高了灵活避障效率和搜索效率。葛杏卫等人提出在搜索初期更依赖启发式函数快速接近目标节点,而在接近目标节点时更依赖实际代价,确保找到最优路径。wang等人提出了一种改进的灰狼优化算法,在位置更新机制中引入了动态权重分配以适应不同的搜索阶段,在优化过程的后期,动态权重策略能够加速算法的收敛速度,帮助找到全局最优解。这些方法在处理动态环境和复杂场景时存在一定的局限性。

2、近年来基于学习的方法利用策略网络学习复杂的驾驶行为,被广泛应用于路径规划中。如曹诗瑶提出针对仓库中动态障碍物场景,改进近端策略优化(ppo)算法提高了对序列样本学习能力,提升训练效率,同时将人工势场法(apf)与多智能体近端策略优化(mappo)结合实本文档来自技高网...

【技术保护点】

1.一种基于动态加权机制的无人夹抱车路径优化方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,步骤3中,评价网络Critic通过时序差分TD学习更新其估计值,路径质量损失Lcritic基于TD误差计算,表示为:

3.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,所述即时奖励rt由路径平滑性损失、避障安全性损失和终点接近性损失三部分计算得到,具体如下:

4.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,步骤3中图搜索生成的粗略路径Psearch...

【技术特征摘要】

1.一种基于动态加权机制的无人夹抱车路径优化方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,步骤3中,评价网络critic通过时序差分td学习更新其估计值,路径质量损失lcritic基于td误差计算,表示为:

3.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,所述即时奖励rt由路径平滑性损失、避障安全性损失和终点接近性损失三部分计算得到,具体如下:

4.如权利要求1所述的基于动态加权机制的无人夹抱车路径优化方法,其特征在于,步骤3中图搜索生成的粗略路径psearch与策略神经网络actor生成的路径pactor的相似性损失lsimilarity的计算如下式:

5.如权利要求1所述的基于动态加权机制的无人夹抱车路...

【专利技术属性】
技术研发人员:宋康刘志强陈云张连会贾岚博谢辉
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1