The invention discloses an AGV path planning method and system based on ant colony algorithm and multi-agent Q-learning, improves the ability of global optimization, introduces multi-agent Q-learning into AGV path planning research, realizes AGV learning how to avoid obstacles in interaction, and can better play AGV's autonomy and learning ability. The technical scheme is as follows: modeling AGV working environment based on static environment using grid method, setting starting point and target point; generating global optimal path by ant colony algorithm according to the coordinates of starting point and target point of AGV; moving AGV to target point according to global optimal path, when dynamic obstacles exist in the smallest distance detected When the obstacle avoidance strategy is selected according to the environment state through multi-agent Q-learning, corresponding obstacle avoidance actions are made accordingly, and the obstacle avoidance ends and then returns to the original path to continue moving.
【技术实现步骤摘要】
基于蚁群算法和多智能体Q学习的AGV路径规划方法和系统
本专利技术涉及一种AGV路径规划技术,具体涉及动态环境下基于改进的蚁群算法和优化的多智能体Q学习的AGV(AutomatedGuidedVehicle,自动导引运输车)路径规划方法和系统。
技术介绍
路径规划是AGV规划调度中的重要问题,随着越来越多的AGV投入使用,带来了很多新的问题,比如动态变化的环境模型建立的问题;多AGV的路径规划以及避障的问题;多AGV系统的学习性、智能性的发挥问题。已有的AGV路径规划方法有群智能仿生算法,A*、D*算法等,这类单一的全局规划方法往往达不到全局最优,对环境的先验知识要求较高,需要占用较大的存储空间,遇到复杂的动态的环境,这类规划方法的效率会大幅下降。而且这些算法不能体现和发挥AGV系统的智能性和学习能力,缺乏AGV与动态环境的交互和AGV之间的联系。蚁群算法具有强大的鲁棒性,良好的分布式计算,且它的机制是蚂蚁找到巢与食源之间可行的最短路径,与路径规划的物理过程相吻合,这使得蚁群算法很适合应用在路径规划中,然而典型的蚁群算法容易陷入局部最优解,收敛速度慢。目前对于蚁群算法的改进主要有两个方面,第一个策略集中在蚁群算法本身,例如,重新定义转移概率并建立新的信息素更新方法。第二个策略是将传统的蚁群算法与其他智能算法相结合。例如,遗传算法可以用于获得基于蚁群算法执行优化的初始解。或者将混沌机制加入蚁群算法,提高多样性,跳出局部最优。而后者需要更大的时间空间代价。人工智能的一个重要目标就是让agent能够拥有自主学习的能力,能够通过与复杂的未知环境交互来获得经验,作为 ...
【技术保护点】
1.一种基于蚁群算法和多智能体Q学习的AGV路径规划方法,其特征在于,包括:步骤一:根据静态环境利用栅格法对AGV作业环境进行建模,根据AGV作业任务设置起始点和目标点;步骤二:根据AGV的起始点和目标点坐标通过蚁群算法生成AGV的全局最优路径;步骤三:AGV根据全局优化路径向目标点移动,当探测到最小距离内存在包括其他AGV在内的动态障碍物时,通过多智能体Q学习对应环境状态进行避障策略的选择,据此作出相应的避障动作,避障结束再返回原来的路径上继续运动。
【技术特征摘要】
1.一种基于蚁群算法和多智能体Q学习的AGV路径规划方法,其特征在于,包括:步骤一:根据静态环境利用栅格法对AGV作业环境进行建模,根据AGV作业任务设置起始点和目标点;步骤二:根据AGV的起始点和目标点坐标通过蚁群算法生成AGV的全局最优路径;步骤三:AGV根据全局优化路径向目标点移动,当探测到最小距离内存在包括其他AGV在内的动态障碍物时,通过多智能体Q学习对应环境状态进行避障策略的选择,据此作出相应的避障动作,避障结束再返回原来的路径上继续运动。2.根据权利要求1所述的基于蚁群算法和多智能体Q学习的AGV路径规划方法,其特征在于,在步骤二中,蚁群算法中的适应度函数为其中num为AGV走过的栅格数,D为AGV所走路径长度,k表示第k只蚂蚁。3.根据权利要求1所述的基于蚁群算法和多智能体Q学习的AGV路径规划方法,其特征在于,在步骤二中,在蚂蚁k发生位置转移时,蚁群算法中的启发式因子为其中ηij为位置点i上的蚂蚁选择下一步到相邻位置点j的启发式因子,dij是相邻两位置点i和位置点j的距离,dje是位置点j到目标点的距离;其中i和j表示栅格位置,xj是位置点j的横坐标,yj是位置点j的纵坐标,(xend,yend)是终点坐标。4.根据权利要求1所述的基于蚁群算法和多智能体Q学习的AGV路径规划方法,其特征在于,在步骤二中,蚁群算法中的信息素更新策略为:τij(t+n)=(1-ρ)Δτij(t)+Δτij(t)其中τij(t+n)是t+n时刻(i,j)处的信息素量,Δτij(t)是t时刻(i,j)处的信息素增量,1-ρ表示残留因子,是蚂蚁k在t时刻经过路径(i,j)留下的信息素,m是指蚁群种群数量。5.根据权利要求1所述的基于蚁群算法和多智能体Q学习的AGV路径规划方法,其特征在于,在步骤二中,蚁群算法中的信息素挥发系数随着迭代次数的增加而自适应的改变,自适应信息素挥发系数的更新规则为:ρ*=[1-e(n-N)/N]ρ其中ρ是信息素挥发系数,n是当前的迭代次数,N是迭代的总数。6.根据权利要求1所述的基于蚁群算法和多智能体Q学习的AGV路径规划方法,其特征在于,步骤二中通过蚁群算法获得当前AGV的全局最优路径的步骤进一步包括:步骤1:根据蚁群系统的转移概率公式计算每只蚂蚁到达每个节点的概率;步骤2:一次迭代后更新信息素剩余信息,更新t+n时刻路径path(i,j)上...
【专利技术属性】
技术研发人员:英春,谭书华,李娜,雷蕾,孙知信,孙哲,
申请(专利权)人:圆通速递有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。