【技术实现步骤摘要】
AGV小车导航方法、装置、系统、介质和设备
本专利技术涉及AGV小车的运行控制方法,特别涉及一种AGV小车导航方法、装置、系统、介质和设备。
技术介绍
传统人力和半机械化的工厂物流方式成本高、效率低,无法满足生产自动化和智能化的要求。AGV(AutomatedGuidedVehicle)作为一种新型智能物流设备,具有高自动化、高一体化、高灵活性等特点,能够很快捷地与各类RS/AS入/出口、生产线、装配线、输送线、站台、货架、作业点等有机结合;能够根据不同的需求,以不同的组合,实现各种不同的功能;能最大限度地缩短物流周转周期,降低物料的周转消耗,实现来料与加工、物流与生产、成品与销售等的柔性衔接,最大限度地提高生产系统的工作效率,现已广泛应用于仓储业、制造业等行业中。近年来,电商行业的发展势不可挡,而物流又是该行业及其重要的部分,物流分拣的效率很大程度上影响着行业的发展速度。传统工业会逐渐被取代,跟不上行业的发展,机器人来代替人工,提高效率和准确性,降低成本是发展的必然趋势。AGV物流分拣系统用大量的移动机器人进行装载、搬运快递包裹,能够极大地提高工作效率。我国目前的自动化物流分拣主要还是依靠着大型的物流分拣设备,虽然具有较高的物流分拣效率,但是物流分拣设备的大型化就决定了工作场地的大型化,这样就大大的限制了物流分拣的适用范围。我国的自动化物流分拣的发展还处于大型化的阶段,主要适用于大型仓库,进行大批量大包裹的自动化物流分拣。但是现如今,小包裹、小型化的物流分拣的应用范围却越来越广。目前我国市场上的AGV小车的导航方式主要是电磁导航,在地面铺设电缆或磁条已达 ...
【技术保护点】
1.一种AGV小车导航方法,其特征在于,步骤如下:根据AGV小车的实际运行环境构建AGV小车的模拟运行环境,并且根据实际运行环境中的障碍物在模拟运行环境中构建障碍物;在模拟运行环境中,基于Q‑learning算法针对AGV小车从起点运行到目的地的路径进行训练,以得到AGV小车在各个位置处的Q值矩阵;在AGV小车的实际运行环境中,控制AGV小车在各个位置时根据上述训练获取到的AGV小车在各个位置处的Q值矩阵选择运行方向。
【技术特征摘要】
1.一种AGV小车导航方法,其特征在于,步骤如下:根据AGV小车的实际运行环境构建AGV小车的模拟运行环境,并且根据实际运行环境中的障碍物在模拟运行环境中构建障碍物;在模拟运行环境中,基于Q-learning算法针对AGV小车从起点运行到目的地的路径进行训练,以得到AGV小车在各个位置处的Q值矩阵;在AGV小车的实际运行环境中,控制AGV小车在各个位置时根据上述训练获取到的AGV小车在各个位置处的Q值矩阵选择运行方向。2.根据权利要求1所述的AGV小车导航方法,其特征在于,在模拟运行环境中,基于Q-learning算法针对AGV小车从起点运行到目的地的路径进行训练的具体过程如下:步骤S21、当AGV小车处于起点位置时,首先创建一个Q值矩阵,作为AGV小车起点位置处的Q值矩阵,将上述创建的Q值矩阵中各Q值设置为初始值;其中,Q值矩阵中包括多个Q值,各Q值分别对应代表AGV小车向各方向运行的经验;然后随机选取一个运行方向作为AGV小车的运行方向;步骤S22、当AGV小车从上一位置运行到当前位置时,首先获取AGV小车在当前位置的位置信息,然后根据AGV小车当前位置的位置信息判断AGV小车是否到达目的地;若是,则进入步骤S24;若否,则根据AGV小车当前位置的位置信息判断AGV小车是否到达终点或是否碰到障碍物;若是,则将AGV小车的位置初始化到起点位置,然后执行步骤S21;若否,则进入步骤S23;步骤S23、首先根据Q-learning的奖励机制获取到AGV小车在当前位置的奖励信息;然后根据AGV小车上一位置处的Q值矩阵和AGV小车在当前位置的奖励信息计算AGV小车在当前位置处的Q值矩阵;最后根据AGV小车在当前位置处的Q值矩阵为AGV小车选择运行方向,具体为:比较Q值矩阵中各Q值的大小,选取Q值矩阵中最大的Q值,将该Q值对应所代表的方向作为AGV小车的运行方向;在AGV小车往下一位置运行时,返回步骤S22;步骤S24、训练结束,获取AGV小车从起点成功的运行到目的地的这个训练过程中计算得到的AGV小车在各个位置处的Q值矩阵。3.根据权利要求2所述的AGV小车导航方法,其特征在于,步骤S21中,当AGV小车处于起点位置时,创建的Q值矩阵中各Q值设置为零;步骤S23中,在Q-learning算法加入ε-greedy决策,使得AGV小车选择运行方向存在一定的概率为随机选择;在比较Q值矩阵中各Q值的大小时,当Q值矩阵中各Q值大小相同时,则随机选取一个方向作为AGV小车的运行方向;当Q值矩阵中包括最大的Q值个数为多个时,则随机选取这几个最大的Q值代表的方向作为AGV小车的运行方向。4.根据权利要求2所述的AGV小车导航方法,其特征在于,步骤S23中,Q-learning的奖励机制为:当AGV小车到达目的地时奖励值为1,当AGV小车碰到障碍物时奖励值为-1,其他情况下奖励值均为0。5.根据权利要求2所述的AGV小车导航方法,其特征在于,步骤S23中,根据AGV小车上一位置处的Q值矩阵和AGV小车在当前位置的奖励信息计算AGV小车在当前位置处的Q值矩阵为:Q(S,A)=Q′(S,A)+α[R+γ*max(Q′(S,A))-Q′(S,A)];其中Q(S,A)为AGV小车在当前位置处的Q值矩阵,Q′(S,A)为AGV小车上一位置处的Q值矩阵,R为AGV小车在当前位置的奖励信息,α为学校效率,γ为衰减值;max(Q′(S,A))表示Q值矩阵Q′(S,...
【专利技术属性】
技术研发人员:朱静,魏惠棠,尹邦政,何海城,黄文恺,全永彬,叶谱生,张桂浩,
申请(专利权)人:广州大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。