System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于agv调度,具体涉及一种基于运行状态分析的agv智能运行调控系统。
技术介绍
1、近年来,人工智能及相关产业正迅速发展壮大,成为学术界、工业界以及世界各国政府关注的焦点,之前发布的《新一代人工智能发展规划》,突出了人工智能研究和产业的国家战略地位。在任务调度领域,基于深度强化学习已经取得了重大进展,但是这些方法大多数只强调了某一特定的调度规则,忽略了整个系统实时动态的任务信息;只适应特定的某一agv调度场景,实际使用效果并不好,容易出现agv小车的碰撞等待耗时长的问题。
技术实现思路
1、本专利技术的目的就在于为了解决上述问题而提供一种结构简单,设计合理的基于运行状态分析的agv智能运行调控系统。
2、本专利技术通过以下技术方案来实现上述目的:
3、本专利技术第一方面提供了一种基于运行状态分析的agv智能运行调控方法,该方法包括,
4、获得环境实时状态信息;
5、基于环境实时状态信息,获得agv状态、地图状态与任务状态;
6、基于agv状态、地图状态与任务状态,获得预测的下一调度选项;
7、基于预测的下一调度选项,调度agv小车。
8、作为本专利技术的进一步优化方案,其中,所述agv状态包括出发点、目标点以及目前任务行驶时间;
9、所述地图装置包括入库点、入库缓冲区、高位缓冲区、出库缓冲区、出库点的agv等待队列和正在行驶任务的agv行驶时间,以及等待区的agv队列;
>10、所述任务状态包括每个出发点的任务的对应目标点。
11、作为本专利技术的进一步优化方案,基于历史数据,获得若干组训练样本,基于训练样本,获得预测模型;
12、xi=(st,at,rt,st+1);
13、at=(agvk,taskl);
14、rt=∑t{-cmap,t-cagv,t};
15、其中,xi为第i个训练样本,st为t时刻的环境状态,at为t时刻采取的动作,表示分配特定agv给特定任务,rt为t时刻采取动作后获得的奖励,包括t时刻地图模块中资源的空闲等待损失和t时刻agv的碰撞等待损失。
16、作为本专利技术的进一步优化方案,其中,训练样本的嵌入矩阵的计算公式为:
17、
18、其中,表示当前模块输入样本的嵌入矩阵,xi1、xi2、…、xin表示当前模块所需要的输入信息,m表示的是可学习的嵌入变换矩阵。
19、作为本专利技术的进一步优化方案,基于所述任务状态与嵌入矩阵,输入transformer,得到样本的特征向量。
20、作为本专利技术的进一步优化方案,将嵌入矩阵经过多个不同的线性变换分别得到查询矩阵q、键矩阵k和值矩阵v,具体公式为:
21、
22、q=qwq;
23、k=kwk;
24、v=vwv;
25、其中,wq、wk、wv表示线性运算矩阵;
26、对q、k、v进行注意力加权,并进行归一化和全连接线性操作,最终得到特征向量,具体公式为:
27、
28、
29、
30、其中,s为注意力加权后的结果,为归一化结果,z为全连接线性操作后的结果,为特征向量,为缩放因子,w1、b1是可自适应学习的参数;ln()表示层归一化运算,其中softmax()表示激活函数,用来计算任务模块中实时状态的attention得分。
31、作为本专利技术的进一步优化方案,其中,在transformer的自我注意力模块中的注意力计算之后和前馈计算之后采用了递归式的跳跃连接。
32、作为本专利技术的进一步优化方案,得到预测的下一调度选项是特征向量经过单层的全连接层和softmax操作得到每个调度选项的得分,取最高得分的调度选项作为当前状态的下一个调度选项的预测结果。
33、本专利技术第二方面提供了一种基于运行状态分析的agv智能运行调控系统,包括以下模块,
34、预处理模块,其被配置为,收集系统中的环境实时状态信息并进行预处理;
35、模型构建模块,其被配置为,构建任务调度模型,所述构建任务调度模型包括agv模块、任务模块、地图模块和预测模块;
36、模型训练模块,其被配置为,将预处理后的环境实时状态信息,对应的动作和奖励作为样本训练任务调度模型;
37、模型预测模块,其被配置为,将所述训练好的任务调度模型进行部署预测;
38、任务调度模型,其被配置为,将实时的环境状态信息输入上述模型内,根据模型预测模块的输出结果预测下一个调度选项。
39、作为本专利技术的进一步优化方案,所述训练任务调度模型,其被配置为,
40、将样本分为agv状态、地图状态、任务状态,并分别对应输入至agv模块、地图模块、任务模块内,agv模块、地图模块输出的特征向量与引入transformer的任务模块输出的特征向量连接在一起,得到当前输入训练样本的特征向量;
41、作为本专利技术的进一步优化方案,将样本的特征向量输入模型训练模块,得到对应动作的奖励,计算所述预测结果与目标模型预测结果之间的均方误差作为训练模型的目标函数,使用随机梯度下降方法训练任务调度模型,得到训练好的任务调度模型。
42、本专利技术的有益效果在于:本专利技术基于transformer和深度强化学习的agv多目标任务调度方式,在利用了自注意力机制处理任务状态,对数据的建模能力强,使得模型可以关注到全局任务信息,学习到不同任务的特征,同时也学习到任务的一般性知识,对于提升任务执行的效率有重大作用;
43、本专利技术提出的任务推荐方法可以动态的对实时环境状态做出反馈,同时利用transformer关注更重要的任务,引入agv碰撞等待耗时可以考虑到agv行驶过程的交通碰撞阻塞情况,更符合特定场景下的agv任务调度。
本文档来自技高网...【技术保护点】
1.一种基于运行状态分析的AGV智能运行调控方法,其特征在于,该方法包括,
2.根据权利要求1所述的一种基于运行状态分析的AGV智能运行调控方法,其特征在于:其中,所述AGV状态包括出发点、目标点以及目前任务行驶时间;
3.根据权利要求2所述的一种基于运行状态分析的AGV智能运行调控方法,其特征在于:基于历史数据,获得若干组训练样本,基于训练样本,获得预测模型;
4.根据权利要求3所述的一种基于运行状态分析的AGV智能运行调控方法,其特征在于:其中,训练样本的嵌入矩阵的计算公式为:
5.根据权利要求4所述的一种基于运行状态分析的AGV智能运行调控方法,其特征在于:基于所述任务状态与嵌入矩阵,输入transformer,得到样本的特征向量。
6.根据权利要求5所述的一种基于运行状态分析的AGV智能运行调控方法,其特征在于:将嵌入矩阵经过多个不同的线性变换分别得到查询矩阵Q、键矩阵K和值矩阵V,具体公式为:
7.根据权利要求6所述的一种基于运行状态分析的AGV智能运行调控方法,其特征在于:其中,在transfor
8.根据权利要求7所述的一种基于运行状态分析的AGV智能运行调控方法,其特征在于:得到预测的下一调度选项是特征向量经过单层的全连接层和Softmax操作得到每个调度选项的得分,取最高得分的调度选项作为当前状态的下一个调度选项的预测结果。
9.一种基于运行状态分析的AGV智能运行调控系统,其特征在于,包括以下模块,
10.根据权利要求9所述的一种基于运行状态分析的AGV智能运行调控系统,其特征在于:所述训练任务调度模型,其被配置为,
...【技术特征摘要】
1.一种基于运行状态分析的agv智能运行调控方法,其特征在于,该方法包括,
2.根据权利要求1所述的一种基于运行状态分析的agv智能运行调控方法,其特征在于:其中,所述agv状态包括出发点、目标点以及目前任务行驶时间;
3.根据权利要求2所述的一种基于运行状态分析的agv智能运行调控方法,其特征在于:基于历史数据,获得若干组训练样本,基于训练样本,获得预测模型;
4.根据权利要求3所述的一种基于运行状态分析的agv智能运行调控方法,其特征在于:其中,训练样本的嵌入矩阵的计算公式为:
5.根据权利要求4所述的一种基于运行状态分析的agv智能运行调控方法,其特征在于:基于所述任务状态与嵌入矩阵,输入transformer,得到样本的特征向量。
6.根据权利要求5所述的一种基于运行状态分析的agv智能运行调控...
【专利技术属性】
技术研发人员:吴小倩,郑益民,
申请(专利权)人:深圳市磅旗科技智能发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。