The invention discloses a multi-objective optimization control method for transmitting the processing station system, comprising: 1, k = 1, initialization.
【技术实现步骤摘要】
一种用于传送带给料加工站系统的多目标优化控制方法
本专利技术属于生产调度
,具体说是一种用于传送带给料加工站系统的多目标优化控制方法。
技术介绍
在当前智能制造的大背景下,制造企业的核心竞争力不仅包括简单的制造能力,而且需要通过优秀的生产调度算法来合理利用资源和生产设备,提高生产效益和资源利用率,以此达到降低成本增加企业竞争力的目的,推动我国生产制造业的发展。传统的调度方法针对的问题模型较简单,从而不能完全适用于实际生产环境下的问题,算法的使用场景较局限。现实生产环境中往往存在很多不确定性因素(如随机的工件到达时间和加工时间),且需要对多个不相容的目标进行优化,而现存算法往往是针对单个目标进行优化,或是将多个目标通过加权求和转换成单个目标进行优化,难以满足企业对多个目标同时优化的需求。
技术实现思路
本专利技术是为解决上述现有技术存在的不足之处,提出一种用于传送带给料加工站系统的多目标优化控制方法,以期能对生产系统进行有效的在线优化控制,实现存储成本和生产效率两个不相容目标的同时优化。本专利技术为解决技术问题采用如下技术方案:本专利技术一种用于传送带给料加工站系 ...
【技术保护点】
一种用于传送带给料加工站系统的多目标优化控制方法,是应用于由工件(1)、匀速运动的传送带(2)、容量为M的缓冲库(3)、加工站(4)、成品库(5)、红外线感知器(6)、机械臂(7)所组成的传送带给料加工站系统当中;所述传送带给料加工站系统中,定义缓冲库(3)中的剩余量为m,m∈[0,M],M为所述缓冲库(3)的最大容量;以剩余量m作为系统的状态s;所述红外线感知器(6)设置在捡取点(8),以所述红外线感知器(6)所在的位置为起点的一段传送距离作为前视距离vs,vs∈[0,lmax]∪∞,lmax表示最大前视距离;所述工件(1)沿所述传送带(2)随机到达,所述系统根据缓冲库( ...
【技术特征摘要】
1.一种用于传送带给料加工站系统的多目标优化控制方法,是应用于由工件(1)、匀速运动的传送带(2)、容量为M的缓冲库(3)、加工站(4)、成品库(5)、红外线感知器(6)、机械臂(7)所组成的传送带给料加工站系统当中;所述传送带给料加工站系统中,定义缓冲库(3)中的剩余量为m,m∈[0,M],M为所述缓冲库(3)的最大容量;以剩余量m作为系统的状态s;所述红外线感知器(6)设置在捡取点(8),以所述红外线感知器(6)所在的位置为起点的一段传送距离作为前视距离vs,vs∈[0,lmax]∪∞,lmax表示最大前视距离;所述工件(1)沿所述传送带(2)随机到达,所述系统根据缓冲库(3)的剩余量选择一个前视距离vs,若前视距离vs内有工件,则所述机械臂(7)等待工件(1)到达捡取点(8)并卸载到缓冲库(3)中,若前视距离vs内无工件,则所述机械臂(7)从缓冲库(3)中取出工件放入加工站(4)中进行加工,加工完成后取出并放入成品库(5)中;将所述前视距离vs进行离散化定义后,得到行动as∈D={0,1,…,N},其中,行动as=0表示所对应的前视距离vs为零,as=N-1表示所对应的前视距离vs为lmax,as=N表示所对应的前视距离vs为无穷大;D表示行动集合;定义系统的决策时刻为工件卸载完成的时刻或工件完成加工的时刻;其特征是,所述多目标优化控制方法如下:步骤1、定义变量k=1,设当前状态为sk;定义最大学习步数为K;定义值表,并初始化所有状态-行动对下的值向量均为[00];步骤2、在第k个决策时刻,观察系统的当前状态sk,根据贪婪策略控制系统进行加工;步骤2.1、计算k个决策时刻的状态sk的非支配行动集;步骤2.2、产生一个随机数,若所述随机数属于(0,ε),则从非支配行动集中随机选择一个行动,若所述随机数属于(ε,1),则从行动集合D中随机选择一个行动;假设所选择的行动为步骤2.3、若行动所对应的前视距离内有工件,则系统选择等待,直到工件到达捡取点(8)并被卸载到缓冲库(3)中,系统进入第k+1个决策时刻并观察下一状态sk+1,以相邻两个决策时刻的转移过程为卸载过程;若行动所对应的前视距离内无工件,则系统选择加工,从缓冲库中(3)中取出一个工件进行加工,加工完成后系统进入第k+1个决策时刻并观察下一状态sk+1,以相邻两个决策时刻的转移过程为加工过程;步骤3、利用式(1)计算系统从第k个状态sk到第k+1个状态sk+1转移过程的累积奖励式(1)中,Δk为转移过程的时间间隔,为从第k个决策时刻到第k+1个决策时刻转移过程的实时代价,并有:若转移过程为卸载过程,则实时代价由式(2)获得:若转移过程为加工过程,则实时代价由式(3)获得:式(1)中,ηk为第k个决策时刻的性能代价值,并由式(4)获得:式(4)中,Sf和SΔ分别为系统的累计代价和累计逗留时间,并由式(5)和式(6)得到:
【专利技术属性】
技术研发人员:谭琦,胡知强,唐昊,肖奕霖,戴飞,周雷,杨子豪,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。