一种用于传送带给料加工站系统的多目标优化控制方法技术方案

技术编号：17838257 阅读：69 留言：0更新日期：2018-05-03 19:42

本发明专利技术公开了一种用于传送带给料加工站系统的多目标优化控制方法，包括：1、令k＝1，初始化

A multi-objective optimization control method for conveying feeder processing station system

The invention discloses a multi-objective optimization control method for transmitting the processing station system, comprising: 1, k = 1, initialization.

全部详细技术资料下载

【技术实现步骤摘要】
一种用于传送带给料加工站系统的多目标优化控制方法
本专利技术属于生产调度
，具体说是一种用于传送带给料加工站系统的多目标优化控制方法。
技术介绍
在当前智能制造的大背景下，制造企业的核心竞争力不仅包括简单的制造能力，而且需要通过优秀的生产调度算法来合理利用资源和生产设备，提高生产效益和资源利用率，以此达到降低成本增加企业竞争力的目的，推动我国生产制造业的发展。传统的调度方法针对的问题模型较简单，从而不能完全适用于实际生产环境下的问题，算法的使用场景较局限。现实生产环境中往往存在很多不确定性因素(如随机的工件到达时间和加工时间)，且需要对多个不相容的目标进行优化，而现存算法往往是针对单个目标进行优化，或是将多个目标通过加权求和转换成单个目标进行优化，难以满足企业对多个目标同时优化的需求。
技术实现思路
本专利技术是为解决上述现有技术存在的不足之处，提出一种用于传送带给料加工站系统的多目标优化控制方法，以期能对生产系统进行有效的在线优化控制，实现存储成本和生产效率两个不相容目标的同时优化。本专利技术为解决技术问题采用如下技术方案：本专利技术一种用于传送带给料加工站系...
一种用于传送带给料加工站系统的多目标优化控制方法

【技术保护点】
一种用于传送带给料加工站系统的多目标优化控制方法，是应用于由工件(1)、匀速运动的传送带(2)、容量为M的缓冲库(3)、加工站(4)、成品库(5)、红外线感知器(6)、机械臂(7)所组成的传送带给料加工站系统当中；所述传送带给料加工站系统中，定义缓冲库(3)中的剩余量为m，m∈[0,M]，M为所述缓冲库(3)的最大容量；以剩余量m作为系统的状态s；所述红外线感知器(6)设置在捡取点(8)，以所述红外线感知器(6)所在的位置为起点的一段传送距离作为前视距离vs，vs∈[0,lmax]∪∞，lmax表示最大前视距离；所述工件(1)沿所述传送带(2)随机到达，所述系统根据缓冲库(3)的剩余量选择一个...

【技术特征摘要】
1.一种用于传送带给料加工站系统的多目标优化控制方法，是应用于由工件(1)、匀速运动的传送带(2)、容量为M的缓冲库(3)、加工站(4)、成品库(5)、红外线感知器(6)、机械臂(7)所组成的传送带给料加工站系统当中；所述传送带给料加工站系统中，定义缓冲库(3)中的剩余量为m，m∈[0,M]，M为所述缓冲库(3)的最大容量；以剩余量m作为系统的状态s；所述红外线感知器(6)设置在捡取点(8)，以所述红外线感知器(6)所在的位置为起点的一段传送距离作为前视距离vs，vs∈[0,lmax]∪∞，lmax表示最大前视距离；所述工件(1)沿所述传送带(2)随机到达，所述系统根据缓冲库(3)的剩余量选择一个前视距离vs，若前视距离vs内有工件，则所述机械臂(7)等待工件(1)到达捡取点(8)并卸载到缓冲库(3)中，若前视距离vs内无工件，则所述机械臂(7)从缓冲库(3)中取出工件放入加工站(4)中进行加工，加工完成后取出并放入成品库(5)中；将所述前视距离vs进行离散化定义后，得到行动as∈D＝{0,1,…,N}，其中，行动as＝0表示所对应的前视距离vs为零，as＝N-1表示所对应的前视距离vs为lmax，as＝N表示所对应的前视距离vs为无穷大；D表示行动集合；定义系统的决策时刻为工件卸载完成的时刻或工件完成加工的时刻；其特征是，所述多目标优化控制方法如下：步骤1、定义变量k＝1，设当前状态为sk；定义最大学习步数为K；定义值表，并初始化所有状态-行动对下的值向量均为[00]；步骤2、在第k个决策时刻，观察系统的当前状态sk，根据贪婪策略控制系统进行加工；步骤2.1、计算k个决策时刻的状态sk的非支配行动集；步骤2.2、产生一个随机数，若所述随机数属于(0,ε)，则从非支配行动集中随机选择一个行动，若所述随机数属于(ε,1)，则从行动集合D中随机选择一个行动；假设所选择的行动为步骤2.3、若行动所对应的前视距离内有工件，则系统选择等待，直到工件到达捡取点(8)并被卸载到缓冲库(3)中，系统进入第k+1个决策时刻并观察下一状态sk+1，以相邻两个决策时刻的转移过程为卸载过程；若行动所对应的前视距离内无工件，则系统选择加工，从缓冲库中(3)中取出一个工件进行加工，加工完成后系统进入第k+1个决策时刻并观察下一状态sk+1，以相邻两个决策时刻的转移过程为加工过程；步骤3、利用式(1)计算系统从第k个状态sk到第k+1个状态sk+1转移过程的累积奖励式(1)中，Δk为转移过程的时间间隔，为从第k个决策时刻到第k+1个决策时刻转移过程的实时代价，并有：若转移过程为卸载过程，则实时代价由式(2)获得：若转移过程为加工过程，则实时代价由式(3)获得：式(1)中，ηk为第k个决策时刻的性能代价值，并由式(4)获得：式(4)中，Sf和SΔ分别为系统的累计代价和累计逗留时间，并由式(5)和式(6)得到：

【专利技术属性】
技术研发人员：谭琦，胡知强，唐昊，肖奕霖，戴飞，周雷，杨子豪，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人