当前位置: 首页 > 专利查询>朱宁宁专利>正文

一种由学习机制驱动的分布式阻塞流水车间调度优化器制造技术

技术编号:37764715 阅读:15 留言:0更新日期:2023-06-06 13:23
本发明专利技术提出一种由学习机制驱动的分布式阻塞流水车间调度优化器,提出一种应用反向学习和差分进化的分布估计算法,优化节能的分布式阻塞流水车间调度。充分考虑到实际生产中的能耗问题,设计一种考虑总延迟时间和总能耗的初始化方法;为提高种群的质量设计由强化学习和反向学习引导的多种群协同操作,通过多种群协同的方式实现信息交互,加快搜索速度。基于不同种群的具体特征,设计满足对于勘探和开发能力的可调参数变量。为优化以减小总延迟时间和总能耗为目标函数的分布式阻塞流水车间调度问题,提出在不同路径上的加速和减速操作。经在2017测试集及由不同工厂数、工件数、机器数组成的实例上比较,优化器的整体性能优于其他优化器。他优化器。他优化器。

【技术实现步骤摘要】
一种由学习机制驱动的分布式阻塞流水车间调度优化器


[0001]本专利技术属于计算机技术及信息
,涉及一种由学习机制驱动的分布式阻塞流水车间调度优化器。

技术介绍

[0002]连续优化系统涉及到复杂连续优化问题,是工业生产、经济预测和制造系统中以最小化优化目标和最优解向量为目的优化各种指标的常见系统,其计算复杂度随着问题维数的增加呈指数级增长。此外,由于固有的变量不可分性、旋转不变性、非线性等特性,分支定界、线性规划以及传统的数学方法无法有效解决这类问题,在许多实际优化问题中难以准确建立数学模型。
[0003]分布式阻塞流水车间调度问题是存在于各种钢铁生产、铝业加工、有色冶金行业中的典型生产场景,在该场景中工厂的选择、机器的分配、机器的运转速度以及工件的顺序对于企业的生产效率、收益和能耗有直接的影响。因此,设计高效节能的分布式阻塞流水车间调度优化器具有重要的研究意义和价值。
[0004]随着计算机技术的快速应用和机器学习的迅猛发展,智能优化算法在科学研究和实际的工业生产中得以广泛应用
[1]。因此,智能优化算法的研究具有十分重大的现实意义。智能优化算法是基于达尔文的自然选择定律。在每一代中,适应度最高的个体存活到下一代并产生新的个体。这些算法在求解连续实值优化和实际问题中取得了良好的效果。元启发式算法是一种典型的基于种群的智能优化算法,但勘探和开发能力影响了元启发式算法的性能。目前,被学界广泛关注的元启发式算法主要包括:分布估计算法(EDA)、差分进化算法(DE)、果蝇优化算法(FOA)、粒子群优化算法(PSO)等。DE具有性能良好、控制参数少、易于实现、勘探能力强、不受限于具体问题等诸多优点。目前有将DE用于各类优化问题的研究很多。例如,Zhang J在IEEE Transactions on Evolutionary Computation提出的JADE:Adaptive Differential Evolution With Optional External Archive中,提出了带有可选外部存档的自适应差分进化(JADE)算法使用了DE/current

to

pbest/1策略,通过自适应方式更新控制参数,以外部存档的形式调用历史数据,进而指导进化方向,增加了种群的多样性;同时,充分结合当前种群抽取的最优个体信息,提升了收敛速度,尤其适合于高维优化问题。
[0005]分布估计算法(EDA)是一种典型的基于统计概率模型的元启发式方法,通过构建概率模型指导种群的进化方向,可用于局部搜索精细查找最优解。它不同于其他通过交叉和变异操作生成新解的元启发式方法,如差分进化算法、入侵杂草优化和脑风暴优化算法。EDA结合了遗传算法和统计学学习方法选择群体中的优势个体进行建模和估计,生成下一代个体。EDA在进化过程中能够利用变量间隐藏的关系提取和利用有效信息。EDA主要改进的三大方向有:结合其他智能优化算法达到“优势互补”、对于变量关联关系的概率模型的改进、在提升种群多样性方面的改进。

技术实现思路

[0006]本专利技术的目的在于针对现有技术中存在的问题,借助甘肃省教育厅立项资助的研究生“创新之星”项目(编号2023CXZX

476)的支撑,展开相关研究,并提出技术解决方案,具体提出了一种学习机制驱动的分布式阻塞流水车间调度优化器。本专利技术通过提炼智能优化算法的独特特征,调整搜索行为和奖励反馈机制,利用精英策略和历史信息实现多种群的协同自适应演化搜索,通过在连续优化问题中进行性能测试,并在分布式阻塞流水车间调度问题中应用,证明了本专利技术设计的优化器能够减低最大总延迟和总能耗,能够实现节能并提高生产效益。
[0007]为了实现上述目的,本专利技术提供以下技术方案:
[0008]一种由学习机制驱动的分布式阻塞流水车间调度优化器,涉及一种考虑总延迟时间和总能耗的初始化方法,基于多种群协同的全局搜索和局部搜索,基于两个优化指标的关键路径上的加速操作和非关键路径上的减速操作,具体包括步骤1

3:
[0009]步骤1:所述一种考虑总延迟时间和总能耗的初始化方法中,加工时间包括工序之间的转移时间和机器的准备时间;能耗指标不仅考虑了每台机器具有不用的加工速度,还考虑了阻塞状态和空闲状态下机器的能耗;采用节能策略在总延迟时间和总能耗之间权衡。
[0010]目标函数的计算需要考虑三个子问题,即工厂的工件分配、每个工厂中工件的加工顺序以及每台机器上工件的加工速度。首先将初始工件序列按照两个指标进行优先级排序,将排名靠前的工件优先分配到每个工厂的第一个位置;其次,将其他工件顺序插入到具有最优总能耗的位置。
[0011]步骤2:所述基于多种群协同的全局搜索和局部搜索,包括步骤A1

A8:
[0012]步骤A1:DE的操作及策略的选择;
[0013]步骤A1.1:初始化阶段,随机产生初始种群;
[0014]步骤A1.2:变异;
[0015]步骤A1.3:交叉;
[0016]步骤A1.4:选择;较优个体被选择进入后续迭代过程。
[0017]步骤A2:建立EDA概率模型;
[0018]EDA从优势个体抽样,评估样本,建立优势个体的概率模型,进而迭代产生新解。本专利技术采用一种典型的基于种群的增量学习算法(PBIL)。
[0019]每次迭代中,概率向量不断更新。初始阶段,将每个个体的概率均设置为0.5,概率更新原则如公式1和2所示:
[0020][0021][0022]其中,代表第g代第k个种群的第i个个体的概率向量,r代表学习率,代表第g代第k个种群的最优个体的概率向量。
[0023]本专利技术将种群按照适应度值排序,分为三类:优势种群、中等种群、劣势种群,记为{POP1,POP2,POP3},均占33.3%。
[0024]步骤A3:改进DE;
[0025]步骤A3.1:采用改进的变异策略;
[0026][0027]其中,是第k个区域最优个体,分别是第k个区域中任意三个不同的个体;F
i,k
是第k个区域当前代的变异算子;
[0028]步骤A3.2:选择变异算子F
i
[0029]F
i
服从不同的分布对于勘探能力和开发能力影响较大。F
i
取值大时,勘探能力提高;F
i
取值小时开发能力增强。柯西分布相较于高斯分布拖尾更长,有效增大了搜索区域;且莱默平均的均值大于常规数学平均。中等和劣势种群需要较高的勘探能力,扩大查找范围。因此,变异策略中的F
i
采用柯西分布,系数均值采用莱默平均计算。优势种群采用高斯分布,系数均值采用常规的数学平均求解。
[0030]步骤A3.3:选择优秀个体数p;
[0031]选取前100p%个优秀个体进入下轮迭代,其中,p值按照公式4更新:
[0032][0033本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种由学习机制驱动的分布式阻塞流水车间调度优化器,其特征在于,包括:考虑总延迟时间和总能耗的初始化步骤、基于多种群协同的全局搜索和局部搜索步骤,以及基于两个优化指标的关键路径上的加速操作和非关键路径上的减速操作;具体包括以下步骤:步骤1:在考虑总延迟时间和总能耗的初始化步骤中,所述总延迟时间包括工序之间的转移时间和机器的准备时间;所述总能耗考虑每台机器具有不用的加工速度以及阻塞状态和空闲状态下机器的能耗;采用节能策略在所述总延迟时间和所述总能耗之间权衡;步骤2:所述基于多种群协同的全局搜索和局部搜索步骤,包括步骤A1

A8:步骤A1:选择DE的操作及策略;步骤A2:建立EDA概率模型;所述EDA概率模型为典型的基于种群的增量学习算法;每次迭代中,概率向量不断更新;初始阶段,将每个个体的概率均设置为0.5,概率更新原则如公式1和2所示:原则如公式1和2所示:其中,代表第g代第k个种群的第i个个体的概率向量,r代表学习率,代表第g代第k个种群的最优个体的概率向量;将种群按照适应度值排序,分为三类:优势种群、中等种群、劣势种群,记为{POP1,POP2,POP3};步骤A3:改进DE;采用参数自适应以及不同概率分布更新个体;步骤A4:实施反向学习;采用二次反向反射方法生成反向个体,增强系统的勘探能力;步骤A5:建立基于状态空间和动作空间的奖励机制;步骤A6:设计多种群协同变异策略;步骤A6.1:设计优势种群的变异策略:其中,是当前区域最优个体,分别是任意三个不同的个体;F
i,1
是当前代的变异算子;步骤A6.2:设计中等种群的变异策略:其中,代表优势种群中欧式距离最小和中等种群最优的100p%个体;步骤A6.3:设计劣势种群的变异策略:其中,代表优势种群和中等种群中距离最小的100p%个个体;步骤A7:构建多种群EDA概率模型;
步骤A7.1:设置熵,用种群的熵评估算法的收敛程度:其中,Q
i
是概率;步骤A7.2:多种群协同;将优势种群最优个体的概率向量引导本种群的进化,次优个体引导劣势种群实现协同进化,加速收敛;优势种群和中等种群利用各自的最优个体引导本群中的概率向量更新,优势种群的次优个体引导劣势种群的概率向量的更新,快速收敛至局部最优;优势种群和中等种群的更新按照公式7所示:劣势种群的更新按照公式8所示:其中,表示优势种群中次优个体的概率向量;步骤A7.3:设置学习率;随着各种群不断地迭代,好解不断增多,针对特定种群的问题特征,为增强子种群的开发能力,避免陷入局部最优,学习率的设置按照公式9所示;其中,E0是种群的初始熵,m1,m2是固定因子,r

是最大学习率,选择不同的θ值能获得不同的学习率;结合优势种群、次优种群、劣势种群的特征,这里,θ值分别取为:0.02,0.015,0.01;步骤A8:计算并输出最优解;步骤3:所述基于两个优化指标的关键路径上的加速操作和非关键路径上的减速操作,按照步骤B1

B4进行:步骤B1:定义两个关键工厂,分别是:具有最大总延迟时间的工厂和具有最大总能耗的工厂;步骤B2:通过调整工厂中的分配工件的情况以及分配数量降低总延迟时间和总能耗;通过速度的调整实现总能耗和总延迟时间的平衡;步骤B3:通过提高关键路径上的工件的加工速度减小总延时时间;步骤B4:通过降低非关键路径上的工件速度降低总能耗。2.根据权利要求1所述的一种学习机制驱动的分布式阻塞流水车间调度优化器,其特征在于,在步骤1中:目标函数的计算包括以下因素:工厂的工件分配、每个工厂中工件的加工顺序以及每台机器上工件的加工速度。3.根据权利要求1所述的一种学习机制驱动的分布式阻塞流水车间调度优化器,其特征在于,在步骤1中,首先将初始工件序列按照两个指标进行优先级排序,将排名靠前的工件优先分配到每个工厂的第一个位置;其次,将其他工件顺序插入到具有最优总能耗的位置。
4.根据权利要求1所述的一种学习机制驱动的分布式阻塞流水车间调度优化器,其特征在于,在步骤2的子步骤A1中,具体包括子步骤C1

C4:步骤C1:初始化阶段,按照随机产生初始种群;步骤C2:变异;步骤C3:交叉;步骤C4:选择;较优个体被选择进入后续...

【专利技术属性】
技术研发人员:朱宁宁赵付青宋彬张建林许天鹏刘欢左阳李英堂朱波
申请(专利权)人:朱宁宁
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1