一种基于模仿学习的任务调度方法及其模型训练方法技术

技术编号：34952967 阅读：61 留言：0更新日期：2022-09-17 12:30

本发明专利技术公开了一种基于模仿学习的任务调度方法及其模型训练方法，属于任务调度技术领域，能够解决现有在解决排列流水车间调度问题时，难以同时满足求解精度和计算效率要求的问题。所述方法包括：S1、获取训练作业样本的特征向量；S2、利用模仿学习方法对训练作业样本的特征向量进行学习，得到训练作业样本的标准调度序列；S3、利用训练作业样本的特征向量和标准调度序列训练策略网络，得到任务调度模型。本发明专利技术用于任务调度。本发明专利技术用于任务调度。本发明专利技术用于任务调度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于模仿学习的任务调度方法及其模型训练方法

[0001]本专利技术涉及一种基于模仿学习的任务调度方法及其模型训练方法，属于任务调度

技术介绍

[0002]排列流水车间调度问题旨在寻找作业的最优置换，在制造系统中具有广泛应用。在排列流水车间调度问题中，一台机器(Machine)对应一项操作(Operation)，该调度问题严格要求所有作业(Job)都按照相同的操作顺序进行处理。通常，任务调度的目标是找到作业的最佳排列，从而使得总制造时长(Make span)实现最小化。总制造时长描述了调度一系列作业时，从第一个任务开始到最后一个任务结束的总处理时间。当调度任务中只有一台机器时，这个排列流水车间调度问题可以被轻松解决。但是对于一个多作业(n>＝2)且多机器(m>＝2)的调度任务来说，该任务的可行解的数量应该是作业数的阶乘(n！)。据此，排列流水车间调度问题可以被视为具有NP
‑
hard属性的组合优化问题，该问题在多项式时间内很难解决。
[0003]近年来，机器学...

【技术保护点】

【技术特征摘要】
1.一种基于模仿学习的任务调度模型训练方法，其特征在于，所述方法包括：S1、获取训练作业样本的特征向量；S2、利用模仿学习方法对所述训练作业样本的特征向量进行学习，得到所述训练作业样本的标准调度序列；S3、利用所述训练作业样本的特征向量和标准调度序列训练策略网络，得到任务调度模型。2.根据权利要求1所述的方法，其特征在于，所述S3具体包括：S31、将所述训练作业样本的特征向量输入所述策略网络的编码器中，获得所述训练作业样本的节点向量；S32、将所述训练作业样本的节点向量输入所述策略网络的解码器中，获得所述训练作业样本的初始调度序列；S33、利用所述训练作业样本的标准调度序列和初始调度序列训练策略网络，得到任务调度模型。3.根据权利要求1所述的方法，其特征在于，所述模仿学习方...

【专利技术属性】
技术研发人员：李隆康，吴保元，
申请(专利权)人：香港中文大学深圳，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人