一种基于QMIX多智能体强化学习的多型混线装调生产线动态调度系统和方法技术方案

技术编号:42494603 阅读:37 留言:0更新日期:2024-08-21 13:12
本发明专利技术属于车间调度技术领域,具体为一种基于QMIX多智能体强化学习的多型混线装调生产线动态调度系统及方法。本发明专利技术以最大化拓扑单元利用率和最小化订单总拖期为目标,设计了结合产品工艺信息和产线资源属性的多维实时特征,制定了任务池中加工产品的选择规则,提出了作业池中拓扑单元和辅助工人的分配规则,构造了目标迁移框架下基于邻接决策点差值的智能体激励函数,进而搭建了多型混线装调生产线多智能体单元,并建立了考虑加工产品返工和拓扑单元失效的多元扰动事件动态响应机制。本发明专利技术通过感知产线实时数据进行科学决策,同时针对多元扰动事件能够动态响应,使得产线保持高效平稳地运作,进而提升企业的生产效率。

【技术实现步骤摘要】

本专利技术属于车间调度,具体涉及一种基于qmix多智能体强化学习的多型混线装调生产线动态调度系统和方法。


技术介绍

1、随着制造模式的不断变革和生产规模的持续扩大,传统的生产制造方式已经难以满足现阶段多样化的制造需求,生产制造企业急需兼具灵活性和高效率的生产方式。伴随着网络信息技术和5g通信技术的发展,制造产业完成信息化和自动化的转型升级,而人工智能技术的迅猛发展,赋能生产制造模式向智能化变革,逐渐成为智能制造的核心内容。生产调度是智能制造的主要模块之一,是制造企业日常生产运作管理的核心技术,能够使得企业在日益激烈的市场竞争中脱颖而出。

2、在实际生产制造中,多型混线装调生产线是一种广泛应用的生产模式,能够满足日益多样化的制造需求。然而,加工产品返工和拓扑单元失效等多元扰动事件经常发生,使得原有的排产方案不再可行。同时,生产运作管理人员难以对多元扰动事件动态响应,无法采取有效方法重新生成高效的排产方案,这使得生产制造过程效率低下。强化学习(reinforcement learning,rl)作为人工智能的核心技术,智能体能够根据所处环境的实时状本文档来自技高网...

【技术保护点】

1.一种基于QMIX多智能体强化学习的多型混线装调生产线动态调度系统,其特征在于,包括多智能体单元和特征状态存储单元,所述特征状态存储单元用于存放产线资源属性多维实时特征;所述多智能体单元包括:

2.根据权利要求1所述的基于QMIX多智能体强化学习的多型混线装调生产线动态调度系统,其特征在于,所述产线资源属性多维实时特征包括:产品完成率特征、任务池中产品加工处理时间特征、任务池中等待加工产品数量特征、拓扑单元利用率特征、拓扑单元正在加工工序的剩余加工时间特征、拓扑单元缓冲区产品数量特征、拓扑单元缓冲区产品加工时间特征、辅助工人剩余工作时间特征、工人正在辅助加工工序的剩余加工时...

【技术特征摘要】

1.一种基于qmix多智能体强化学习的多型混线装调生产线动态调度系统,其特征在于,包括多智能体单元和特征状态存储单元,所述特征状态存储单元用于存放产线资源属性多维实时特征;所述多智能体单元包括:

2.根据权利要求1所述的基于qmix多智能体强化学习的多型混线装调生产线动态调度系统,其特征在于,所述产线资源属性多维实时特征包括:产品完成率特征、任务池中产品加工处理时间特征、任务池中等待加工产品数量特征、拓扑单元利用率特征、拓扑单元正在加工工序的剩余加工时间特征、拓扑单元缓冲区产品数量特征、拓扑单元缓冲区产品加工时间特征、辅助工人剩余工作时间特征、工人正在辅助加工工序的剩余加工时间特征;辅助工人任务表产品数量特征、辅助工人任务表产品加工时间特征和订单中产品总拖期率特征。

3.根据权利要求1所述的基于qmix多智能体强化学习的多型混线装调生产线动态调度系统,其特征在于,所述任务池中加工产品的选择规则为:

4.根据权利要求1所述的基于qmix多智能体强化学习的多型混线装调生产线动态调度系统,其特征在于,所述作业池中可被分配的拓扑单元的分配...

【专利技术属性】
技术研发人员:李新宇周金龙刘齐浩崔航浩李育鑫柳再为迟秀雯
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1