一种炼钢生产调度方法、系统、介质及电子终端技术方案

技术编号:29674812 阅读:17 留言:0更新日期:2021-08-13 21:57
本发明专利技术提供一种炼钢生产调度方法、系统、介质及电子终端,炼钢生产调度方法包括:构建炼钢仿真模型;控制炼钢仿真模型将仿真生产状态信息输入神经网络进行训练,获取强化学习模型;采集实时生产状态信息;将实时生产状态信息输入强化学习模型进行强化学习,获取较优的调度参数;根据调度参数,进行炼钢生产调度;本发明专利技术中的炼钢生产调度方法,通过控制炼钢仿真模型将仿真生产状态信息输入神经网络进行训练,获取强化学习模型,并将实时生产状态信息输入强化学习模型进行强化学习,进而进行生产调度,能够对炼钢生产进行自动调度,自动化、智能化程度较高,精确度较高,通用性较强。

【技术实现步骤摘要】
一种炼钢生产调度方法、系统、介质及电子终端
本专利技术涉及钢铁生产调度领域,尤其涉及一种炼钢生产调度方法、系统、介质及电子终端。
技术介绍
随着传统钢铁产业的信息化升级革新,我国钢铁企业也在加速探索对传统钢厂的数字化、智能化和无人化改造。生产调度环节是钢铁生产过程中的指挥核心环节之一,目前通常采用人工的方式进行炼钢生产调度安排,对人工经验的依赖程度较高,可能编出生产成本较高的方案,较容易给企业带来一定的损失,且自动化、智能化及无人化程度较低。
技术实现思路
本专利技术提供一种炼钢生产调度方法、系统、介质及电子终端,以解决现有技术中采用人工的方式进行炼钢生产调度安排,较容易给企业带来一定的损失,且自动化、智能化及无人化程度较低的问题。本专利技术提供的炼钢生产调度方法,包括:构建炼钢仿真模型;控制所述炼钢仿真模型将仿真生产状态信息输入神经网络进行训练,获取强化学习模型;采集实时生产状态信息;将所述实时生产状态信息输入所述强化学习模型进行强化学习,获取较优的调度参数;根据所述调度参数,进行炼钢生产调度。可选的,根据所述调度参数,进行炼钢生产调度的步骤包括:将所述调度参数输入所述炼钢仿真模型进行生产调度仿真与可行性校验,获取校验结果,其中,进行可行性校验的步骤包括:判断生产调度仿真的过程中连铸是否断浇,若连铸断浇,则判定校验结果为失败,若连铸未断浇,则判定校验结果为成功;根据所述校验结果,进行炼钢生产调度。可选的,将所述仿真生产状态信息输入所述神经网络进行训练的步骤包括:调度参数预测和误差反馈;所述调度参数预测的步骤包括:根据所述仿真生产状态信息和预设的生产调度策略,进行调度参数预测,所述仿真生产状态信息至少包括以下之一:行车位置信息、行车已接收任务的等待时间、行车正在作业的剩余时间、行车任务优先级、工位剩余作业时间、工位位置、工位状态信息、工位加工钢种信息和工位排队等待时间信息。可选的,将所述调度参数输入所述炼钢仿真模型进行生产调度,获取各工位工作时间和连铸连浇状态;根据所述各工位工作时间和连铸连浇状态,利用预先设置的强化学习奖赏函数,对所述神经网络进行反馈优化,进而获取强化学习模型;所述强化学习奖赏函数包括:第一奖赏函数和第二奖赏函数,当所述连铸连浇状态为连铸成功时,则利用所述第一奖赏函数,对所述神经网络进行反馈优化;所述第一奖赏函数的数学表达为:其中,f(x)1为第一奖赏函数,α为预设的第一权值,T1为当前各工位工作总时间,T0为连铸机完成连铸所需工作时间。可选的,当所述连铸连浇状态为连铸中时,则利用所述第二奖赏函数,对所述神经网络进行反馈优化;当所述连铸连浇状态为连铸断浇时,则判定对应的调度参数异常,进而对所述神经网络进行反馈优化;所述第二奖赏函数的数学表达为:其中,f(x)2为第二奖赏函数,β为预设的第二权值,T2为当前连铸机的工作时间。可选的,将所述仿真生产状态信息输入所述神经网络进行训练的步骤还包括:将所述调度参数输入所述炼钢仿真模型进行生产调度仿真,获取调度后的仿真生产状态信息;将调度后的仿真生产状态信息输入所述神经网络进行训练,获取较优的强化学习模型。可选的,构建炼钢仿真模型的步骤包括:获取仿真运行参数,所述仿真运行参数至少包括以下之一:浇次计划、炉次计划、工艺路线参数、维修计划、设备可靠性参数和设备作业时间参数;根据所述仿真运行参数,构建炼钢仿真模型。本专利技术还提供一种炼钢生产调度系统,包括:仿真模块,用于构建炼钢仿真模型;训练模块,用于控制所述炼钢仿真模型将仿真生产状态信息输入神经网络进行训练,获取强化学习模型;采集模块,用于采集实时生产状态信息;处理模块,用于将所述实时生产状态信息输入所述强化学习模型进行强化学习,获取较优的调度参数;调度模块,用于根据所述调度参数,进行炼钢生产调度;所述仿真模块、训练模块、采集模块、处理模块和调度模块连接。本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述方法。本专利技术还提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如上述任一项所述方法。本专利技术的有益效果:本专利技术中的炼钢生产调度方法、系统、介质及电子终端,通过构建炼钢仿真模型,控制所述炼钢仿真模型将仿真生产状态信息输入神经网络进行训练,获取强化学习模型,并将所述实时生产状态信息输入所述强化学习模型进行强化学习,获取较优的调度参数,进而进行炼钢生产调度,能够对炼钢生产进行自动调度,减少对人工的依赖,自动化、智能化程度较高,调度精确度较高,通用性较强。附图说明图1是本专利技术实施例中炼钢生产调度方法的一流程示意图。图2是本专利技术实施例中炼钢生产调度方法的另一流程示意图。图3是本专利技术实施例中炼钢生产调度方法的一信息交互示意图。图4是本专利技术实施例中炼钢生产调度方法的另一信息交互示意图。图5是本专利技术实施例中炼钢生产调度系统的结构示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。专利技术人发现,随着传统钢铁产业的信息化升级革新,我国钢铁企业也在加速探索对传统钢厂的数字化、智能化和无人化改造。生产调度环节是钢铁生产过程中的指挥核心环节之一,由于炼钢工序具有连续系统和离散系统的生产特征,需要将物流和生产紧密衔接,因此必须对工位人机料法环等多因素进行综合考虑,才能得到较佳的调度策略,目前通常采用人工的方式进行炼钢生产调度安排,对人工经验的依赖程度较高,可能编出生产成本较高的方案,较容易给企业带来一定的损失,且自动化、智能化及无人化程度较低,因此,专利技术人提出一种炼钢生产调度方法、系统、介质及电子终端,通过构建炼钢仿真模型,控制所述炼钢仿真模型输出仿真生产状态信息,将所述仿真生产状态信息输入神经网络进行训练,获取强化学习模型,所述强化学习模型能够较有效地解决炼钢生产调度复杂的组合优化问题,并将所述实时生产状态信息输入所述强化学习模型进行强化学习,获取较优的调度参数,进而进行炼钢生产调度,能够对炼钢生产进行自动本文档来自技高网...

【技术保护点】
1.一种炼钢生产调度方法,其特征在于,包括:/n构建炼钢仿真模型;/n控制所述炼钢仿真模型将仿真生产状态信息输入神经网络进行训练,获取强化学习模型;/n采集实时生产状态信息;/n将所述实时生产状态信息输入所述强化学习模型进行强化学习,获取较优的调度参数;/n根据所述调度参数,进行炼钢生产调度。/n

【技术特征摘要】
1.一种炼钢生产调度方法,其特征在于,包括:
构建炼钢仿真模型;
控制所述炼钢仿真模型将仿真生产状态信息输入神经网络进行训练,获取强化学习模型;
采集实时生产状态信息;
将所述实时生产状态信息输入所述强化学习模型进行强化学习,获取较优的调度参数;
根据所述调度参数,进行炼钢生产调度。


2.根据权利要求1所述的炼钢生产调度方法,其特征在于,根据所述调度参数,进行炼钢生产调度的步骤包括:
将所述调度参数输入所述炼钢仿真模型进行生产调度仿真与可行性校验,获取校验结果,其中,进行可行性校验的步骤包括:
判断生产调度仿真的过程中连铸是否断浇,若连铸断浇,则判定校验结果为失败,若连铸未断浇,则判定校验结果为成功;
根据所述校验结果,进行炼钢生产调度。


3.根据权利要求1所述的炼钢生产调度方法,其特征在于,将所述仿真生产状态信息输入所述神经网络进行训练的步骤包括:调度参数预测和误差反馈;
所述调度参数预测的步骤包括:根据所述仿真生产状态信息和预设的生产调度策略,进行调度参数预测,所述仿真生产状态信息至少包括以下之一:行车位置信息、行车已接收任务的等待时间、行车正在作业的剩余时间、行车任务优先级、工位剩余作业时间、工位位置、工位状态信息、工位加工钢种信息和工位排队等待时间信息。


4.根据权利要求1所述的炼钢生产调度方法,其特征在于,将所述调度参数输入所述炼钢仿真模型进行生产调度,获取各工位工作时间和连铸连浇状态;
根据所述各工位工作时间和连铸连浇状态,利用预先设置的强化学习奖赏函数,对所述神经网络进行反馈优化,进而获取强化学习模型;
所述强化学习奖赏函数包括:第一奖赏函数和第二奖赏函数,当所述连铸连浇状态为连铸成功时,则利用所述第一奖赏函数,对所述神经网络进行反馈优化;
所述第一奖赏函数的数学表达为:



其中,f(x)1为第一奖赏函数,α为预设的第一权值,T1为当前各工位工作总时间,T0为连铸机完成连铸所需工作时间。


...

【专利技术属性】
技术研发人员:徐林伟彭静张波姜根成
申请(专利权)人:中冶赛迪重庆信息技术有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1