一种面向非线性间歇过程下的深度强化学习优化补偿方法技术

技术编号:43880233 阅读:26 留言:0更新日期:2024-12-31 19:03
一种面向非线性间歇过程下的深度强化学习优化补偿方法,将三维输入数据矩阵展开成二维矩阵;进行标准化处理;构建JY‑KPLS模型;构造JY‑KPLS模型优化问题;求解优化问题;计算历史与查询数据的相似性;根据相似性大小,从旧、新过程数据集中分别筛选出m条旧数据、n条新数据,并与当前查询数据进行作差;以偏差样本作为数据集,建立JITL‑JYKPLS局部模型,解决失配问题;对补偿后模型与优化系统进行交互、试错训练;若当前批次内训练总奖励值超过前一批次内训练总奖励值,则将当前训练好的优化系统用于批次间优化;否则,采用前一批次优化系统用于批次间优化;输出最终产品质量。该方法可显著提升最终产品的质量。

【技术实现步骤摘要】

本专利技术属于工业生产过程的运行优化,具体是一种面向非线性间歇过程下的深度强化学习优化补偿方法


技术介绍

1、在流程工业中,间歇过程作为一个重要的分支,具有“多重时变”特性,是许多高附加值、小规模、多操作阶段产品的生产方式。这种多工序、小规模的生产方式能够很好地适应现代流程工业中市场需求的快速变化。在精细化工、生物制药、食品、聚合物反应、金属加工等生产领域,间歇过程均具有着非常重要的地位,并且受到了广泛的赞誉。随着工业的不断发展,日益激烈的市场竞争环境对企业和产品提出了更高的要求,高效稳定的生产过程越来越受到重视,为了进一步提高产品质量和生产效率,生产过程的运行优化逐渐成为研究的焦点。对于间歇过程,由于存在非线性、时变性和不确定性等因素,如何在保证产品质量的同时最大化生产总效益,具有极其重要的实际意义。而关于运行优化的研究通常是建立在质量预测模型的基础上展开的,质量预测模型可以分为机理模型和数据驱动模型两大类。然而,对于较为复杂的工业系统,通常难以构建准确可靠的机理模型。因此,这类基于机理模型的方法很难在现代工业中得到广泛的应用。数据驱动建模的方式则以其本文档来自技高网...

【技术保护点】

1.一种面向非线性间歇过程下的深度强化学习优化补偿方法,包括间歇生产过程A和间歇生产过程B,所述间歇生产过程A为经过较长时间生产的旧生产过程,具有充分的历史运行数据及运行控制经验,所述间歇生产过程B为即将投产的新生产过程;同时,间歇生产过程A和间歇生产过程B具备相同或相近的生产设备,且间歇生产过程A和间歇生产过程B的最终产品属于一个产品族中,其特征在于,包括以下步骤:

【技术特征摘要】

1.一种面向非线性间歇过程下的深度强化学习优化补偿方法,包括间歇生产过程a和间歇生产过程b,所述间歇生产过程a为经过较长时间生产的旧生产过程,具有充分的历史运行数据及运行控制经验,所述间...

【专利技术属性】
技术研发人员:褚菲吴振明李翔王建文张恩泽贾润达何大阔
申请(专利权)人:中国矿业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1