一种基于模型强化学习的工业过程控制方法技术

技术编号：43347117 阅读：39 留言：0更新日期：2024-11-15 20:45

本发明专利技术涉及一种基于模型强化学习的工业过程控制方法。本发明专利技术提出的对抗性适应训练方法，利用对抗学习和迁移学习的思想，鼓励概率模型学习对真实控制数据和虚拟控制数据不变的特征，从特征层面明确地解决了真实控制数据和虚拟控制数据分布不匹配问题，有效提高了预测模型的精度，获得大量虚拟控制数据训练智能体，从而利用智能体对工业过程进行自动控制。本发明专利技术，针对无模型深度强化学习采样效率低的缺陷，有模型强化学习中模型预测不准确的问题，提出基于对抗性适应的模型方法。针对多输入单输出工业过程中传统控制通常存在超调和振荡的问题，提出基于模型的深度强化学习的控制方法。对工业过程自动控制具有理论和实际意义。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于工业过程自动化控制，具体说是一种工业过程利用模型强化学习的控制方法。

技术介绍

1、在现代复杂工业过程中，对运行指标的实时控制效果进行优化，保证被控目标尽可能好地跟踪控制器的设定值是控制系统的首要任务。以往传统控制开始向智能制造、无人工厂模式转型。智能制造环境下，工业过程控制信息化程度大幅提升，传感器、机器学习和联网机器的使用不断增加，为机器与系统的实时交互开辟了渠道。同时，在生产过程中积累了大量的实时数据。导致了生产车间积累了大量数据，这些数据蕴藏着大量的经验知识，如果对这些知识进行更高层次的总结与分析，就可以从中挖掘出有价值的规则与知识，构造一个是适当的策略函数，得到具体的行动，从而指导实际生产过程出现的各种动态问题，改善人工调整现状，实现对工业过程的动态智能控制，提高工业生产的自适应性和实时性。

2、实际工业控制系统由于过程动态模型的复杂性、变量间的非线性耦合和系统本身的不确定性机制，难以对整个流程的各个变量的作用机理进行建模，因此，传统的模型驱动的控制方法无法根据不同工况条件下的运行指标实现自适应性调整...

【技术保护点】

1.一种基于模型强化学习的工业过程控制方法，其特征在于，通过如下步骤反复迭代，获取更新后的智能体，所述该智能体用于对工业过程进行控制，使得收益达标，包括如下步骤：

2.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法，其特征在于，所述收益用于判定控制量是否达标。

3.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法，其特征在于，实际松散回潮工业过程中，将增湿水的量作为控制变量at，其余变量作为状态变量st；

4.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法，其特征在于，所述建立概率集成模型，包括以下步骤：

...

【技术特征摘要】

2.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法，其特征在于，所述收益用于判定控制量是否达标。

4.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法，其特征在于，所述建立概率集成模型，包括以下步骤：<...

【专利技术属性】
技术研发人员：潘福成，张博，周晓锋，李帅，刘舒锐，史海波，
申请(专利权)人：中国科学院沈阳自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人