【技术实现步骤摘要】
本专利技术属于工业过程自动化控制,具体说是一种工业过程利用模型强化学习的控制方法。
技术介绍
1、在现代复杂工业过程中,对运行指标的实时控制效果进行优化,保证被控目标尽可能好地跟踪控制器的设定值是控制系统的首要任务。以往传统控制开始向智能制造、无人工厂模式转型。智能制造环境下,工业过程控制信息化程度大幅提升,传感器、机器学习和联网机器的使用不断增加,为机器与系统的实时交互开辟了渠道。同时,在生产过程中积累了大量的实时数据。导致了生产车间积累了大量数据,这些数据蕴藏着大量的经验知识,如果对这些知识进行更高层次的总结与分析,就可以从中挖掘出有价值的规则与知识,构造一个是适当的策略函数,得到具体的行动,从而指导实际生产过程出现的各种动态问题,改善人工调整现状,实现对工业过程的动态智能控制,提高工业生产的自适应性和实时性。
2、实际工业控制系统由于过程动态模型的复杂性、变量间的非线性耦合和系统本身的不确定性机制,难以对整个流程的各个变量的作用机理进行建模,因此,传统的模型驱动的控制方法无法根据不同工况条件下的运行指标实现自适应性调整
...【技术保护点】
1.一种基于模型强化学习的工业过程控制方法,其特征在于,通过如下步骤反复迭代,获取更新后的智能体,所述该智能体用于对工业过程进行控制,使得收益达标,包括如下步骤:
2.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法,其特征在于,所述收益用于判定控制量是否达标。
3.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法,其特征在于,实际松散回潮工业过程中,将增湿水的量作为控制变量at,其余变量作为状态变量st;
4.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法,其特征在于,所述建立概率集成模型,包括以下
...
【技术特征摘要】
1.一种基于模型强化学习的工业过程控制方法,其特征在于,通过如下步骤反复迭代,获取更新后的智能体,所述该智能体用于对工业过程进行控制,使得收益达标,包括如下步骤:
2.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法,其特征在于,所述收益用于判定控制量是否达标。
3.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法,其特征在于,实际松散回潮工业过程中,将增湿水的量作为控制变量at,其余变量作为状态变量st;
4.根据权利要求1所述的一种基于模型强化学习的工业过程控制方法,其特征在于,所述建立概率集成模型,包括以下步骤:<...
【专利技术属性】
技术研发人员:潘福成,张博,周晓锋,李帅,刘舒锐,史海波,
申请(专利权)人:中国科学院沈阳自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。