【技术实现步骤摘要】
一种基于迭代学习控制的批次反应釜控制方法的生成方法
[0001]本专利技术涉及自动控制领域,具体指有一种基于迭代学习控制的批次反应釜控制方法的生成方法。
技术介绍
[0002]目前对批次反应釜进行控制的主要方法为迭代学习控制(Iterative Learning Control,ILC)。这种控制算法通过利用之前批次得到的误差信息对控制输入进行优化,使得控制器在批次任务这类重复性任务中不断逼近最优控制策略。
[0003]由于实际生产过程重复性不高,对于前馈型迭代学习控制算法来说,仅利用之前批次过程的控制信息进行策略优化会导致鲁棒性下降,因此现有的迭代学习控制算法无法对非重复目标轨迹的批次反应过程进行有效控制。并且,实际生产过程生产周期长,对生产安全要求高,仅利用反馈信息以及探索更新的方式进行控制任务需要大量的学习时间以及有几率产生违反安全生产的策略。现有的学习算法无法结合迭代数据和实时数据生成更具优势的控制方法。
[0004]针对上述的现有技术存在的问题设计一种基于迭代学习控制的批次反应釜控制方法的生成方法是 ...
【技术保护点】
【技术特征摘要】
1.一种基于迭代学习控制的批次反应釜控制方法的生成方法,其特征在于:所述迭代学习控制包含迭代学习控制算法和强化学习算法,所述方法包含以下步骤:S1,调试批次反应釜,使其处于初始稳定工作点,根据反应工艺参数设定目标控制轨迹;S2,通过迭代学习控制算法对所述批次反应釜进行多批次的轨迹跟踪;采集所述批次反应釜的多批次数据并存入经验回放池中,所述多批次数据包含输入数据、输出数据以及物理状态数据;S3,通过强化学习控制算法提取所述多批次数据,生成初始控制策略;S4,通过强化学习控制算法对所述批次反应釜实时轨迹跟踪;采集所述批次反应釜的实时数据并存入经验回放池中,所述实时数据包含输入数据、输出数据以及物理状态数据;S5,通过强化学习控制算法利用所述多批次数据和所述实时数据对所述初始控制策略进行多次更新优化,直到得到稳定控制策略。2.根据权利要求1所述的一种基于迭代学习控制的批次反应釜控制方法的生成方法,其特征在于:所述迭代学习控制算法为P
‑
型迭代学习控制算法。3.根据权利要求2所述的一种基于迭代学习控制的批次反应釜控制方法的生成方法,其特征在于:所述P
‑
型迭代学习控制算法为前馈型控制算法。4.根据权利要求1所述的一种基于迭代学习控制的批次反应釜控制方法的生成方法,其特征在于:所述强化学习控制算法为深度确定性策略梯度强化学习算法。5.根据权利要求1所述的一种基于迭代学习控制的批次反应釜控制方法的生成方法,其特征在...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。