一种基于RL的三相分离器参数设置方法技术

技术编号：39965420 阅读：26 留言：0更新日期：2024-01-09 00:22

本发明专利技术涉及工业控制技术领域，具体为一种基于RL的三相分离器参数设置方法，具体包含如下步骤：1、构建价值函数，确定价值函数的参数；2、构建强化学习系统，并对强化学习系统进行初始化，选择基线控制器；3、构建运行奖励函数，并确定设定奖励；4、借助运行奖励函数、设定奖励、基线控制器以及价值函数对强化学习系统进行迭代训练，直至迭代次数达到设定要求，更新强化学习系统的参数；5、利用训练后的强化学习系统预估三相分离器的参数。本发明专利技术提出一种新的人工智能调参方法，以改进三相分离器的系统响应，为三相分离器的调参提供了一种新的思路和方法。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及工业控制，特别涉及一种基于rl的三相分离器参数设置方法。

技术介绍

1、三相分离器在餐厨垃圾预处理中用于将油、水和固渣进行分离的设备。传统的三相分离器pid控制算法，需要人为的多次的对控制参数进行调整，完全依赖工程师的个人经验，并且在物料或工况发生改变时又需要重新调整，存在技术门槛高并耗费工时等问题。

2、近年来，人工智能技术在控制系统领域得到广泛应用，其中强化学习算法是一种有效的优化方法。标准强化学习包含与环境交互的学习代理。代理代表决策机制，而环境通常代表对象。代理的目标是找到最佳策略，以便通过与通常以马尔可夫决策过程为特征的环境交互来优化长期累积奖励。目前已被广泛应用于控制系统、复杂决策、信号处理等领域，并取得了很好的效果。所以亟待需要一种通过强化学习算法对三相分离器参数设置的方法。

技术实现思路

1、本专利技术提供了一种基于rl的三相分离器参数设置方法，以解决传统的三相分离器pid控制算法采用人工设置，完全依赖工程师的个人经验的技术问题。

2、...

【技术保护点】

1.一种基于RL的三相分离器参数设置方法，其特征在于，具体包含如下步骤：

2.根据权利要求1所述的三相分离器参数设置方法，其特征在于，所述Actor网络μθ(sk)用于根据当前状态选择动作；

3.根据权利要求1所述的三相分离器参数设置方法，其特征在于，所述S3中的运行奖励函数RR(t)具体如下：

4.根据权利要求1所述的三相分离器参数设置方法，其特征在于，所述S4具体包含如下步骤：

5.根据权利要求4所述的三相分离器参数设置方法，其特征在于，所述S43中对强化学习系统的参数进行更新具体包含如下步骤：

6.根据权利要求5所述的三相...

【技术特征摘要】

1.一种基于rl的三相分离器参数设置方法，其特征在于，具体包含如下步骤：

2.根据权利要求1所述的三相分离器参数设置方法，其特征在于，所述actor网络μθ(sk)用于根据当前状态选择动作；

3.根据权利要求1所述的三相分离器参数设置方法，其特征在于，所述s3中的运行奖励函数rr(t)具体如下：

4.根据权利要求1所述的三相分离器参数设置方法，其特征在于，所述s4具体包含如下步骤：

5.根据权利要求4所述的三相分离器参数设置方法，其...

【专利技术属性】
技术研发人员：江未来，郑成宏，蔡田青，陈博，方乐缘，汤琳，王耀南，
申请(专利权)人：湖南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人