【技术实现步骤摘要】
本专利技术涉及工业控制,特别涉及一种基于rl的三相分离器参数设置方法。
技术介绍
1、三相分离器在餐厨垃圾预处理中用于将油、水和固渣进行分离的设备。传统的三相分离器pid控制算法,需要人为的多次的对控制参数进行调整,完全依赖工程师的个人经验,并且在物料或工况发生改变时又需要重新调整,存在技术门槛高并耗费工时等问题。
2、近年来,人工智能技术在控制系统领域得到广泛应用,其中强化学习算法是一种有效的优化方法。标准强化学习包含与环境交互的学习代理。代理代表决策机制,而环境通常代表对象。代理的目标是找到最佳策略,以便通过与通常以马尔可夫决策过程为特征的环境交互来优化长期累积奖励。目前已被广泛应用于控制系统、复杂决策、信号处理等领域,并取得了很好的效果。所以亟待需要一种通过强化学习算法对三相分离器参数设置的方法。
技术实现思路
1、本专利技术提供了一种基于rl的三相分离器参数设置方法,以解决传统的三相分离器pid控制算法采用人工设置,完全依赖工程师的个人经验的技术问题。
2、
...【技术保护点】
1.一种基于RL的三相分离器参数设置方法,其特征在于,具体包含如下步骤:
2.根据权利要求1所述的三相分离器参数设置方法,其特征在于,所述Actor网络μθ(sk)用于根据当前状态选择动作;
3.根据权利要求1所述的三相分离器参数设置方法,其特征在于,所述S3中的运行奖励函数RR(t)具体如下:
4.根据权利要求1所述的三相分离器参数设置方法,其特征在于,所述S4具体包含如下步骤:
5.根据权利要求4所述的三相分离器参数设置方法,其特征在于,所述S43中对强化学习系统的参数进行更新具体包含如下步骤:
6.根据
...【技术特征摘要】
1.一种基于rl的三相分离器参数设置方法,其特征在于,具体包含如下步骤:
2.根据权利要求1所述的三相分离器参数设置方法,其特征在于,所述actor网络μθ(sk)用于根据当前状态选择动作;
3.根据权利要求1所述的三相分离器参数设置方法,其特征在于,所述s3中的运行奖励函数rr(t)具体如下:
4.根据权利要求1所述的三相分离器参数设置方法,其特征在于,所述s4具体包含如下步骤:
5.根据权利要求4所述的三相分离器参数设置方法,其...
【专利技术属性】
技术研发人员:江未来,郑成宏,蔡田青,陈博,方乐缘,汤琳,王耀南,
申请(专利权)人:湖南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。