当前位置: 首页 > 专利查询>南宁学院专利>正文

一种污水处理的强化学习控制方法技术

技术编号:19777400 阅读:27 留言:0更新日期:2018-12-15 10:59
本发明专利技术提供了一种污水处理的强化学习控制方法;在现场控制器控制的过程中,获取现场控制器的输入信号,并将现场控制器的输出指令和强化学习模型的输出指令合并为最终输出指令输出控制,其中强化学习模型的输出指令中数值在最终输出指令总数值的占比为N,N从0逐渐增大至100%。本发明专利技术通过渐进比例提高强化学习模型控制权的方式,能有效在将强化学习模型的数据收集过程、训练学习过程放在实际场景中,而避免原始数据积累和虚拟环境搭建的过程,从而有效降低企业在应用强化学习的方式进行自动控制时所需的成本,方便用户完成从传统控制倒强化学习控制的过程。

【技术实现步骤摘要】
一种污水处理的强化学习控制方法
本专利技术涉及一种污水处理的强化学习控制方法。
技术介绍
目前,强化学习在工业控制中的应用逐渐增多,但一般都限于特定的模型,其主要原因在于强化学习的训练需要环境支持,而在很多污水处理控制方面,完全模拟真实场景的环境所需要的计算量远远大于强化学习模型训练本身所需要的计算量,导致得不偿失,而且就目前的企业技术发展而言,原始的数据积累也很成问题。
技术实现思路
为解决上述技术问题,本专利技术提供了一种污水处理的强化学习控制方法,该污水处理的强化学习控制方法通过渐进比例提高强化学习模型控制权的方式,能有效在将强化学习模型的数据收集过程、训练学习过程放在实际场景中,而避免原始数据积累和虚拟环境搭建的过程。本专利技术通过以下技术方案得以实现。本专利技术提供的一种污水处理的强化学习控制方法;在现场控制器控制的过程中,获取现场控制器的输入信号,并将现场控制器的输出指令和强化学习模型的输出指令合并为最终输出指令输出控制,其中强化学习模型的输出指令中数值在最终输出指令总数值的占比为N,N从0逐渐增大至100%;当强化学习模型的输出指令中数值在最终输出指令总数值的占比为100%本文档来自技高网...

【技术保护点】
1.一种污水处理的强化学习控制方法,其特征在于:在现场控制器控制的过程中,获取现场控制器的输入信号,并将现场控制器的输出指令和强化学习模型的输出指令合并为最终输出指令输出控制,其中强化学习模型的输出指令中数值在最终输出指令总数值的占比为N,N从0逐渐增大至100%;当强化学习模型的输出指令中数值在最终输出指令总数值的占比为100%时,切断现场控制器控制的输入和输出。

【技术特征摘要】
1.一种污水处理的强化学习控制方法,其特征在于:在现场控制器控制的过程中,获取现场控制器的输入信号,并将现场控制器的输出指令和强化学习模型的输出指令合并为最终输出指令输出控制,其中强化学习模型的输出指令中数值在最终输出指令总数值的占比为N,N从0逐渐增大至100%;当强化学习模型的输出指令中数值在最终输出指令总数值的占比为100%时,切断现场控制器控制的输入和输出。2.如权利要求1所述的污水处理的强化学习控制方法,其特征在于:所述将现场控制器的输出指令和强化学习模型的输出指令合并为最终输出指令输出,采用如下步骤:a.获取现场控制器的输出指令和强化学习模型的输出指令;b.将现场控制器的输出指令和强化学习模型的输出指令中的数值取出为现场控制器输出指令数值和强化学习模型输出指令数值;c.将强化学习模型输出指令数值乘以系数N后更新为新的强化学习模型输出指令数值;d.将现场控制器输出指令数值乘以系数(1-N)后更新为新的现场控制器输出指令数值;e.将新的现场控制器输出指令数值和新的强化学习模型输出指令数值叠加得到输出指令叠加值;f.将输出指令叠加值封装为输出指令发送指令。。3.如权利要求1所述的污水处理的强化学习控制方法,其特征在于:所述...

【专利技术属性】
技术研发人员:黄孝平文芳一黄文哲
申请(专利权)人:南宁学院
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1