【技术实现步骤摘要】
一种生物质热电站SCR过程强化学习控制方法
[0001]本专利技术属于非电变量的控制或调节系统的
,特别涉及一种生物质热电站SCR过程强化学习控制方法。
技术介绍
[0002]生物质能作为一种清洁可再生能源,具有环境友好和能量利用率高等优点,是我国仅次于煤、石油、天然气的第四大能源。目前我国生物质能的资源主要有秸秆、木质残余物、禽畜粪便和能源作物,通过燃烧实现生物质能的资源化利用,而生物质热电联产是生物质能高效资源化利用的最直接和最有效的途径。生物质热电站锅炉燃烧排放的烟气含有氮氧化物,容易造成雾霾、酸雨等严重的环境污染问题,需要进行烟气联合脱硝处理。
[0003]目前,生物质热电站主要采用选择性催化还原(Selective Catalytic Reduction,SCR)法对锅炉燃烧烟气进行脱硝处理。在生物质热电站SCR过程控制中,常用的自动控制技术是PID控制方法,通过PID控制器自动调整还原剂(如液氨、NH3、尿素)的流量,来“有选择性”地与烟气中NO
x
反应并生成无毒、无污染的N2和H ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种生物质热电站SCR过程强化学习控制方法,其特征在于:构建生物质热电站SCR过程学习模型,选取若干变量作为动作值,以生物质热电站的脱硝处理效率作为状态值,设置各参数变量取值范围,确定SCR过程中满足条件的最优可控动作参数集;以最优可控动作参数集优化生物质热电站SCR过程的脱硝效率与经济成本。2.根据权利要求1所述的一种生物质热电站SCR过程强化学习控制方法,其特征在于:作为动作值的所述变量包括机组负荷、还原剂流量、SCR入口烟气O2量、SCR入口烟气温度和SCR入口NO
x
浓度,脱硝处理效率为式(1),其中,η为脱硝处理效率,I
noxin
为SCR入口NO
x
浓度,I
noxout
为SCR出口NO
x
浓度。3.根据权利要求2所述的一种生物质热电站SCR过程强化学习控制方法,其特征在于:以脱销处理成本T作为模型的奖励函数,控制还原剂质量流量。4.根据权利要求3所述的一种生物质热电站SCR过程强化学习控制方法,其特征在于:脱硝处理成本如式(2),其中,P
NH3
为还原剂量的单价,M
NH3
为总还原剂量,L为机组负荷。5.根据权利要求1所述的一种生物质热电站SCR过程强化学习控制方法,其特征在于:所述生物质热电站SCR过程学习模型基于DDPG算法,构建关联的Actor网络和Critic网络,Actor网络和Critic网络都包含两个隐藏层网络,分别设置每层神经元个数;Actor网络最后一层的激活函数为tanh函数,使得每一层的动作输出控制在[
‑
1,1]之间,最终依据脱硝处理效率状态值限定范围得到脱硝处理过程各运行参数可控值;Critic网络对Actor网络得到的脱硝处理过程可控参数进行评估,采用relu激活函数。6.根据权利要求5所述的一种生物质热电站SCR过程强化学习控制方法,其特征在于:确定SCR过程中满足条件的最优可控动作参数集包括以下步骤:步骤1:随机初始化Critic网络Q(s,a|θ
μ
)和Actor网络μ(s|θ
μ
),初始权重分别为θ
Q
和θ
μ
;步骤2:初始化目标网络Q
′
和μ
′
,初始权重为θ
Q
′
←
技术研发人员:何德峰,操佩颐,李廉明,王秀丽,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。