当前位置: 首页 > 专利查询>中国华能集团清洁能源技术研究院有限公司专利>正文

一种多源热网加热器优化调度方法、系统、设备及介质技术方案

技术编号：35407947 阅读：11 留言：0更新日期：2022-11-03 11:02

本发明专利技术公开了一种多源热网加热器优化调度方法、系统、设备及介质，S1，采用深度确定性策略梯度强化学习算法对热负荷进行分配试错探索，得到热网供水温度设定值；S2，热网供水温度设定值输入至广义预测控制层，得到热负荷指令；S3，热负荷指令输入至PID阀门基础控制层，对阀门开度进行调节。解决多源热网调度过程中依赖人工经验，系统运行低效，调度经济性不高的问题。的问题。的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种多源热网加热器优化调度方法、系统、设备及介质

[0001]本专利技术属于热网热负荷调度领域，涉及一种多源热网加热器优化调度方法、系统、设备及介质。

技术介绍

[0002]目前在我国居民供热中，主要由热电厂对外提供供热抽汽对居民热网循环水进行加热，但往往由于热网供热面积和热网传输长度的制约，在热电厂对外供热调整中往往采用粗放的调整模式，仅仅根据当前汽温以及热网回水温度进行粗放的手动调整，且每天的调整频率很低，缺乏精细化目标的控制。为了保证居民供热质量不受影响，该类供热机组控制模式很容易造成供热资源的大幅度浪费，不利于实现供热机组的节能降碳运行。多源热网调度过程中存在调度过度依赖人工经验，系统运行低效，调度经济性不高的问题。

技术实现思路

[0003]本专利技术的目的在于克服上述现有技术的缺点，提供一种多源热网加热器优化调度方法、系统、设备及介质，解决多源热网调度过程中依赖人工经验，系统运行低效，调度经济性不高的问题。
[0004]为达到上述目的，本专利技术采用以下技术方案予以实现：
[0005]一种多源热网加热器优化调度方法，包括以下过程：
[0006]S1，采用深度确定性策略梯度强化学习算法对热负荷进行分配试错探索，得到热网供水温度设定值；
[0007]S2，热网供水温度设定值输入至广义预测控制层，得到热负荷指令；
[0008]S3，热负荷指令输入至PID阀门基础控制层，对阀门开度进行调节。
[0009]优选的，S1中，深度确定性策略梯度强化学习算法...

【技术保护点】

【技术特征摘要】
1.一种多源热网加热器优化调度方法，其特征在于，包括以下过程：S1，采用深度确定性策略梯度强化学习算法对热负荷进行分配试错探索，得到热网供水温度设定值；S2，热网供水温度设定值输入至广义预测控制层，得到热负荷指令；S3，热负荷指令输入至PID阀门基础控制层，对阀门开度进行调节。2.根据权利要求1所述的多源热网加热器优化调度方法，其特征在于，S1中，深度确定性策略梯度强化学习算法包括在线策略网络和在线估值网络；在线策略网络根据当前多热源热网加热器的状态，执行动作，获得回报和下一状态，将生成的序列保存到经验池中，同时从经验池中取出样本，更新在线策略网络的损失函数；在线估值网络根据当前时刻经验池中样本状态给出行为值函数，根据行为值函数更新在线估值网络的损失函数；在线估值网络使其损失函数最小，从而行为值函数最大，将行为值函数输入至在线策略网络中，在线策略网络使其损失函数最小，从而值函数最大，进而输出最优动作，最优动作即最优的热网供水温度设定值。3.根据权利要求2所述的多源热网加热器优化调度方法，其特征在于，多热源热网加热器的状态为其热负荷和抽汽供热流量。4.根据权利要求2所述的多源热网加热器优化调度方法，其特征在于，在线策略网络的损失函数J为：m表示从经验池中取出m个样本，Q(s
i
,a
i
,θ
u
)为根据策略采取行动后的行为值函数，行为值函数表示采用某种动作后的值函数，为s
i
状态，a
i
为执行动作，训练过程中希望值函数最大，因此神经网络反向传播更新在线策略网络参数θ
u
，使得损失函数最小；在线估值网络的损失函数如下：y
i
＝r
i
+Q
′
(s
i+1
,u
′
(s
i+1
|θ
u
′
)|θ
Q
′
)其中，θ
Q
为在线估值网络参数，神经网络反向传播更新在线估值网络参数θ
Q
，使损失函数最小，r
i
为执行动...

【专利技术属性】
技术研发人员：程仁静，蔡浩飞，韩艳水，孙佰明，姚国鹏，白烨，王鑫，周学鹏，单林林，王哲然，
申请(专利权)人：中国华能集团清洁能源技术研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人