火力发电系统优化控制方法、装置、设备和介质制造方法及图纸

技术编号:36752769 阅读:21 留言:0更新日期:2023-03-04 10:41
本发明专利技术提供一种火力发电系统优化控制方法、装置、设备和介质,该方法包括:构建火力发电系统的网络模型、控制网络及评价网络,在预设学习速率下迭代更新评价网络的权值,得到控制网络的最优性能指标的值函数,并基于最优性能指标的值函数迭代更新控制网络的权值,直至得到最优控制策略;在控制网络达到预设收敛精度的情况下,保留当前控制网络的最优性能指标的值函数,并基于保留的最优性能指标的值函数获取火力发电系统的目标最优控制策略,以根据目标最优控制策略对火力发电系统进行优化控制,由此本发明专利技术利用预设学习率函数、迭代值函数和迭代控制策略进行局部迭代,有效地减轻了火力发电系统的计算负担,提高火力发电系统的控制效率和可靠性。控制效率和可靠性。控制效率和可靠性。

【技术实现步骤摘要】
火力发电系统优化控制方法、装置、设备和介质


[0001]本专利技术深度学习
,尤其涉及一种火力发电系统优化控制方法、装置、设备和介质。

技术介绍

[0002]火力发电是我国主要的发电方式,随着我国火电行业的发展而发展。目前随着国内风电、光伏等新能源发电的装机容量不断增大,大部分火电厂的运行和管理同时面临快速调峰、电网考评等问题,这给火电厂的控制系统的改造以及电厂运维带来很多挑战。
[0003]传统火力发电系统最优控制方法,需要进行全局迭代,更新火力发电系统中所有的控制参数,由于控制参数繁杂,火力发电系统的计算负担很大。

技术实现思路

[0004]本专利技术提供一种火力发电系统优化控制方法、装置、设备和介质,用以解决现有技术中进行全局迭代,更新火力发电系统中所有的控制参数,导致火力发电系统的计算负担很大。
[0005]本专利技术提供一种火力发电系统优化控制方法,包括:
[0006]构建火力发电系统的网络模型、控制网络及评价网络,其中,所述网络模型用于根据当前时刻状态所述火力发电系统中的状态参数的第一状态数据及所述控制网络输出的所述状态参数对应的控制策略预测出下一时刻所述状态参数的第二状态数据,所述评价网络用于评估出所述控制策略的性能指标;
[0007]在预设学习速率下迭代更新所述评价网络的权值,得到所述控制网络的最优性能指标的值函数,并基于所述最优性能指标的值函数迭代更新所述控制网络的权值,直至得到最优控制策略;
[0008]在所述控制网络达到预设收敛精度的情况下,保留当前所述控制网络的最优性能指标的值函数,并基于保留的最优性能指标的值函数获取所述火力发电系统的目标最优控制策略,以根据所述目标最优控制策略对所述火力发电系统进行优化控制。
[0009]根据本专利技术提供的所述的火力发电系统优化控制方法,所述在预设学习速率下迭代更新所述评价网络的权值,得到所述控制网络的最优性能指标的值函数,并基于所述最优性能指标的值函数迭代更新所述控制网络的权值,直至得到最优控制策略,包括:
[0010]将所述状态参数的所述第一状态数据及所述状态参数对应的控制策略输入所述评价网络,获取所述评价网络输出的所述控制策略的性能指标的值函数;
[0011]确定所述状态参数匹配的预设学习速率,并在所述预设学习速率下基于所述性能指标的值函数对所述评价网络的权值进行迭代更新,得到所述控制网络的最优性能指标的值函数;
[0012]在所述预设学习速率下基于所述最优性能指标的值函数对所述控制网络的权值进行迭代更新,得到所述控制网络的控制律;
[0013]基于所述控制律更新所述控制网络输出的控制策略,直至得到最优控制策略。
[0014]根据本专利技术提供的所述的火力发电系统优化控制方法,所述性能指标的值函数的初始函数为半正定初始函数。
[0015]根据本专利技术提供的所述的火力发电系统优化控制方法,所述在预设学习速率下迭代更新所述评价网络的权值之前,还包括:
[0016]判断所述状态参数是否处于目标状态空间;
[0017]在所述状态参数处于所述目标状态空间的情况下,从预设学习速率区间中选取出所述状态参数匹配的预设学习速率。
[0018]根据本专利技术提供的所述的火力发电系统优化控制方法,所述判断所述状态参数是否处于目标状态空间之后,还包括:
[0019]在所述状态参数不处于所述目标状态空间的情况下,停止迭代更新所述评价网络及所述控制网络。
[0020]根据本专利技术提供的所述的火力发电系统优化控制方法,所述在预设学习速率下迭代更新所述评价网络的权值之后,还包括:
[0021]在所述控制网络未达到预设收敛精度的情况下,返回执行所述在预设学习速率下迭代更新所述评价网络的权值的步骤,直至所述控制网络达到预设收敛精度。
[0022]根据本专利技术提供的所述的火力发电系统优化控制方法,所述在预设学习速率下迭代更新所述评价网络的权值之前,还包括:
[0023]初始化所述火力发电系统的目标参数、所述控制网络的权值及所述评价网络的权值;
[0024]其中,所述目标参数包括所述网络模型的模型参数及火力发电系统的状态参数。
[0025]本专利技术还提供一种火力发电系统优化控制装置,包括:
[0026]构建单元,用于构建待优化的火力发电系统的网络模型、控制网络及评价网络,其中,所述网络模型用于根据当前时刻所述火力发电系统的第一状态参数及所述控制网络输出的控制策略预测下一时刻所述火力发电系统的第二状态参数,所述评价网络用于评估所述控制网络的性能指标;
[0027]迭代单元,用于在预设学习速率下迭代更新所述评价网络的权值,得到所述控制网络的最优性能指标的值函数,并基于所述最优性能指标的值函数迭代更新所述控制网络的权值,直至得到最优控制策略;
[0028]控制单元,用于在所述控制网络达到预设收敛精度的情况下,保留当前所述控制网络的最优性能指标的值函数,并基于保留的最优性能指标的值函数获取所述火力发电系统的目标最优控制策略,以根据所述目标最优控制策略对所述火力发电系统进行优化控制。
[0029]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述火力发电系统优化控制方法。
[0030]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述火力发电系统优化控制方法。
[0031]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器
执行时实现如上述任一种所述火力发电系统优化控制方法。
[0032]本专利技术提供的一种火力发电系统优化控制方法、装置、设备和介质,通过构建火力发电系统的网络模型、控制网络及评价网络,在预设学习速率下迭代更新评价网络的权值,得到控制网络的最优性能指标的值函数,并基于最优性能指标的值函数迭代更新控制网络的权值,直至得到最优控制策略;在控制网络达到预设收敛精度的情况下,保留当前控制网络的最优性能指标的值函数,并基于保留的最优性能指标的值函数获取火力发电系统的目标最优控制策略,以根据目标最优控制策略对火力发电系统进行优化控制,由此本专利技术利用预设学习率函数、迭代值函数和迭代控制策略进行局部迭代,有效地减轻了火力发电系统的计算负担,提高火力发电系统的控制效率和可靠性。
附图说明
[0033]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0034]图1是本专利技术提供的火力发电系统优化控制方法的流程示意图之一;
[0035]图2是本专利技术提供的火力发电系统优化控制装置的结构示意图;
[0036]图3是本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种火力发电系统优化控制方法,其特征在于,包括:构建火力发电系统的网络模型、控制网络及评价网络,其中,所述网络模型用于根据当前时刻状态所述火力发电系统中的状态参数的第一状态数据及所述控制网络输出的所述状态参数对应的控制策略预测出下一时刻所述状态参数的第二状态数据,所述评价网络用于评估出所述控制策略的性能指标;在预设学习速率下迭代更新所述评价网络的权值,得到所述控制网络的最优性能指标的值函数,并基于所述最优性能指标的值函数迭代更新所述控制网络的权值,直至得到最优控制策略;在所述控制网络达到预设收敛精度的情况下,保留当前所述控制网络的最优性能指标的值函数,并基于保留的最优性能指标的值函数获取所述火力发电系统的目标最优控制策略,以根据所述目标最优控制策略对所述火力发电系统进行优化控制。2.根据权利要求1所述的火力发电系统优化控制方法,其特征在于,所述在预设学习速率下迭代更新所述评价网络的权值,得到所述控制网络的最优性能指标的值函数,并基于所述最优性能指标的值函数迭代更新所述控制网络的权值,直至得到最优控制策略,包括:将所述状态参数的所述第一状态数据及所述状态参数对应的控制策略输入所述评价网络,获取所述评价网络输出的所述控制策略的性能指标的值函数;确定所述状态参数匹配的预设学习速率,并在所述预设学习速率下基于所述性能指标的值函数对所述评价网络的权值进行迭代更新,得到所述控制网络的最优性能指标的值函数;在所述预设学习速率下基于所述最优性能指标的值函数对所述控制网络的权值进行迭代更新,得到所述控制网络的控制律;基于所述控制律更新所述控制网络输出的控制策略,直至得到最优控制策略。3.根据权利要求2所述的火力发电系统优化控制方法,其特征在于,所述性能指标的值函数的初始函数为半正定初始函数。4.根据权利要求1所述的火力发电系统优化控制方法,其特征在于,所述在预设学习速率下迭代更新所述评价网络的权值之前,还包括:判断所述状态参数是否处于目标状态空间;在所述状态参数处于所述目标状态空间的情况下,从预设学习速率区间中选取出所述状态参数匹配的预设学习速率。5.根据权利要求4所述的火力...

【专利技术属性】
技术研发人员:魏庆来高爱国尚勇王君程相宋睿卓
申请(专利权)人:华北电力科学研究院有限责任公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1