【技术实现步骤摘要】
一种智能体辅助独立发电商参与市场竞标的调度优化系统
本专利技术涉及电网调度优化领域,尤其涉及智能体辅助独立发电商参与市场竞标的调度优化系统。
技术介绍
电力市场下的机组组合(SCUC)是当前电力系统运行决策的重要组成部分,被独立的系统运营商(ISOs)或区域传输组织(RTOs)利用来清除实时和提前一天的市场。其在国外已有多年的研究的实践,如PJM,MISO,和ISO-NE。目前的研究中,寻找SCUC最优的方法有储备调整方法、随机优化方法、两阶段自适应鲁棒优化模型方法。储备调整方法,在当今的电力行业中得到了广泛应用。这方面的许多研究,都侧重于基于确定性标准分析准备金要求的水平,例如最大的发电机的损失或系统导入更改。这种方法在实践中很容易实现。然而,将额外的发电资源作为储备可能是处理不确定性的一种经济效率低下的方法,特别是当准备金要求主要由一些特别规定而不是系统分析决定时。此外,由于SCUC决策只考虑了预期运行状态,即使有足够的备用,当负荷等实时状态与预期值有较大偏差时,电力系统仍可能存在容量不足的问题。随机优化 ...
【技术保护点】
1.一种智能体辅助独立发电商参与市场竞标的调度优化系统,其特征在于,包括发电商投标数据模块、负荷模块、电力市场模块、利润指标模块和智能体模型,/n发电商投标数据模块,用于将发电商的历史竞标数据α
【技术特征摘要】
1.一种智能体辅助独立发电商参与市场竞标的调度优化系统,其特征在于,包括发电商投标数据模块、负荷模块、电力市场模块、利润指标模块和智能体模型,
发电商投标数据模块,用于将发电商的历史竞标数据αit发送至电力市场,竞标数据包括机组出力与价格关系及机组出力约束;
负荷模块,用于估计每个节点区域所有用户的用电情况,将每个节点区域的的总用电负荷传送至电力市场模块;
电力市场模块,用于将发电商竞标数据和每个节点区域的的总用电负荷通过安全约束下机组组合的成本优化调度SCUC,获得各发电商的功率单价及机组出力情况,调用各发电商的功率单价建立拉格朗日函数,并对其求偏导,得到各节点区域的电价LMPt;
利润指标模块,用于将所获得的各发电商机组出力情况和各节点电价LMPt,计算出各发电商的利润指标,各发电商的利润指标至少包括发电商每小时的利润值和全天总收入利润值;
智能体,每个发电商对应一个拥有不同决策的智能体,其用于根据所获取的各发电商对应的投标系数αit、发电商每小时的利润值Profits和全天总收入利润值Total-Profits采用机器学习方法建立各发电商的动作行为/奖励期望值表Q-Table,并由动作行为/奖励期望值表Q-Table分析推测出发电商获取最大利润值的次态投标发电参数,以供发电商参与下次投标。
2.如权利要求1所述的智能体辅助独立发电商参与市场竞标的调度优化系统,其特征在于,所述智能体所采用的机器学习方法为Q--learning,Q-learning是强化学习算法中基于值的算法,利用Q函数寻找最优的动作策略,Q函数为Q(s,a),是指在某一时刻的s状态下,采取动作a能够获得收益的期望,环境会根据智能体的动作反馈相应的奖励reward,具体包括:
(1)初始化Q-Table:初始化Q-Table为一个24n行2+m列的二维表格,n为循环天数,m表示有m种动作行为的选择,第一列为发电商的历史投标系数αit,第二列为历史投标对应的时间,第三列到第2+m列为第i个发电商每1小时做出第j个动作的获得的未来奖励期望值Q-valuei1-j,Q-valuei1-j的初始值取0;由Q-Table中各发电商的投标系数αit和时间h所对应的历史数据的对应关系确定智能体的状态,给每个状态下所采取的相应动作的反馈值reward;
(2)采取ε-greedy策略选取当前动作,然后基于当前动作的Q-value估计智能体在状态s下选择动作a,所述ε-greedy策略为:采用rand函数生成一个随机数。将这个随机数与ε比较,若此随机数大于ε,智能体的动作为随机探索;若此随机数小于等于ε,智能体的动作将根据已知的Q-table中选择,从Q-table中的相应状态下选择Q-value最大的动作,ε为智能体的探索速率,一般设定为0到1的数值;
(3)选择动作a执行,返回一个新的状态s′和相应奖励的reward值,使用贝尔曼方程更新新的Q(s,a),贝尔曼方程如下:
NewQ(s,a)=Q(s,a)+α[R+γmaxQ'(s',a')-Q(s,a)],
其中,NewQ(s,a)为s状态下选择动作a获得的新的Q-value,Q(s,a)为s状态下动作a的当前Q-value,R为环境对行为反馈的奖励reward,maxQ'(s',a')为下一个新状态s′下所有可能动作a′的最大Q-value,α为智能体行为反馈值学习率,γ为智能体对远期的奖励衰减比例,值越大智能体对远期的利益越重视,取值[0,1]之间;
迭代执行步骤(2)和(3),扩大智能体的Q-Table,以便往后的动作选择获得更大的期望值。
3.如权利要求1所述的智能体辅助独立发电商参与市场竞标的调度优化系统,其特征在于,所述安全约束的机组组合SCUC的成本优化调度的目标函数为:
SCUC约束包括机组约束和输电网络安全约束,机组约束至少包括:
系统功率平衡约束:
实际发电容量约束:Pmin,jIit<=Pit<=Pmax,iIit,
机组爬升约...
【专利技术属性】
技术研发人员:汤瑞欣,许方园,陈栩杰,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。