一种市场投标系统和方法及介质技术方案

技术编号:38996320 阅读:6 留言:0更新日期:2023-10-07 10:27
本发明专利技术公开一种市场投标系统和方法及介质,该系统包括市场出清模型获取模块、性能评估获取模块、Q

【技术实现步骤摘要】
一种市场投标系统和方法及介质


[0001]本专利技术涉及
,具体涉及一种市场投标系统和方法及介质。
技术背景
[0002]通常情况下分析不同数据权益主体市场特别是电力市场的纳什均衡经常用到的是博弈论方法,纳什均衡是分析交易趋势、协助主体市场设计和监管的有效工具。通过电力市场的主要参与者

发电公司、电网、用能用户等的多方数据交换,各方在保证自身利益的同时与多方达成利益的均衡的情况下进行博弈,最终能达到各方都满意的状态

纳什均衡。在解除管制的电力批发市场中,市场参与者将报价数据上交给独立系统运营商(ISO),ISO使用拍卖机制清理市场。在清算过程中,市场参与者,如发电公司在没有他方数据的情况下独立做出战略决策,这种做法属于各方数据完整的静态博弈。为了求解这个静态博弈的纳什均衡,算法通常假设信息是完整的,采用MPEC作为求解方法。代表发电公司竞争行为的直流潮流模型在不同数据权益主体市场中得到了广泛应用,直流潮流模型和市场的出清函数构成一个有平衡约束的数学规划(MPEC)的双层优化问题,通过对平衡约束的数学规划(MPEC)问题进行求解,在模型中各方数据进行交换共享,进行多方的博弈,可以找出使主体市场供求平衡以及各主体市场利益最大化的投标策略。
[0003]但是MPEC方法所进行的数据交换是完全信息的数据交换,但在复杂的市场中各方主体有时无法得到其他主体完整的数据,所以MPEC不能严格反映不完全信息下的不同数据权益主体市场。

技术实现思路

[0004]本专利技术提供了一种市场投标系统和方法及介质,可以用于投标市场中,解决了在市场主体一方无法得到对方完整数据的情况下,对策略进行仿真,找出最优的策略,实现自身利益最大化和社会福利最大化的问题。
[0005]作为博弈论的替代方法,基于强化学习算法(RL)的市场模拟有着其成本低、可重复性好、能够在数据不完整的情况下进行的多方的数据交换和共享也能反映市场动态的优点。强化学习(Regulation Learning,RL)是一种机器学习技术,常用于多智能体系统(MAS),它使多个智能体能够在交互环境中不断进行数据交换、通过试错的方式,利用自身行为和经验的反馈进行学习。Q

learning算法是强化学习的开山之作,它们将所有动作或状态动作对的估计值存储在表中,并与环境交互以更新表,因此其需要对状态和动作空间离散化。用Q

learning的方法去求解供给函数均衡模型,可以求出不完全信息下的不同数据权益主体市场的纳什均衡,考虑长期利益找出比常规方法更优的策略,可分析电网、供电企业、用能用户等多个主体的行为特性。
[0006]在与一些使用深度强化学习(如,深度Q学习,策略梯度算法)对于主体市场的应用相比较,深度强化学习的理论更复杂,训练过程繁琐,训练需占用大量的计算机内存且消耗很多时间。Q

learning算法理论简单,算法求解过程简便,对于主体不太多的中小型的主体
市场,基于Q

learning的算法更加合适比较简训练所需的时间较少,在较短的时间内就可寻找主体所需的最优策略,而且能够节省资源,其主要适用于主体不多的中小型主体权益市场寻找最优的投标策略数据
[0007]本专利技术提供一种市场投标系统,包括市场出清模型获取模块、性能评估获取模块、Q

learning算法求解模块、动态博弈模块和最优投标方法获取模块:
[0008]所述市场出清模型获取模块,用于根据现货电力市场的实时报价和出清的特性,建立市场电力仿真用到的发电公司边际成本函数和用电用户逆需求电价函数,根据所述发电公司边际成本函数和用电用户逆需求电价函数确定市场出清模型,其中所述市场出清模型为具有平衡约束的MPEC模型;
[0009]所述性能评估获取模块,用于利用博弈论算法求出在静态博弈中所述MPEC模型的纳什均衡策略β
*
,将所述纳什均衡策略β
*
作为指标对Q

learning算法的性能进行评估;
[0010]所述Q

learning算法求解模块,用于将所述MPEC模型和发电公司的利润函数构建为双层博弈模型,利用Q

learning算法对所述双层博弈模型进行求解,得到在静态博弈中不考虑长期利润对发电公司利润影响的纳什均衡策略α
*

[0011]所述动态博弈模块,用于依次调整所述Q

learning算法的超参数γ,在考虑纳什均衡策略对发电公司利润影响下,对所述纳什均衡策略α
*
进行动态博弈,得出考虑对发电公司自身利益形成长期影响的纳什均衡策略α


[0012]所述最优投标方法获取模块,用于比较所述纳什均衡策略α
*
和纳什均衡策略β
*
的拟合程度,并用动态博弈的最优策略分析市场行为和发电公司之间的默契合谋程度,得到最优投标方法。
[0013]进一步地,在所述市场出清模型获取模块中,按照以下方式建立所述市场出清模型:
[0014]建立发电公司边际成本函数,其表达式为其中其中为成本系数,和的值均大于0,p
gt
是发电公司在时间间隔t的输出功率;
[0015]让发电公司采用与所述边际发电成本变截距的方式进行投标,即发电公司的投标函数为其中a
g
为发电公司的投标函数的截距,也是策略变量;
[0016]求得用户的用电逆需求电价函数,其表达式如下所示:
[0017]p
dt
=c
d

d
d
q
dt

[0018]其中p
dt
为用户d在时间间隔t的逆需求电价;q
dt
为用户d在时间间隔t的需求电量;d
d
为斜率,其值不随时间变化;c
d
为逆需求电价函数的截距。
[0019]进一步地,在所述市场出清模型获取模块中,所述平衡约束包括支路流量约束和发电出力约束,其表达式如下所示:
[0020]∑
g∈G p
gt


d∈D q
dt
=0
[0021][0022][0023]其中,L表示输电线路l的集合,和是所有节点的发电和用电数据交换率的列向量,两者分别是所有节点的发电量和需求向量的线性组合,J
l
表示潮流传输分配因子系数
矩阵,表示发电公司g在时间间隔t的发电出力下限,表示发电公司g在时间间隔t的发电出力上限;F
l
是线路最大流量限制。
[0024]进一步地,在所述性能评估获取模块中,按照以下方式利用博弈论算法求出在静态博弈中所述MPEC模型的纳什均衡策略β
*
...

【技术保护点】

【技术特征摘要】
1.一种市场投标系统,其特征在于:包括市场出清模型获取模块、性能评估获取模块、Q

learning算法求解模块、动态博弈模块和最优投标方法获取模块:所述市场出清模型获取模块,用于根据现货电力市场的实时报价和出清的特性,建立市场电力仿真用到的发电公司边际成本函数和用电用户逆需求电价函数,根据所述发电公司边际成本函数和用电用户逆需求电价函数确定市场出清模型,其中所述市场出清模型为具有平衡约束的MPEC模型;所述性能评估获取模块,用于利用博弈论算法求出在静态博弈中所述MPEC模型的纳什均衡策略β
*
,将所述纳什均衡策略β
*
作为指标对Q

learning算法的性能进行评估;所述Q

learning算法求解模块,用于将所述MPEC模型和发电公司的利润函数构建为双层博弈模型,利用Q

learning算法对所述双层博弈模型进行求解,得到在静态博弈中不考虑长期利润对发电公司利润影响的纳什均衡策略α
*
;所述动态博弈模块,用于依次调整所述Q

learning算法的超参数γ,在考虑纳什均衡策略对发电公司利润影响下,对所述纳什均衡策略α
*
进行动态博弈,得出考虑对发电公司自身利益形成长期影响的纳什均衡策略α

;所述最优投标方法获取模块,用于比较所述纳什均衡策略α
*
和纳什均衡策略β
*
的拟合程度,并用动态博弈的最优策略分析市场行为和发电公司之间的默契合谋程度,得到最优投标方法。2.根据权利要求1所述的一种市场投标系统,其特征在于,在所述市场出清模型获取模块中,按照以下方式建立所述市场出清模型:建立发电公司边际成本函数,其表达式为其中其中为成本系数,和的值均大于0,p
gt
是发电公司在时间间隔t的输出功率;让发电公司采用与所述边际发电成本变截距的方式进行投标,即发电公司的投标函数为其中a
g
为发电公司的投标函数的截距,也是策略变量;求得用户的用电逆需求电价函数,其表达式如下所示:p
dt
=c
d

d
d
q
dt
,其中p
dt
为用户d在时间间隔t的逆需求电价;q
dt
为用户d在时间间隔t的需求电量;d
d
为斜率,其值不随时间变化;c
d
为逆需求电价函数的截距。3.根据权利要求2要求的一种市场投标系统,其特征在于,在所述市场出清模型获取模块中,所述平衡约束包括支路流量约束和发电出力约束,其表达式如下所示:∑
g∈G
p
gt


d∈D
q
dt
=0=0其中,L表示输电线路l的集合,和是所有节点的发电和用电数据交换率的列向量,两者分别是所有节点的发电量和需求向量的线性组合,J
l
表示潮流传输分配因子系数矩阵,表示发电公司g在时间间隔t的发电出力下限,表示发电公司g在时间间隔t的发
电出力上限;F
l
是线路最大流量限制。4.根据权利要求1要求的一种市场投标系统,其特征在于,在所述性能评估获取模块中,按照以下方式利用博弈论算法求出在静态博弈中所述MPEC模型的纳什均衡策略β
*
:用所述Q

learning算法求出每个发电公司g的最优策略,将其记为在动态博弈中,每个发电公司g在t时刻的利润的计算公式为:r
gt
=r
g1
+γr
g2
+γ2r
g3
+


t
‑1r
g(t

1)
其中,r
gt
代表发电公司g在时间间隔t的利润,γ为发电公司g的折扣因子;γ∈(0,1)。5.根据权利要求1要求的一种市场投标系统,其特征在于,在所述Q

learning算法求解模块中,所述双层博弈模型的参与者为发电公司、电网和用电用户;所述双层博弈...

【专利技术属性】
技术研发人员:江剑峰胡文博肖楚鹏冯嘉俊饶尧徐辰冠周博滔朱文君黄睿力
申请(专利权)人:国网电力科学研究院武汉能效测评有限公司国网电力科学研究院有限公司国家电网有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1