【技术实现步骤摘要】
本专利技术属于电力市场出清模拟,具体涉及一种未来电力市场用竞价出清模拟方法、系统、芯片及设备。
技术介绍
1、强化学习是机器学习方法之一,也称增强学习、评价学习,其是通过智能体(agent)在与环境(environment)进行交互的过程中,不断得到反馈并学习策略(policy),从而达到最大化奖励(reward)或实现特定目标的目的。
2、强化学习以马尔可夫决策过程(markov decision process,mdp)为基础,可以通过表1所示的要素进行表示。
3、表1
4、
5、在mdp中,还有折扣系数等概念,也称衰减系数,用γ表示,满足0≤γ≤1,在序列决策中用来平衡未来奖励的折现,距离当前时刻越远的奖励对当前决策影响越小。
6、强化学习算法包括基于策略(policy-based)、基于值函数(value-based)及基于演员评论家(actor-critic)三类。
7、深度确定性策略梯度算法ddpg是一种基于深度学习的强化学习算法,它结合了策略梯度方法和
...【技术保护点】
1.未来电力市场用竞价出清模拟方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的未来电力市场用竞价出清模拟方法,其特征在于,对于每个交易时段t,以自身收益最大化为目标的发电商i参与的市场竞价模型如下:
3.根据权利要求2所述的未来电力市场用竞价出清模拟方法,其特征在于,发电商报价模型以实际市场的历史报价数据为基础,固定发电商历史申报容量作为市场审报的容量,以发电商i历史最低报价作为参与市场报价的底价,通过将价格乘以报价系数实现发电商每个容量段的策略报价,发电商每个容量段的策略报价τi,k为:
4.根据权利要求2所述的未来电力
...【技术特征摘要】
1.未来电力市场用竞价出清模拟方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的未来电力市场用竞价出清模拟方法,其特征在于,对于每个交易时段t,以自身收益最大化为目标的发电商i参与的市场竞价模型如下:
3.根据权利要求2所述的未来电力市场用竞价出清模拟方法,其特征在于,发电商报价模型以实际市场的历史报价数据为基础,固定发电商历史申报容量作为市场审报的容量,以发电商i历史最低报价作为参与市场报价的底价,通过将价格乘以报价系数实现发电商每个容量段的策略报价,发电商每个容量段的策略报价τi,k为:
4.根据权利要求2所述的未来电力市场用竞价出清模拟方法,其特征在于,市场集中出清模型具体为:
5.根据权利要求1所述的未来电力市场用竞价出清模拟方法,其特征在于,基于强化学习的智能报价模型的状态空间具体为:
6.根据权利要求1所述的未来电力市场用竞价出清模拟方法,其特征在于,基于ddpg算法对构建的基于强化学习的智能报价模型进行训练,具体训练过程如下:
7.一种未来电力市场用竞价出清模拟系统,其特征在于,包括...
【专利技术属性】
技术研发人员:袁沐琛,丁强,蔡帜,李强,张传成,
申请(专利权)人:中国电力科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。