基于强化学习的市场动态申报策略的方法、装置以及设备制造方法及图纸

技术编号：35754075 阅读：11 留言：0更新日期：2022-11-26 19:00

本申请涉及人工智能以及电网控制技术领域，尤其涉及基于强化学习的市场动态申报策略的方法、装置以及设备，包括：获取综合能源系统运行基础数据；基于所述综合能源系统运行基础数据，得到策略和场景间的最优匹配性分析；基于所述最优匹配性分析，通过申报策略库中筛选最优策略，得到申报方案。本申请有助于通过挖掘申报策略和决策场景间的内在匹配关系，实现申报策略的自适应决策，根据实际决策场景特征，选择最适宜的申报策略方法，制定申报方案，进一步有效提升综合能源系统现货市场申报决策准确性，提高其市场交易效益。提高其市场交易效益。提高其市场交易效益。

全部详细技术资料下载

【技术实现步骤摘要】
基于强化学习的市场动态申报策略的方法、装置以及设备

[0001]本申请涉及人工智能以及电网控制
，尤其涉及基于强化学习的市场动态申报策略的方法、装置以及设备。

技术介绍

[0002]随着我国电力市场改革不断深化，放开发用电计划政策加速落地，电力市场交易对发用电企业运行效益的影响愈发凸显，由此产生了市场成员交易申报策略制定问题。特别是随着现货市场加速建设，市场交易复杂性显著提升，市场成员对高效准确的市场交易申报策略需求愈发迫切。现有技术中，申报策略具有一定的局限性，即申报策略不能完全适用于综合能源系统实际申报竞价决策期间的市场环境，无法满足申报策略与竞价环境的自适应,使得市场交易效益无法达到预期水平。

技术实现思路

[0003]为至少在一定程度上克服相关技术申报策略不能完全适用于综合能源系统实际申报竞价决策期间的市场环境，无法满足申报策略与竞价环境的自适应的问题，本申请提供基于强化学习的市场动态申报策略的方法、装置以及设备。
[0004]本申请的方案如下：
[0005]一方面，本申请提供基于强化学习的市场动态申报策略的方法，所述方法包括:
[0006]获取综合能源系统运行基础数据；
[0007]基于所述综合能源系统运行基础数据，构建申报策略智能体模型,得到策略和场景间的最优匹配性分析；
[0008]基于所述最优匹配性分析，通过申报策略库中筛选最优策略，得到申报方案。
[0009]进一步地，构建所述申报策略智能体模型，包括：
[0010]通过Q...

【技术保护点】

【技术特征摘要】
1.基于强化学习的市场动态申报策略的方法，其特征在于，所述方法包括:获取综合能源系统运行基础数据；基于所述综合能源系统运行基础数据，构建申报策略智能体模型,得到策略和场景间的最优匹配性分析；基于所述最优匹配性分析，通过申报策略库中筛选最优策略，得到申报方案。2.根据权利要求1所述的方法，其特征在于，构建所述申报策略智能体模型，包括：通过Q强化学习算法，设计其环境变量、动作空间和奖励函数三方面要素，得到策略场景间的最优匹配性分析；所述环境变量包括：市场交易类，包括：指标发电需求、新能源发电预测、常规机组开机容量、燃料价格指数；自身特征类，包括：自身用电需求、自身供热需求、自身制冷需求和自身新能源发电预测、自身储能装置储电量。3.根据权利要求2所述的方法，其特征在于，所述动作空间，包括：通过智能体决策得到综合能源系统申报策略集合；基于得到的综合能源系统申报策略集合，得到所述环境变量所描述的交易场景下的最优申报策略；所述得到所述环境变量所描述的交易场景下的最优申报策略的公式为：A＝{a1,a2,
…
a
N
}式中，N为动作空间中申报策略库可选申报策略数量即所述综合能源...

【专利技术属性】
技术研发人员：孙勇，金龙云，张继权，熊健，李一明，张磊，苏阔，刘畅，史坤鹏，
申请(专利权)人：国网吉林省电力有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人