当前位置: 首页 > 专利查询>山东大学专利>正文

基于深度强化学习的环境友好型微网优化调度方法及系统技术方案

技术编号:40701485 阅读:29 留言:0更新日期:2024-03-22 10:59
本发明专利技术公开一种基于深度强化学习的环境友好型微网优化调度方法及系统,涉及电力系统优化运行与调度技术领域,该方法包括:搭建包括供需预测模块、碳交易模块、电力交易模块、固碳储能模块、可控分布式电源模块的环境友好型智能微网;获取环境友好型智能微网的运行数据,以收益最大化、成本最小化、供需平衡和碳排放量最小化为综合优化目标,构建环境友好型智能微网优化调度模型;根据深度强化学习理论,采用两层多目标奖励机制和改进的随机高斯策略梯度算法优化微网运行,输出智能微网最优优化调度策略。本发明专利技术能够实现对智能微网能源的最优调度,实现微网经济效益、供需平衡和碳排放等多方面的综合优化目标。

【技术实现步骤摘要】

本专利技术涉及电力系统优化运行与调度,尤其涉及一种基于深度强化学习的环境友好型微网优化调度方法及系统


技术介绍

1、随着全球气温变暖,气候问题已成为世界各国普遍关注的热点问题之一。同时,随着科技进步、社会发展以及人口增长,促使全球能源需求急剧增加,导致以煤炭、石油为主的传统化石能源日益枯竭,传统能源供应面临资源短缺、价格波动和环境污染等问题。在此背景下,以分布式发电为核心的可再生能源得到越来越多的关注和推广。然而,分布式发电易受气候变化和环境因素的干扰,具有间歇性和随机性,导致供电质量和可靠性大大降低,通过优化调度智能微网,可有效地解决分布式发电装置并网时供电质量不高和可靠性不强的问题,提高可再生能源的渗透率,并为用户提供“绿色电力”,降低用户用电成本。

2、然而,现有针对微网调度优化的研究,主要关注的是经济效益,并未着重将节能减排深入到发电端、储能端、用户端的全过程,目前迫切需要设计考虑固碳节能减排的环境友好型智能微网系统,通过合理安排分布式发电、能量存储与交易以及减排固碳的协调运行,提高微网收益、减少碳排放并提高能源利用效率,实现长期的碳本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习的环境友好型微网优化调度方法,其特征是,包括:

2.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述两层多目标奖励机制中,两层多目标奖励包括即时的逐步奖励和最终的周期奖励两个阶段;

3.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述改进的随机高斯策略梯度算法为A2C-GP-TRLW算法,是指:利用A2C框架更新带有可微置信域层的高斯策略,并采用瓦瑟斯坦L2距离来判定新旧策略是否符合置信域范围,以此更新优化策略。

4.如权利要求3所述的基于深度强化学习的环境友好型微网优...

【技术特征摘要】

1.一种基于深度强化学习的环境友好型微网优化调度方法,其特征是,包括:

2.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述两层多目标奖励机制中,两层多目标奖励包括即时的逐步奖励和最终的周期奖励两个阶段;

3.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述改进的随机高斯策略梯度算法为a2c-gp-trlw算法,是指:利用a2c框架更新带有可微置信域层的高斯策略,并采用瓦瑟斯坦l2距离来判定新旧策略是否符合置信域范围,以此更新优化策略。

4.如权利要求3所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,利用a2c-gp-trlw算法与智能微网环境交互,学习并输出智能微网最优优化调度策略,包括:

5.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述供需预测模块包括用户负载及其点预测模型和可再生能源及其发电区间预测模型。

<...

【专利技术属性】
技术研发人员:刘帅杜瑞琦王小文徐昊天刘龙成赵浩然华友情吴颖颖
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1