【技术实现步骤摘要】
本专利技术涉及电力系统优化运行与调度,尤其涉及一种基于深度强化学习的环境友好型微网优化调度方法及系统。
技术介绍
1、随着全球气温变暖,气候问题已成为世界各国普遍关注的热点问题之一。同时,随着科技进步、社会发展以及人口增长,促使全球能源需求急剧增加,导致以煤炭、石油为主的传统化石能源日益枯竭,传统能源供应面临资源短缺、价格波动和环境污染等问题。在此背景下,以分布式发电为核心的可再生能源得到越来越多的关注和推广。然而,分布式发电易受气候变化和环境因素的干扰,具有间歇性和随机性,导致供电质量和可靠性大大降低,通过优化调度智能微网,可有效地解决分布式发电装置并网时供电质量不高和可靠性不强的问题,提高可再生能源的渗透率,并为用户提供“绿色电力”,降低用户用电成本。
2、然而,现有针对微网调度优化的研究,主要关注的是经济效益,并未着重将节能减排深入到发电端、储能端、用户端的全过程,目前迫切需要设计考虑固碳节能减排的环境友好型智能微网系统,通过合理安排分布式发电、能量存储与交易以及减排固碳的协调运行,提高微网收益、减少碳排放并提高能源利
...【技术保护点】
1.一种基于深度强化学习的环境友好型微网优化调度方法,其特征是,包括:
2.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述两层多目标奖励机制中,两层多目标奖励包括即时的逐步奖励和最终的周期奖励两个阶段;
3.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述改进的随机高斯策略梯度算法为A2C-GP-TRLW算法,是指:利用A2C框架更新带有可微置信域层的高斯策略,并采用瓦瑟斯坦L2距离来判定新旧策略是否符合置信域范围,以此更新优化策略。
4.如权利要求3所述的基于深度强化学
...【技术特征摘要】
1.一种基于深度强化学习的环境友好型微网优化调度方法,其特征是,包括:
2.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述两层多目标奖励机制中,两层多目标奖励包括即时的逐步奖励和最终的周期奖励两个阶段;
3.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述改进的随机高斯策略梯度算法为a2c-gp-trlw算法,是指:利用a2c框架更新带有可微置信域层的高斯策略,并采用瓦瑟斯坦l2距离来判定新旧策略是否符合置信域范围,以此更新优化策略。
4.如权利要求3所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,利用a2c-gp-trlw算法与智能微网环境交互,学习并输出智能微网最优优化调度策略,包括:
5.如权利要求1所述的基于深度强化学习的环境友好型微网优化调度方法,其特征是,所述供需预测模块包括用户负载及其点预测模型和可再生能源及其发电区间预测模型。
<...【专利技术属性】
技术研发人员:刘帅,杜瑞琦,王小文,徐昊天,刘龙成,赵浩然,华友情,吴颖颖,
申请(专利权)人:山东大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。