A method for power distribution of microgrid based on reinforcement learning, involving microgrid. To solve the problem of microgrid power transaction control, a microgrid based power transaction system based on reinforcement learning is proposed. According to other micro grid and power plant power transaction value and its own storage capacity information, the reinforcement learning algorithm is used to select the optimal energy value of each transaction. The micro grid updates the information based on the immediate return of each transaction, and makes different adjustments to the next transaction strategy. This method does not need to predict power consumption model around the micro grid and electricity production mode, can adapt to the dynamic scene through the smart grid, intelligent learning to obtain the optimal electricity sale value, so as to improve the overall efficiency of the micro grid and energy utilization, and reduce the overall energy demand of the power plant.
【技术实现步骤摘要】
本专利技术涉及微电网,尤其是涉及一种基于强化学习的微电网电能分配方法。
技术介绍
微电网的提出是用于整合可再生能源、降低电网成本及提供更好电网质量。微电网包括有源负载、可再生能源发电机及电能存储设备,且可以通过变电站与主电网相连。如果微电网中的本地产能和储能无法满足需求时,可以和主电网进行交易,购买电能;反之,当微电网中有多余的电能时,也可以卖给主电网[S.M.AminandB.F.Wollenberg,“Towardasmartgrid:Powerdeliveryforthe21stcentury,”IEEEPowerEnergyMag.,vol.3,no.5,pp.34–41,Sep./Oct.2005.]。[Z.Wang,B.Chen,J.Wang,etal.,“Coordinatedenergymanagementofnetworkedmicrogridsindistributionsystems,”IEEETrans.onSmartGrid,6(1):45-53,2015.]阐述了一种基于分层结构的主电网和微电网之间的互动交易。[W.Saad,Z.Han,H.V.Poor,andT.Basar,“Game-theoreticmethodsforthesmartgrid:Anoverviewofmicrogridsystems,demand-sidemanagement,andsmartgridcommunications,”IEEESignalProcess.Mag.,vol.29,no.5,pp.86–105,Sep.2012.]指出主电网与 ...
【技术保护点】
基于强化学习的微电网电能分配方法,其特征在于包括以下步骤:1)设置:N个微电网用户MG和一个发电厂PP;微电网用户之间的买的价格ρ‑、卖的价格ρ+以及微电网用户和发电厂PP之间的买的价格卖的价格微电网用户MG最大储能值E和一次交易的最大交易值M;微电网各电能值的增益g;2)微电网用户MGx初始化学习因子γ、折扣因子β和最大时隙m,选择最优动作的概率p,设置Q值表、V值表值为0;3)微电网用户MGx在k时隙的状态s,并根据Q值表,选择最优行为ax;4)微电网用户MGy在k时隙的状态s,根据greedy策略选择可行交易行为下所能达到最大效益值的行为ay;5)微电网用户MGx观察其他微电网用户当前时隙所采用行为ay,结合自身的行为ax与MGy进行交易,并计算本次信息传输的即时回报ux;6)更新微电网用户MGx的状态以及强化学习下Q学习算法的Q值表、V值表;7)微电网用户MGx重复步骤3)‑6),直到找到最优策略。
【技术特征摘要】
1.基于强化学习的微电网电能分配方法,其特征在于包括以下步骤:1)设置:N个微电网用户MG和一个发电厂PP;微电网用户之间的买的价格ρ-、卖的价格ρ+以及微电网用户和发电厂PP之间的买的价格卖的价格微电网用户MG最大储能值E和一次交易的最大交易值M;微电网各电能值的增益g;2)微电网用户MGx初始化学习因子γ、折扣因子β和最大时隙m,选择最优动作的概率p,设置Q值表、V值表值为0;3)微电网用户MGx在k时隙的状态s,并根据Q值表,选择最优行为ax;4)微电网用户MGy在k时隙的状态s,根据greedy策略选择可行交易行为下所能达到最大效益值的行为ay;5)微电网用户MGx观察其他微电网用户当前时隙所采用行为ay,结合自身的行为ax与MGy进行交易,并计算本次信息传输的即时回报ux;6)更新微电网用户MGx的状态以及强化学习下Q学习算法的Q值表、V值表;7)微电网用户MGx重复步骤3)-6),直到找到最优策略。2.如权利要求1所述基于强化学习的微电网电能分配方法,其特征在于在步骤1)中,所述N为3,3个微电网用户分两类:采用强化学习...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。