基于强化学习的微电网电能分配方法组成比例

技术编号：15299732 阅读：35 留言：0更新日期：2017-05-12 01:56

基于强化学习的微电网电能分配方法，涉及微电网。解决微电网电能交易控制的问题，提供一种基于强化学习的微电网电能交易系统。根据其他微电网和发电厂的电能交易值以及自身的储电量等信息，采用强化学习算法，选择每次交易的最优电能值。微电网根据每次交易的即时回报进行信息更新，并对下一次交易策略做出不同的调整。该方法不需预测周边各微电网的耗电模型和产电模式，可适应动态智能电网场景，通过智能学习获取最优的电量买卖值，从而提高微电网整体效益和电能利用率，并降低对电厂总体电能需求。

Power grid allocation method for microgrid based on Reinforcement Learning

A method for power distribution of microgrid based on reinforcement learning, involving microgrid. To solve the problem of microgrid power transaction control, a microgrid based power transaction system based on reinforcement learning is proposed. According to other micro grid and power plant power transaction value and its own storage capacity information, the reinforcement learning algorithm is used to select the optimal energy value of each transaction. The micro grid updates the information based on the immediate return of each transaction, and makes different adjustments to the next transaction strategy. This method does not need to predict power consumption model around the micro grid and electricity production mode, can adapt to the dynamic scene through the smart grid, intelligent learning to obtain the optimal electricity sale value, so as to improve the overall efficiency of the micro grid and energy utilization, and reduce the overall energy demand of the power plant.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及微电网，尤其是涉及一种基于强化学习的微电网电能分配方法。
技术介绍
微电网的提出是用于整合可再生能源、降低电网成本及提供更好电网质量。微电网包括有源负载、可再生能源发电机及电能存储设备，且可以通过变电站与主电网相连。如果微电网中的本地产能和储能无法满足需求时，可以和主电网进行交易，购买电能；反之，当微电网中有多余的电能时，也可以卖给主电网[S.M.AminandB.F.Wollenberg,“Towardasmartgrid:Powerdeliveryforthe21stcentury,”IEEEPowerEnergyMag.,vol.3,no.5,pp.34–41,Sep./Oct.2005.]。[Z.Wang,B.Chen,J.Wang,etal.,“Coordinatedenergymanagementofnetworkedmicrogridsindistributionsystems,”IEEETrans.onSmartGrid,6(1):45-53,2015.]阐述了一种基于分层结构的主电网和微电网之间的互动交易。[W.Saad,Z.Han,H.V.Poor,andT.Basar,“Game-theoreticmethodsforthesmartgrid:Anoverviewofmicrogridsystems,demand-sidemanagement,andsmartgridcommunications,”IEEESignalProcess.Mag.,vol.29,no.5,pp.86–105,Sep.2012.]指出主电网与...

【技术保护点】
基于强化学习的微电网电能分配方法，其特征在于包括以下步骤：1)设置：N个微电网用户MG和一个发电厂PP；微电网用户之间的买的价格ρ‑、卖的价格ρ+以及微电网用户和发电厂PP之间的买的价格卖的价格微电网用户MG最大储能值E和一次交易的最大交易值M；微电网各电能值的增益g；2)微电网用户MGx初始化学习因子γ、折扣因子β和最大时隙m，选择最优动作的概率p，设置Q值表、V值表值为0；3)微电网用户MGx在k时隙的状态s，并根据Q值表，选择最优行为ax；4)微电网用户MGy在k时隙的状态s，根据greedy策略选择可行交易行为下所能达到最大效益值的行为ay；5)微电网用户MGx观察其他微电网用户当前时隙所采用行为ay，结合自身的行为ax与MGy进行交易，并计算本次信息传输的即时回报ux；6)更新微电网用户MGx的状态以及强化学习下Q学习算法的Q值表、V值表；7)微电网用户MGx重复步骤3)‑6)，直到找到最优策略。

【技术特征摘要】
1.基于强化学习的微电网电能分配方法，其特征在于包括以下步骤：1)设置：N个微电网用户MG和一个发电厂PP；微电网用户之间的买的价格ρ-、卖的价格ρ+以及微电网用户和发电厂PP之间的买的价格卖的价格微电网用户MG最大储能值E和一次交易的最大交易值M；微电网各电能值的增益g；2)微电网用户MGx初始化学习因子γ、折扣因子β和最大时隙m，选择最优动作的概率p，设置Q值表、V值表值为0；3)微电网用户MGx在k时隙的状态s，并根据Q值表，选择最优行为ax；4)微电网用户MGy在k时隙的状态s，根据greedy策略选择可行交易行为下所能达到最大效益值的行为ay；5)微电网用户MGx观察其他微电网用户当前时隙所采用行为ay，结合自身的行为ax与MGy进行交易，并计算本次信息传输的即时回报ux；6)更新微电网用户MGx的状态以及强化学习下Q学习算法的Q值表、V值表；7)微电网用户MGx重复步骤3)-6)，直到找到最优策略。2.如权利要求1所述基于强化学习的微电网电能分配方法，其特征在于在步骤1)中，所述N为3，3个微电网用户分两类：采用强化学习...

【专利技术属性】
技术研发人员：肖亮，周长华，肖星宇，
申请(专利权)人：厦门大学，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人