【技术实现步骤摘要】
基于强化学习的新能源充电站的优化布置方法
[0001]本专利技术属于城市建筑布局规划领域,具体来说是一种基于强化学习的新能源充电站的优化布置方法。
技术介绍
[0002]如今对于充电站选址布局问题,大多是针对路径、时间、成本等构造目标函数,或考虑配电网的网损、电压偏移等电力相关特性构造目标函数,而尚未有将配电网与城市交通网叠加的充电停车场选址定容研究。对于充电站选址布局模型的求解,现在的主流方法是使用遗传算法或粒子群算法进行求解,这些方法在求解过程中,各个充电站之间缺乏联系,从而会导致收敛速度不够快;同时,这些方法都缺乏对于环境的探查和交互,当环境出现变化时,难以做出调整及时得出最优解,而在新能源充电站建设过程中或者建成之后,由于城市布局的不断调整,现有的布局结构可能不再适用,而传统方法下新的最优布局需要反复的尝试,耗时耗力,在方法实际应用中的拓展上具有一定的局限性。
技术实现思路
[0003]本专利技术是为了解决上述提到的现有技术所存在的不足之处,提出了一种基于强化学习的新能源充电站的优化布置方法,以期能在 ...
【技术保护点】
【技术特征摘要】
1.一种基于强化学习的新能源充电站的优化布置方法,其特征在于,包括以下步骤:步骤1、搭建新能源充电站系统:令L=[l1,l2,...,l
i
,...,l
n
]表示n个位置上新能源充电站的建设状态,若l
i
=
‑
1,表示第i个位置未建设新能源充电站,若l
i
=1,表示第i个位置已建设新能源充电站,且每个位置最多只能建设一个新能源充电站,i=1,2,...,n;令D=[d1,d2,...,d
i
,...,d
n
]表示n个位置上新能源充电站分别与配电网变电站的实际距离,d
i
表示第i个位置上的新能源充电站与所述配电网变电站的实际距离;若l
i
=
‑
1,则d
i
=0;令R=[r1,r2,...,r
i
,...,r
n
]表示n个位置上新能源充电站的服务半径,r
i
表示第i个位置充上新能源充电站的服务半径,若l
i
=
‑
1,则r
i
=0;令W=[w1,w2,...,w
i
,...,w
n
]表示n个位置上新能源充电站的用电负载,w
i
表示第i个位置上新能源充电站的用电负载,若l
i
=
‑
1,则w
i
=0;令S=[L,D,R,W]表示新能源充电站系统的布置信息;步骤2、建立新能源充电站系统的强化学习模型,包括:决策体和执行体;其中,所述决策体由深度卷积网络V(θ)组成,θ是深度卷积网络V(θ)的参数集合;所述执行体包含有奖励模块;步骤3、在新能源充电站系统下训练强化学习模型:步骤3.1、定义回合数为m,并初始化m=1;步骤3.2、定义每回合训练次数为t,并初始化t=1;定义第m回合下第t次训练时的新能源充电站系统的布置信息为初始化第m回合下第t次训练时的n个位置上新能源充电站的建设状态均为1,从而初始化步骤3.3、所述布置信息输入所述决策体中,并通过深度卷积网络和策略π输出最优动作价值函数其中,是第m回合下第t次训练时的深度卷积网络,是第m回合下第t次训练时的神经网络的参数集合,是第m回合下第t次训练时的最优动作;步骤3.4、在新能源充电站系统下,所述执行体根据决策体输出的动作...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。