System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及新型台区运行调控,尤其涉及一种含高比例光伏台区的电压调控方法、系统、设备及介质。
技术介绍
1、配电台区作为电力传输的“最后一公里”,它们通常具有辐射状结构,大规模户用光伏并网后,传统低压配电网“单电源”网络转变为“多电源”网络,潮流的分布特征发生根本性变化。由于光伏发电具备波动性、间歇性和随机性,户用光伏并网后,配电台区将会面电压越限和波动、三相不平衡等问题。
2、随着电力电子技术的飞速发展,搭建以交流为主,直流为辅的柔性互联交直流混合台区,将是未来台区发展的主流形式,相比于交流配电网,直流配电网拓扑灵活,潮流可控,具备平抑新能源与新型负荷不确定性的潜力。因此,研究如何充分利用柔性互联装置解决光伏带来的电压质量问题具有重要意义。
3、总结现有的台区电压调控方法主要有:1)调节台区配变分接头。该方法在一定程度上可以调节台区末端用户的电压,但往往会导致首端用户电压偏高或偏低。2)加装无功补偿装置。该方法能够一定程度上降低线路压降,但难以解决光伏接入带来的电压升高问题。3)基于功率的调控手段。该方法主要通过削减光伏并网功率和调节分布式储能装置功率,该方法依赖于储能的配置,在高比例光伏接入的台区中调节能力有限。并且该方法需要获取台区的所有拓扑参数、设备状态以及光伏发电功率的预测值,这在现有的台区采集量测能力下中难以实现。
技术实现思路
1、本申请提供了一种含高比例光伏台区的电压调控方法、系统、设备及介质,用于在台区参数未知、光伏预测数据不准条件下的进行电
2、有鉴于此,本申请第一方面提供了一种含高比例光伏台区的电压调控方法,所述方法包括:
3、s1、通过定义强化学习智能体的状态、动作和奖励,从而构建含高比例光伏台区电压调控问题的求解框架;
4、s2、通过将智能体与仿真环境进行交互,训练智能体的策略函数,得到训练好的策略网络;
5、s3、将电压待调控的实际环境状态输入训练好的策略网络中,得到智能体输出的电压调控策略。
6、可选地,所述定义强化学习智能体的状态、动作和奖励,具体包括:
7、将智能体的状态定义为柔性互联装置直流侧储能的荷电状态socdc;
8、将智能体的动作定义为柔性互联装置直流侧储能的充电功率pess及削减的光伏并网功率;
9、将智能体的奖励定义为:
10、;
11、式中,为智能体在t时刻状态下执行动作和获得环境反馈的奖励值;分别为t时刻节点i在a、b、c相的电压相量;;分别为台区电压幅值的上限和下限。
12、可选地,所述通过将智能体与所述仿真环境进行交互,训练智能体的策略函数,得到训练好的策略网络,之前还包括:
13、基于台区的历史运行数据,利用lstm神经网络拟合时间、状态、动作与奖励之间的函数关系,并将lstm神经网络作为强化学习智能体的仿真环境。
14、可选地,所述通过将智能体与所述仿真环境进行交互,训练智能体的策略函数,得到训练好的策略网络,具体包括:
15、s21、初始化智能体的策略网络与评价网络的网络参数;
16、s22、通过当前的所述策略网络将智能体与仿真环境进行交互,生成采样轨迹;
17、s23、根据当前生成的所述采样轨迹计算回报值,并根据所述回报值计算所述策略网络与所述评价网络的更新梯度,从而更新所述策略网络与所述评价网络的网络参数;
18、s24、重复步骤s22至s23,直至训练轮次达到预设的上限值,得到训练好的策略网络。
19、本申请第二方面提供一种含高比例光伏台区的电压调控系统,所述系统包括:
20、构建单元,用于通过定义强化学习智能体的状态、动作和奖励,从而构建含高比例光伏台区电压调控问题的求解框架;
21、训练单元,用于通过将智能体与仿真环境进行交互,训练智能体的策略函数,得到训练好的策略网络;
22、输出单元,用于将电压待调控的实际环境状态输入训练好的策略网络中,得到智能体输出的电压调控策略。
23、可选地,所述定义强化学习智能体的状态、动作和奖励,具体包括:
24、将智能体的状态定义为柔性互联装置直流侧储能的荷电状态socdc;
25、将智能体的动作定义为柔性互联装置直流侧储能的充电功率pess及削减的光伏并网功率;
26、将智能体的奖励定义为:
27、;
28、式中,为智能体在t时刻状态下执行动作和获得环境反馈的奖励值;分别为t时刻节点i在a、b、c相的电压相量;;分别为台区电压幅值的上限和下限。
29、可选地,还包括:搭建单元;
30、所述搭建单元,用于基于台区的历史运行数据,利用lstm神经网络拟合时间、状态、动作与奖励之间的函数关系,并将lstm神经网络作为强化学习智能体的仿真环境。
31、可选地,所述训练单元,具体用于:
32、s21、初始化智能体的策略网络与评价网络的网络参数;
33、s22、通过当前的所述策略网络将智能体与仿真环境进行交互,生成采样轨迹;
34、s23、根据当前生成的所述采样轨迹计算回报值,并根据所述回报值计算所述策略网络与所述评价网络的更新梯度,从而更新所述策略网络与所述评价网络的网络参数;
35、s24、重复步骤s22至s23,直至训练轮次达到预设的上限值,得到训练好的策略网络。
36、本申请第三方面提供一种含高比例光伏台区的电压调控设备,所述设备包括处理器以及存储器:
37、所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
38、所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的含高比例光伏台区的电压调控方法的步骤。
39、本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的含高比例光伏台区的电压调控方法。
40、从以上技术方案可以看出,本申请具有以下优点:
41、本申请提供了一种含高比例光伏台区的电压调控方法,包括:s1、通过定义强化学习智能体的状态、动作和奖励,从而构建含高比例光伏台区电压调控问题的求解框架;s2、通过将智能体与仿真环境进行交互,训练智能体的策略函数,得到训练好的策略网络;s3、将电压待调控的实际环境状态输入训练好的策略网络中,得到智能体输出的电压调控策略。
42、与现有技术相比,本申请的调控方法:
43、1)不依赖于模型参数:本申请提出的方法能够在台区拓扑参数与光伏预测出力均不确定的条件下求解台区的电压调控策略。这与以往要求台区模型参数完整的方法不同,适用性更广。
44、2)调控速度更快:本申请得到的训练后的调控策略在实际应用中仅需将定义的状态量输入至策略网络中,即可本文档来自技高网...
【技术保护点】
1.一种含高比例光伏台区的电压调控方法,其特征在于,包括:
2.根据权利要求1所述的含高比例光伏台区的电压调控方法,其特征在于,所述定义强化学习智能体的状态、动作和奖励,具体包括:
3.根据权利要求1所述的含高比例光伏台区的电压调控方法,其特征在于,所述通过将智能体与所述仿真环境进行交互,训练智能体的策略函数,得到训练好的策略网络,之前还包括:
4.根据权利要求1所述的含高比例光伏台区的电压调控方法,其特征在于,所述通过将智能体与所述仿真环境进行交互,训练智能体的策略函数,得到训练好的策略网络,具体包括:
5.一种含高比例光伏台区的电压调控系统,其特征在于,包括:
6.根据权利要求5所述的含高比例光伏台区的电压调控系统,其特征在于,所述定义强化学习智能体的状态、动作和奖励,具体包括:
7.根据权利要求5所述的含高比例光伏台区的电压调控系统,其特征在于,还包括:搭建单元;
8.根据权利要求5所述的含高比例光伏台区的电压调控系统,其特征在于,所述训练单元,具体用于:
9.一种含高比例光伏台
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的含高比例光伏台区的电压调控方法。
...【技术特征摘要】
1.一种含高比例光伏台区的电压调控方法,其特征在于,包括:
2.根据权利要求1所述的含高比例光伏台区的电压调控方法,其特征在于,所述定义强化学习智能体的状态、动作和奖励,具体包括:
3.根据权利要求1所述的含高比例光伏台区的电压调控方法,其特征在于,所述通过将智能体与所述仿真环境进行交互,训练智能体的策略函数,得到训练好的策略网络,之前还包括:
4.根据权利要求1所述的含高比例光伏台区的电压调控方法,其特征在于,所述通过将智能体与所述仿真环境进行交互,训练智能体的策略函数,得到训练好的策略网络,具体包括:
5.一种含高比例光伏台区的电压调控系统,其特征在于,包...
【专利技术属性】
技术研发人员:刘通,徐敏,孙健,史训涛,肖小兵,柯清派,邱杨鑫,李楷然,林致远,
申请(专利权)人:南方电网科学研究院有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。