当前位置: 首页 > 专利查询>三峡大学专利>正文

基于人工情感强化学习的多微网非计划性孤岛控制方法技术

技术编号:26975040 阅读:36 留言:0更新日期:2021-01-06 00:10
本发明专利技术公开了基于人工情感强化学习的多微网非计划性孤岛控制方法,包括:确定多微网非计划性孤岛时期的联络线功率缺额;建立智能体,确定情感系数,计算人工情感强化学习的动态学习率;依据负荷重要等级建立人工情感强化学习的奖励值函数;求解人工情感强化学习的学习值;比较多微网内电源功率与联络线功率缺额,若电源功率大于联络线功率缺额,则由多微网内电源出力,弥补联络线功率缺额,结束;若电源功率小于联络线功率缺额,则利用智能体选择动作空间中元素,执行减载动作,实现多微网的功率平衡。本发明专利技术能够避免因切除重要负荷而引起重大的断电事故,切除负荷时系统的电压和频率波动幅值较小,而且恢复时间短,有利于系统电压和频率的稳定。

【技术实现步骤摘要】
基于人工情感强化学习的多微网非计划性孤岛控制方法
本专利技术属于微电网控制领域,具体涉及一种基于人工情感强化学习的多微网非计划性孤岛控制方法。
技术介绍
随着包含可再生能源的分布式发电和储能系统的微电网得到了广泛推广,由多个微电网系统组成的多微网系统开始出现。多微网可以在并网与孤岛两种模式下运行,当在两种模式之间切换时,多微网需要保证自身运行的安全稳定。当配电网发生故障导致微电网发生非计划性孤岛时,会引起多微网电压与频率的短时震荡,这给多微网的安全运行与负荷供电可靠性带来了一定的挑战,所以有必要找到一种满足复杂情况下的多微网非计划性孤岛控制方法。现有技术中,T.John等2017年发表的论文“Voltageandfrequencycontrolduringmicrogridislandinginamulti-areamulti-microgrid”针对多微网在并离网切换时出现的功率缺额问题,提出了一种改进的模型预测控制(MPC)算法,能够在减载期间维持电压和频率稳定。J.Zhao等2017年发表的论文“Islandpartitionof本文档来自技高网...

【技术保护点】
1.基于人工情感强化学习的多微网非计划性孤岛控制方法,其特征在于,包括以下步骤,/n步骤1:确定多微网非计划性孤岛时期的联络线功率缺额;/n步骤2:建立智能体,确定状态空间和动作空间;/n步骤2.1:确定情感系数,计算人工情感强化学习的动态学习率;/n步骤2.2:依据负荷重要等级建立人工情感强化学习的奖励值函数;/n步骤2.3:求解人工情感强化学习的学习值;/n步骤3:比较多微网内电源功率与联络线功率缺额,若电源功率大于联络线功率缺额,则由多微网内电源出力,弥补联络线功率缺额,结束;若电源功率小于联络线功率缺额,则执行步骤4;/n步骤4:智能体根据学习值选择动作空间中元素,执行减载动作,实现多...

【技术特征摘要】
1.基于人工情感强化学习的多微网非计划性孤岛控制方法,其特征在于,包括以下步骤,
步骤1:确定多微网非计划性孤岛时期的联络线功率缺额;
步骤2:建立智能体,确定状态空间和动作空间;
步骤2.1:确定情感系数,计算人工情感强化学习的动态学习率;
步骤2.2:依据负荷重要等级建立人工情感强化学习的奖励值函数;
步骤2.3:求解人工情感强化学习的学习值;
步骤3:比较多微网内电源功率与联络线功率缺额,若电源功率大于联络线功率缺额,则由多微网内电源出力,弥补联络线功率缺额,结束;若电源功率小于联络线功率缺额,则执行步骤4;
步骤4:智能体根据学习值选择动作空间中元素,执行减载动作,实现多微网的功率平衡。


2.根据权利要求1所述的基于人工情感强化学习的多微网非计划性孤岛控制方法,其特征在于,步骤4中,智能体采用ε-greedy贪心策略选择动作空间中元素,以概率ε选择具有最大学习值的动作,以概率1-ε选择其他动作。


3.根据权利要求1所述的基于人工情感强化学习的多微网非计划性孤岛控制方法,其特征在于,步骤2.1中,所述学习率的计算式如下:






Cf(η)=Kaη+Kb
αη=αCf(η)
其中η为情感系数;fn为情感量化函...

【专利技术属性】
技术研发人员:王灿董庆国张高瑞陈思睿刘颂凯杨楠
申请(专利权)人:三峡大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1