【技术实现步骤摘要】
一种基于强化学习算法的输电网扩展规划方法
本专利技术属于电网规划
,特别涉及是一种基于强化学习算法的输电网扩展规划方法。
技术介绍
输电网扩展规划是确定在什么时间、什么地方、建设什么类型和容量的输变电工程。随着我国电网不断建设,我国已经进入大电网时代,电网规模的增大导致输电网扩展规划问愈发难以求解。现阶段,输电网扩展规划问题的常用求解方法分为数学优化方法和启发式算法两类。其中数学优化方法将非线性的优化模型转化线性化进行求解,常用方法为整数规划、线性规划等。数学优化方法理论上来说能得到最优解,但模型线性化后的最优解可能失真,且电网互联背景下,数学优化方法存在计算量大、求解困难等问题,难以服务于工程实际。启发式算法是近代以来新兴的一类算法,是通过模拟自然界中的一些现象的求解方法,常用方法有粒子群算法、遗传算法、蚂蚁算法等。启发式算法的计算模式贴近人的思考模式,易于理解,但由于收敛性问题,一般能得到几组局部最优解,难以给出全局最优解。随着电网规模的不断扩大和电力系统复杂程度的不断加深,数学优化方法和启发式算法 ...
【技术保护点】
1.一种基于强化学习算法的输电网扩展规划方法,其特征在于,包括以下步骤:/n步骤1:根据现状电网建设情况,确定线路待选集F,以线路待选集F为基础,构建强化学习的环境、状态、动作及对应智能体,构建适用于输电网扩展规划的QTEP算法;/n步骤2:设定自适应因子λ,修正Q值计算方法,来提升QTEP算法的收敛速度;/n步骤3:以规划周期内综合经济成本最小为目标构建目标函数,以电网运约束、N-1电网安全约及蒙特卡洛误差约束为约束条件,建立综合考虑经济性和可靠性的电网扩展规划优化模型;/n步骤4:根据步骤3建立的优化模型,设计QTEP算法的综合特性反馈奖励函数和收敛条件,利用QTEP算 ...
【技术特征摘要】
1.一种基于强化学习算法的输电网扩展规划方法,其特征在于,包括以下步骤:
步骤1:根据现状电网建设情况,确定线路待选集F,以线路待选集F为基础,构建强化学习的环境、状态、动作及对应智能体,构建适用于输电网扩展规划的QTEP算法;
步骤2:设定自适应因子λ,修正Q值计算方法,来提升QTEP算法的收敛速度;
步骤3:以规划周期内综合经济成本最小为目标构建目标函数,以电网运约束、N-1电网安全约及蒙特卡洛误差约束为约束条件,建立综合考虑经济性和可靠性的电网扩展规划优化模型;
步骤4:根据步骤3建立的优化模型,设计QTEP算法的综合特性反馈奖励函数和收敛条件,利用QTEP算法求解优化模型,得到综合考虑经济行和可行性的最优输电网扩展规划模型。
2.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤1所述的强化学习的环境、状态、动作及对应智能体,以及QTEP算法构建步骤为:
步骤1.1:根据现状电网建设情况,确定由n条线路组成的线路待选集F={l1,l2,…,lk,…,ln},其中lk为第k条待建设线路;
步骤1.2:构建QTEP算法环境为线路待选集F={l1,l2,…,lk,…,ln}本身,即所有可选的待建设线路;
步骤1.3:构建QTEP算法状态为智能体根据线路待选集F给出的当前规划方案;
步骤1.4:构建QTEP算法动作为改变当前规划方案的线路待选集状态;
步骤1.5:建立智能体动作更新策略,即每一次动作仅改变一条线路状态;
步骤1.6:构建QTEP算法智能体,智能体为状态和动作两个属性的集合。
3.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤2中设计的自适应因子λ,Q值计算方法修正为:
式中,Q(si,ai)为状态si下对应动作ai的Q值,为状态si下对应动作ai的反馈奖励,γ为折现率;为当智能体执行动作ai转移至状态si+1时,智能体在状态si+1下的建设线路的数量;n为待选线路总量。
4.根据权利要求1所述的一种基于强化学习算法的输电网扩展规划方法,其特征在于,步骤3中的目标函数为规划方案投资成本与可靠性成本之和的最小值,投资成本为等年值法折算的年平均费用,可靠性成本通过蒙特卡洛等分散法求得。<...
【专利技术属性】
技术研发人员:沈力,魏明奎,王渝红,蔡绍荣,江栗,胡胜杰,路亮,
申请(专利权)人:国家电网公司西南分部,四川大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。