一种基于改进强化学习的输电线路路径规划方法技术

技术编号:42031301 阅读:47 留言:0更新日期:2024-07-16 23:19
一种基于改进强化学习的输电线路路径规划方法,该方法利用栅格法构建地理信息图,利用改进强化学习模型探索最优输电线路路径;初始化环境状态,设定路径起始位置和目标位置;智能体基于当前状态在Q表中选择动作向量,将选择的动作向量与由人工势场生成的初始动作向量叠加,执行叠加后的动作向量,获得奖励值并更新环境状态和Q表;选择下一次动作向量,直至智能体到达目标位置,本轮训练结束,开始下一回合的训练,直至达到最大训练次数,输出所有训练轮次中奖励值最高的路径。本发明专利技术利用人工势场生成初始策略并编码到动作向量中,对智能体路径规划起导引作用,加快智能体的收敛和缩短探索周期,提高学习效率。

【技术实现步骤摘要】

本专利技术属于输电线路路径规划,具体涉及一种基于改进强化学习的输电线路路径规划方法


技术介绍

1、随着社会经济的发展和电力负荷的增长,电网规模不断扩大,输电网络的结构也变得日益复杂。在面对愈加复杂的电网建设环境、外部环境的变化、行业发展的需要和设计理念的转变时,采用新的智能化输电线路路径选线方法迫在眉睫。传统的输电线路路径规划方法主要包括群优化理论、传统最优化理论和图形学方法,会存在搜索效率低下和易陷入局部最优等缺陷。当前输电线路路径规划方法中,一些采用依据环境反馈选择策略的强化学习方法,实现了无模型的最优路径规划。例如文献《基于云平台三维数字化输电线路路径规划方法》谢景海等,基于q-leaning实现了加权地理信息栅格矩阵的最优路径规划;文献《基于改进强化学习的机器人路径规划研究》李威等,引入经验记忆力机制并改进奖励函数,提高了q学习算法收敛速度和优化能力,进一步提高机器人路径规划的效率;文献《基于分层强化学习的数字化输电线路路径规划研究》宋涛等,基于maxq算法的分层rl对粗粒度和细粒度的两层栅格图进行输电线路路径规划,在解决维度灾难的同时保证了精确本文档来自技高网...

【技术保护点】

1.一种基于改进强化学习的输电线路路径规划方法,其特征在于:

2.根据权利要求1所述的一种基于改进强化学习的输电线路路径规划方法,其特征在于:

3.根据权利要求1或2所述的一种基于改进强化学习的输电线路路径规划方法,其特征在于:

4.根据权利要求1或2所述的一种基于改进强化学习的输电线路路径规划方法,其特征在于:

5.根据权利要求1或2所述的一种基于改进强化学习的输电线路路径规划方法,其特征在于:

6.根据权利要求5所述的一种基于改进强化学习的输电线路路径规划方法,其特征在于:

7.根据权利要求6所述的一种基于改进强...

【技术特征摘要】

1.一种基于改进强化学习的输电线路路径规划方法,其特征在于:

2.根据权利要求1所述的一种基于改进强化学习的输电线路路径规划方法,其特征在于:

3.根据权利要求1或2所述的一种基于改进强化学习的输电线路路径规划方法,其特征在于:

4.根据权利要求1或2所述的一种基于改进强化学习的输电线路路径规划方法,其特征在于:

5.根据权利要求1或2所述的一种基于改进强化学习的输电线路路径规划方法,其特征在于:

6...

【专利技术属性】
技术研发人员:陈然胡佳周蠡许汉平蔡杰贺兰菲徐昊天李吕满周英博孙利平廖晓红熊川羽李智威马莉乔诗慧熊一张赵阳舒思睿徐桂彬
申请(专利权)人:国网湖北省电力有限公司经济技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1