一种国家电网雷击预测方法技术

技术编号:24499493 阅读:92 留言:0更新日期:2020-06-13 04:26
本发明专利技术公开了一种国家电网雷击预测方法,涉及机器学习领域,用于对国家电网的电力传输线路、电力塔杆进行雷击风险预测,包括如下步骤:采集历史信息,形成完整的历史数据,完整的历史数据的维度即为数据特征,对数据特征进行选择,训练Catboost模型,采集当前信息,形成完整的当前数据,利用训练好的Catboost模型进行雷击风险预测。本发明专利技术所提供的方法可以预测电力塔杆以及电力传输线路发生雷击风险的概率和风险等级,提前部署应对措施。

A lightning prediction method for national power grid

【技术实现步骤摘要】
一种国家电网雷击预测方法
本专利技术涉及机器学习领域,具体涉及一种国家电网雷击预测方法。
技术介绍
随着我国电力行业的不断发展壮大,国家电网的输电线路规模也在不断扩大。但是由于很多输电线路都设铺设野外,并且电力塔杆本身高度较高,因而经常遭受到雷击,造成线路跳闸、损毁,严重影响电力系统的正常运行,对居民生活造成不便。目前,面对国家电网可能遭受的雷击风险,主要措施还停留在加强避雷措施、加强输电线路本体强度、采取一些应急措施等方法进行应对,并没有对国家电网的电力塔杆、电力传输线路以及电力传输通道出现雷击风险的可能性提前做出预警。
技术实现思路
为解决前述问题,本专利技术提供了一种国家电网雷击预测方法,以预测电力塔杆、电力传输线路以及电力传输通道发生雷击风险的概率和风险等级。为了达到上述目的,本专利技术采用如下技术方案:一种国家电网雷击预测方法,所述国家电网雷击预测方法用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行雷击风险预测,包括如下步骤:采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,所述维度即为数据特征;采用遗传算法对数据特征进行选择,得到训练特征集;利用训练特征集中的训练特征训练Catboost模型;采集当前信息,对当前信息进行整理,形成完整的当前数据;基于完整的当前数据,利用训练好的Catboost模型进行雷击风险预测。可选的,集历史信息包括现场维修部门部署历史信息、雷电历史信息、地形地貌历史信息、塔杆及线路台账历史信息和气象历史信息;现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。可选的,对历史信息进行整理,形成完整的历史数据具体包括:基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;对各个历史信息下缺失的数值子信息补充完整;对各个历史信息下的非数值子信息进行独热编码;独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。可选的,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。可选的,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。可选的,采用遗传算法对数据特征进行选择具体包括:步骤1:设置初始的种群的大小M、终止代数T、选择概率、交叉概率以及变异概率,其中,所述种群为对所有数据特征是否选择的编码,初始的种群的大小M为随机生成的对数据特征是否选择的编码的个数;步骤2:将训练特征进行编码;步骤3:确定适应度函数,计算种群中每个个体的适应度;步骤4:根据选择概率从父代种群中选择个体;步骤5:以交叉概率进行交叉操作,在确定交叉码位后,通过交换双亲的部分码位产生新的个体;步骤6:以变异概率进行变异操作,将个体染色体编码串中的基因座上的部分基因值用该基因座上的其它等位基因替换,从而形成新的个体;步骤7:如果当前迭代的代数t<终止代数T,则对当前迭代的代数t加1,转到步骤2重新进行,如果当前迭代的代数t=终止代数T,结束运算,将运算得到的适应度最大的个体作为最优解输出。可选的,所述Catboost模型被训练的参数包括学习率learning_rate、树最大深度max_depth、最大决策树数目iterations、L2正则化系数l2_leaf_reg、损失函数loss_function、数值特征分割数border_count、类别特征分割数ctr_border_count。可选的,所述Catboost模型输出的AUC值作为Catboost模型的适应度值。可选的,利用训练好的Catboost模型进行雷击风险预测,包括对电力塔杆预测、对电力传输线路预测和对电力传输通道预测;对待预测区域的国家电网的电力传输线路划分第一区间,在任一第一区间内,任一电力塔杆的预测结果是有雷击风险,则该第一区间电力塔杆的雷击风险发生状态为有风险;且雷击风险发生概率为该第一区间内所有电力塔杆预测结果为有风险的概率最大值;在任一第一区间内,所有电力塔杆的预测结果均为无雷击风险,则该第一区间电力塔杆的雷击风险发生状态为无风险;对电力传输线路的预测为待预测区域内所有第一区间电力塔杆的雷击风险发生状态中出现次数最多的风险发生状态,电力传输线路风险发生概率为取待预测区域内所有第一区间的电力塔杆的雷击风险发生概率的最大值;对待预测区域的国家电网的电力传输通道划分第二区间,对电力传输通道的预测为待预测区域内所有第二区间电力塔杆的雷击风险发生状态中出现次数最多的风险发生状态,电力传输通道风险发生概率为取待预测区域内所有第二区间的电力塔杆的雷击风险发生概率的最大值。可选的,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同。本专利技术具有如下有益效果:1、由于国家电网遭受雷击的数据来源不同,脏数据比较多,因此,对采集的数据进行处理,对缺失的数据补全,对非数值型的数据进行编码,不仅便于计算机识别,也避免了脏数据、缺失数据对算法效果造成负面影响。而由于雷击风险数据来源较多,并且数据的维度较高,因此,采用遗传算法高效的、并行的筛选出数量合适的最优数据作为训练集,避免数据冗余导致计算速度减慢,同时还能保证数据的准确以及预测结果的准确;2、采用Catboost模型,避免了对于训练集过拟合的问题,减少从低频类别获得的噪声,同时具有卓越的性能和鲁棒性,易于使用,进一步保证预测结果的准确性和稳定性,以便及时发现风险并避免风险,根据风险等级辅助确定治理措施,减少人力物力的损失,提高员工工作效率。本专利技术的这些特点和优点将会在下面的具体实施方式以及附图中进行详细的揭露。本专利技术最佳的实施方式或手段将结合附图来详尽表现,但并非是对本专利技术技术方案的限制。另外,在每个下文和附图中出现的这些特征、要素和组件是具有多个,并且为了表示方便而标记了不同的符号或数字,但均表示相同或相似构造或功能的部件。...

【技术保护点】
1.一种国家电网雷击预测方法,其特征在于,所述国家电网雷击预测方法用于对国家电网的电力塔杆、电力传输线路和电力传输通道进行雷击风险预测,包括如下步骤:/n采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,所述维度即为数据特征;/n采用遗传算法对数据特征进行选择,得到训练特征集;/n利用训练特征集中的训练特征训练Catboost模型;/n采集当前信息,对当前信息进行整理,形成完整的当前数据;/n基于完整的当前数据,利用训练好的Catboost模型进行雷击风险预测。/n

【技术特征摘要】
1.一种国家电网雷击预测方法,其特征在于,所述国家电网雷击预测方法用于对国家电网的电力塔杆、电力传输线路和电力传输通道进行雷击风险预测,包括如下步骤:
采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,所述维度即为数据特征;
采用遗传算法对数据特征进行选择,得到训练特征集;
利用训练特征集中的训练特征训练Catboost模型;
采集当前信息,对当前信息进行整理,形成完整的当前数据;
基于完整的当前数据,利用训练好的Catboost模型进行雷击风险预测。


2.根据权利要求1所述的国家电网雷击预测方法,其特征在于,采集历史信息包括现场维修部门部署历史信息、雷电历史信息、地形地貌历史信息、塔杆及线路台账历史信息和气象历史信息;
现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;
气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。


3.根据权利要求1所述的国家电网雷击预测方法,其特征在于,对历史信息进行整理,形成完整的历史数据具体包括:
基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整;
对各个历史信息下的非数值子信息进行独热编码;
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。


4.根据权利要求3所述的国家电网雷击预测方法,其特征在于,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。


5.根据权利要求3所述的国家电网雷击预测方法,其特征在于,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。


6.根据权利要求1所述的国家电网雷击预测方法,其特征在于,采用遗传算法对数据特征进行选择具体包括:
步骤1:设置初始的种群的大小M、终止代数T、选择概率、交叉概率以及变异概率,其中,所述种...

【专利技术属性】
技术研发人员:吴和俊熊志刚王敏康陆宇宁程田宝胡驰远
申请(专利权)人:杭州华网信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1