一种国家电网树线放电预测方法技术

技术编号:24355760 阅读:44 留言:0更新日期:2020-06-03 02:31
本发明专利技术公开了一种国家电网树线放电预测方法,涉及机器学习领域,用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行树线放电风险预测,包括如下步骤:采集历史信息,形成完整的历史数据,对完整的历史数据进行重采样,训练LightGBM模型,采集当前信息,形成完整的当前数据;利用训练好的LightGBM模型进行树线放电风险预测。本发明专利技术所提供的国家电网树线放电预测方法可以预测电力塔杆以及电力传输线路发生树线放电风险的概率和风险等级,提前部署相应措施。

A prediction method of tree line discharge in national power grid

【技术实现步骤摘要】
一种国家电网树线放电预测方法
本专利技术涉及机器学习领域,具体涉及一种国家电网树线放电预测方法。
技术介绍
在电力行业,树障是难以清理的巨大安全隐患,一直以来,“树线”矛盾都是困扰供电安全的沉疴顽疾。每当遇到大风、雨雪等强对流天气,树木极易擦碰或倒伏在电力线路上造成跳闸,这种树木枝叶对国家电网线路造成的损害称之为树线放电。树线放电严重影响政府机关正常工作和居民日常生活,同时也给电网造成了不小的人力财力物力的损失。但是,目前对于国家电网的电力塔杆、电力传输线路出现树线放电的主要应对措施还处于加强防护和对于出现问题以后的应急,并没有对国家电网的电力塔杆、电力传输线路以及电力传输通道出现树线放电风险的可能性提前做出预警。
技术实现思路
为解决前述问题,本专利技术提供了一种国家电网树线放电预测方法,以预测电力塔杆、电力传输线路以及电力传输通道发生树线放电风险的概率和风险等级。为了达到上述目的,本专利技术采用如下技术方案:一种国家电网树线放电预测方法,所述国家电网树线放电预测方法用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行树线放电风险预测,包括如下步骤:采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度;采用MAHAKIL算法对完整的历史数据进行重采样,形成训练数据集;利用训练数据集训练LightGBM模型;采集当前信息,对当前信息进行整理,形成完整的当前数据;基于完整的当前数据,利用训练好的LightGBM模型进行树线放电风险预测。可选的,采集历史信息包括现场维修部门部署历史信息、塔杆及线路台账历史信息、树木类型历史信息、净空距离历史信息和气象历史信息;现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。可选的,对历史信息进行整理,形成完整的历史数据具体包括:基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;对各个历史信息下缺失的数值子信息补充完整;对各个历史信息下的非数值子信息进行独热编码;独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。可选的,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。可选的,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。可选的,采用MAHAKIL算法对完整的历史数据进行重采样具体包括:从完整的历史数据中筛选出正类样本,所述正类样本为完整的历史数据中与树线放电相关的数据;将筛选出的正类样本记为bin,对于bin中的每一个正类样本计算马氏距离,计算公式为:其中,d为马氏距离,x为正类样本,μ为正类样本的均值,T为转置矩阵符号,S为正类样本的协方差矩阵,N为正类样本的维度的个数,是对正类样本中每个维度的均值;按照马氏距离对bin排序并标号,将bin从标号的中位数处一分为二,分别记为bin1、bin2,并且按标号为bin1、bin2中的每个样本指定一个唯一标签;分别从bin1、bin2中各自随机选择一个正类样本,构成样本对,计算样本对均值,作为重采样的新的样本。可选的,需要优化的LightGBM参数包括:基分类器个数、树最大深度、叶节点数、学习率、工具箱数、单个叶子上数据的最小数量、每次迭代中随机选择特征的比例、不进行重采样的情况下随机选择的数据。可选的,所述LightGBM模型输出的AUC值作为LightGBM模型的适应度值。可选的,利用训练好的LightGBM模型进行树线放电风险预测,包括对电力塔杆预测、对电力传输线路预测以及对电力传输通道;对待预测区域的国家电网的电力传输线路划分第一区间,在任一第一区间内,任一电力塔杆的预测结果为有树线放电风险,则该第一区间电力塔杆的树线放电风险发生状态为有风险;且树线放电风险发生概率为该第一区间内所有电力塔杆预测结果为有风险的概率最大值;在任一第一区间内,所有电力塔杆的预测结果均为无树线放电风险,则该第一区间电力塔杆的树线放电风险发生状态为无风险;对电力传输线路的预测为待预测区域内所有第一区间电力塔杆的树线放电风险发生状态中出现次数最多的风险发生状态,电力传输线路风险发生概率为:取待预测区域内所有第一区间的电力塔杆的树线放电风险发生概率的最大值;对待预测区域的国家电网的电力传输通道划分第二区间,对电力传输通道的预测为待预测区域内所有第二区间电力塔杆的树线放电风险发生状态中出现次数最多的风险发生状态,电力传输通道风险发生概率为:取待预测区域内所有第二区间的电力塔杆的树线放电风险发生概率的最大值。可选的,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同。本专利技术具有如下有益效果:1、由于国家电网树线放电数据来源不同,脏数据比较多,因此,对采集的数据进行处理,对缺失的数据补全,对非数值型的数据进行编码,不仅便于计算机识别,也避免了脏数据、缺失数据对算法效果造成负面影响。而树线放电风险在现实环境中较少,因此树线放电风险数据是不平衡数据。为了避免数据不平衡对算法效果造成负面影响,本申请采用MAHAKIL算法对数据进行重采样,使训练集中样本数量得到有效扩充,既保证了样本的多样性,又避免了生成的新样本超出边界的问题,保证数据的准确以及预测结果的准确;2、采用LightGBM模型,避免了对于训练数据集中数据的过拟合,并且,LightGBM模型拥有更快的训练速度和更高的准确率,能够支持GPU,便于处理大规模数据,面对电网每天产生的海量数据能够及时有效的处理。以便及时发现风险并避免风险,根据风险等级辅助确定治理措施,减少人力物力的损失,提高员工工作效率。本专利技术的这些特点和优点将会在下面的具体实施方式以及附图中进行详细的揭露。本专利技术最佳的实施方式或手段将结合附图来详尽表现,但并非是对本专利技术技术方案的限制。另外,在每个下文和附图中出现的这些特征、要素和组件是具有多个,并且为了表示方便而标记了不同的符号本文档来自技高网...

【技术保护点】
1.一种国家电网树线放电预测方法,其特征在于,所述国家电网树线放电预测方法用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行树线放电风险预测,包括如下步骤:/n采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度;/n采用MAHAKIL算法对完整的历史数据进行重采样,形成训练数据集;/n利用训练数据集训练LightGBM模型;/n采集当前信息,对当前信息进行整理,形成完整的当前数据;/n基于完整的当前数据,利用训练好的LightGBM模型进行树线放电风险预测。/n

【技术特征摘要】
1.一种国家电网树线放电预测方法,其特征在于,所述国家电网树线放电预测方法用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行树线放电风险预测,包括如下步骤:
采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度;
采用MAHAKIL算法对完整的历史数据进行重采样,形成训练数据集;
利用训练数据集训练LightGBM模型;
采集当前信息,对当前信息进行整理,形成完整的当前数据;
基于完整的当前数据,利用训练好的LightGBM模型进行树线放电风险预测。


2.根据权利要求1所述的国家电网树线放电预测方法,其特征在于,采集历史信息包括现场维修部门部署历史信息、塔杆及线路台账历史信息、树木类型历史信息、净空距离历史信息和气象历史信息;
现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;
气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。


3.根据权利要求2所述的国家电网树线放电预测方法,其特征在于,对历史信息进行整理,形成完整的历史数据具体包括:
基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整;
对各个历史信息下的非数值子信息进行独热编码;
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。


4.根据权利要求3所述的国家电网树线放电预测方法,其特征在于,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。


5.根据权利要求3所述的国家电网树线放电预测方法,其特征在于,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。


6.根据权利要求1所述的国家电网树线放电预测方法,其特征在于,采用MAHAKIL算法对完整的历史数据进行重采样...

【专利技术属性】
技术研发人员:吴和俊熊志刚王敏康陆宇宁程田宝胡驰远
申请(专利权)人:杭州华网信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1