一种国家电网机械外破预测方法技术

技术编号:24577622 阅读:26 留言:0更新日期:2020-06-21 00:36
本发明专利技术公开了一种国家电网机械外破预测方法,涉及机器学习领域,用于对国家电网的电力塔杆、电力传输线路和电力传输通道进行机械外破风险预测,包括如下步骤:采集历史信息,形成完整的历史数据,对完整的历史数据进行重采样,训练Catboost模型,采集当前信息,形成完整的当前数据,利用训练好的Catboost模型进行机械外破风险预测。本发明专利技术所提供的方法可以预测电力塔杆、电力传输线路以及电力传输通道发生机械外破风险的概率和风险等级,提前部署应对措施。

A prediction method of mechanical breakdown in State Grid

【技术实现步骤摘要】
一种国家电网机械外破预测方法
本专利技术涉及机器学习领域,具体涉及一种国家电网机械外破预测方法。
技术介绍
随着经济的发展,各地区基础设施建设都在如火如荼地开展。在工程建设中,各种大型工程机械,如吊车、挖掘机等在工地来回穿梭,给附近的电力塔杆以及电力传输线路带来了不小的风险。这种工程机械对电力塔杆以及电力传输线路造成损毁的风险即称之为机械外破风险。由于少数施工人员的安全知识和安全意识存在问题,使得大型工程机械与高压线路之间的安全距离难以得到有效控制,极易发生放电、碰线事故,导致大面积停电。这不仅给肇事者带来人身伤害、给电力企业造成损失,也对工地周边的工厂和居民的用电造成影响。但是,目前对于国家电网的电力塔杆、电力传输线路出现机械外破的主要应对措施还处于加强防护和对于出现问题以后的应急,并没有对国家电网的电力塔杆、电力传输线路和电力传输通道出现机械外破风险的可能性提前做出预警。
技术实现思路
为解决前述问题,本专利技术提供了一种国家电网机械外破预测方法,以预测电力塔杆、电力传输线路以及电力传输通道发生机械外破风险的概率和风险等级。为了达到上述目的,本专利技术采用如下技术方案:一种国家电网机械外破预测方法,所述国家电网机械外破预测方法用于对国家电网的电力塔杆、电力传输线路以及电力传输通道进行机械外破风险预测,包括如下步骤:采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,所述维度即为数据特征;采用SMOTE+TomekLinks算法对完整的历史数据进行重采样,形成训练数据集;利用训练数据集训练Catboost模型;采集当前信息,对当前信息进行整理,形成完整的当前数据;基于完整的当前数据,利用训练好的Catboost模型进行机械外破风险预测。可选的,采集历史信息包括现场维修部门部署历史信息、塔杆及线路台账历史信息和气象历史信息;现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。可选的,对历史信息进行整理,形成完整的历史数据具体包括:基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;对各个历史信息下缺失的数值子信息补充完整;对各个历史信息下的非数值子信息进行独热编码;独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。可选的,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。可选的,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。可选的,采用SMOTE+TomekLinks算法对完整的历史数据进行重采样具体包括:从完整的历史数据中筛选出正类样本,所述正类样本为完整的历史数据中与机械外破相关的样本;对于第i个正类样本xi使用K近邻算法,求出距离第i个正类样本xi最近的k个正类样本,所述距离为正类样本之间n维特征空间的欧氏距离,然后从距离第i个正类样本xi最近的k个正类样本中随机选取一个,生成新数据:其中,xnew为新样本,为距离第i个正类样本xi最近的k个正类样本,δ∈[0,1]随机数;采用SOMTE算法生成了新的正类样本后得到扩充后的数据集,找出扩充后的数据集中构成TomekLink对样本,构成TomekLink对的数据满足下述条件:在所述样本集中,样本xj和样本xk的类别不同,样本xj和样本xk的距离为d(xj,xk),若不存在样本xl,使得d(xl,xj)<d(xj,xk)或者d(xl,xk)<d(xj,xk)成立,则样本xj和样本xk构成TomekLink对;删除构成TomekLink对的所有样本。可选的,所述Catboost模型被训练的参数包括学习率learning_rate、树最大深度max_depth、最大决策树数目iterations、L2正则化系数l2_leaf_reg、损失函数loss_function、数值特征分割数border_count、类别特征分割数ctr_border_count。可选的,所述Catboost模型输出的AUC值作为Catboost模型的适应度值。可选的,利用训练好的Catboost模型进行机械外破风险预测,包括对电力塔杆预测、对电力传输线路预测以及对电力传输通道预测;对待预测区域的国家电网的电力传输线路划分第一区间,在任一第一区间内,任一电力塔杆的预测结果为有机械外破风险,则该第一区间电力塔杆的机械外破风险发生状态为有风险;且机械外破风险发生概率为该第一区间内所有电力塔杆预测结果为有风险的概率最大值;在任一第一区间内,所有电力塔杆的预测结果均为无机械外破风险,则该第一区间电力塔杆的机械外破风险发生状态为无风险;对电力传输线路的预测为待预测区域内所有第一区间电力塔杆的机械外破风险发生状态中出现次数最多的风险发生状态,电力传输线路风险发生概率为:取待预测区域内所有第一区间的电力塔杆的机械外破风险发生概率的最大值;对待预测区域的国家电网的电力传输通道划分第二区间,对电力传输通道的预测为待预测区域内所有第二区间电力塔杆的机械外破风险发生状态中出现次数最多的风险发生状态,电力传输通道风险发生概率为:取待预测区域内所有第二区间的电力塔杆的机械外破风险发生概率的最大值。可选的,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同。本专利技术具有如下有益效果:1、由于国家电网机械外破数据来源不同,脏数据比较多,并且类别不平衡,因此,对采集的数据进行处理,对缺失的数据补全,对非数值型的数据进行编码,采用SMOTE+TomekLinks算法对数据进行筛选,避免了正负样本不平衡对算法效果造成负面影响,保证数据的准确以及预测结果的准确;2、采用Catboost模型,避免了对于训练数据集中数据的过拟合,减少从低频类别获得的噪声,同时具有卓越的性能和鲁棒性,易于使用,进一步保证预测结果的准确性和稳定性,以便及时发现风险并避免风险,根据风险等级辅助确定治理措施本文档来自技高网...

【技术保护点】
1.一种国家电网机械外破预测方法,其特征在于,所述国家电网机械外破预测方法用于对国家电网的电力塔杆、电力传输线路和电力传输通道进行机械外破风险预测,包括如下步骤:/n采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,所述维度即为数据特征;/n采用SMOTE+Tomek Links算法对完整的历史数据进行重采样,形成训练数据集;/n利用训练数据集训练Catboost模型;/n采集当前信息,对当前信息进行整理,形成完整的当前数据;/n基于完整的当前数据,利用训练好的Catboost模型进行机械外破风险预测。/n

【技术特征摘要】
1.一种国家电网机械外破预测方法,其特征在于,所述国家电网机械外破预测方法用于对国家电网的电力塔杆、电力传输线路和电力传输通道进行机械外破风险预测,包括如下步骤:
采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,所述维度即为数据特征;
采用SMOTE+TomekLinks算法对完整的历史数据进行重采样,形成训练数据集;
利用训练数据集训练Catboost模型;
采集当前信息,对当前信息进行整理,形成完整的当前数据;
基于完整的当前数据,利用训练好的Catboost模型进行机械外破风险预测。


2.根据权利要求1所述的国家电网机械外破预测方法,其特征在于,采集历史信息包括现场维修部门部署历史信息、塔杆及线路台账历史信息和气象历史信息;
现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;
气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。


3.根据权利要求2所述的国家电网机械外破预测方法,其特征在于,对历史信息进行整理,形成完整的历史数据具体包括:
基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整;
对各个历史信息下的非数值子信息进行独热编码;
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。


4.根据权利要求3所述的国家电网机械外破预测方法,其特征在于,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。


5.根据权利要求3所述的国家电网机械外破预测方法,其特征在于,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。


6.根据权利要求1所述的国家电网机械外破预测方法,其特征在于,采用SMOTE+TomekLinks算法对完整的历史数据进行重采样具体包括:
从完整的历史数据中筛选出正类样本,所述正类样本为完整的历史数据中与机械外破相关的数据;
对于第i个正类样本xi使用K近邻算法,求出距...

【专利技术属性】
技术研发人员:吴和俊熊志刚王敏康陆宇宁程田宝胡驰远
申请(专利权)人:杭州华网信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1