一种电力施工作业节奏预测方法及系统技术方案

技术编号:37221710 阅读:31 留言:0更新日期:2023-04-20 23:07
本发明专利技术涉及电力领域,是电力施工作业节奏预测方法及系统,包括:获取施工信息数据及作业标签数据,并输入自编码器模型中进行训练,得到补全、修正处理后的施工信息数据集以及作业标签数据集,并划分为训练集和测试集;将训练集输入梯度提升决策树模型进行训练;根据梯度提升决策树模型输出的特征重要性筛选排名靠前的特征,输入梯度提升决策树模型中得到离散特征集;对离散特征集进行编码处理后输入支持向量机模型中,对其进行训练;将测试集输入梯度提升决策树与支持向量机的混合模型中,对混合模型进行调参;把无标签样本数据输入调参后的混合模型中,得到是否存在超节奏作业的标签数据。本发明专利技术可智能预测作业人员是否超节奏作业。作业。作业。

【技术实现步骤摘要】
一种电力施工作业节奏预测方法及系统


[0001]本专利技术涉及电力领域,具体是一种电力施工作业节奏预测方法及系统。

技术介绍

[0002]作业人员超节奏作业时,很容易产生疲劳,从而会带来较大的作业风险,为了避免这种情况的发生,需要对作业人员进行超节奏管控。目前,对作业人员的管控一般是人工来监督实现,没有可靠的智能监控方案。
[0003]另一方面,支持向量机(Support Vector Machines,SVM)是一种二分类模型,也是一种定义在特征空间上的间隔最大的线性分类器,它通常引入核函数来解决非线性问题。支持向量机SVM的学习策略就是间隔最大化,可理解为求解凸二次规划的最优化算法;SVM可以解决小样本下机器学习问题,相对神经网络等算法不会面临局部极小值问题,泛化能力较强,广泛运用于各种业务场景中。但支持向量机SVM对缺失数据敏感,并且在非线性问题上没有通用解决方案,很难找到一个合适的核函数;实际运用中,一般需要提前进行大量的特征工程处理,从而将特征离散化,或者尝试不同的核函数来进行映射实验。

技术实现思路

[0004]为克服现有技术的不足,本专利技术提出一种电力施工作业节奏预测方法及系统,通过机器学习的GBDT模型与SVM模型相结合,对施工作业的基础信息进行建模分析,以智能预测作业人员是否超节奏作业。
[0005]本专利技术方法采用如下技术方案来实现:一种电力施工作业节奏预测方法,包括以下步骤:
[0006]获取原始数据,包括施工信息数据、作业人员是否超节奏作业标签数据;
[0007]预处理所获取的原始数据;
[0008]训练自编码器模型,将所述施工信息数据及所述作业标签数据输入自编码器模型中进行训练,获得自编码器模型的最佳参数,并得到空缺值与异常值补全、修正处理后的施工信息数据集X

以及作业标签数据集Y


[0009]数据集划分,将补全和修正处理后的施工信息数据集、作业标签数据集中的样本划分为训练集(X
′1,Y
′1)和测试集(X
′2,Y
′2);
[0010]将训练集(X
′1,Y
′1)输入梯度提升决策树模型进行训练,获得梯度提升决策树模型的最佳超参数;
[0011]筛选重要特征,根据梯度提升决策树模型输出的特征重要性筛选排名靠前的特征,得到降维后的特征集;
[0012]构造新特征,将降维后的特征集输入训练好的梯度提升决策树模型中,将梯度提升决策树模型输出的叶子节点作为新特征,得到新的离散特征集X


[0013]特征独热化,对离散特征集X

进行one

hot编码处理,得到编码处理后的特征集X
″′

Decision Tree,GBDT)做特征筛选实现数据降维,并构造适合输入支持向量机SVM模型中的离散特征,弥补人工经验不足,缩短SVM模型的特征实验周期。
附图说明
[0032]图1是本专利技术实施例中电力施工作业节奏预测方法的流程图。
具体实施方式
[0033]下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。
[0034]实施例1
[0035]如图1所示,本实施例为一种电力施工作业节奏预测方法,具体包括以下步骤:
[0036]S1、原始数据的获取:获取变电数据x1、输电数据x2、配电数据x3、基建数据x4、营销数据x5等作业专业数据,挖掘深度x6、是否有脚手架x7、支模高度x8、基坑支护x9、是否室外作业x
10
、是否高空作业x
11
等施工内容的量化数据,天气信息x
12
,作业人员参与同类型工作次数x
13
等施工信息数据,作业人员是否超节奏作业标签数据y。
[0037]S2、数据清洗:对原始数据进行预处理,包括去除重复值、类别特征one

hot编码等。
[0038]S3、训练自编码器(Auto

Encoder,简称AE)模型:将所获取的施工信息数据x1‑
x
13
以及所述作业标签数据y输入自编码器AE模型中进行训练,根据均方误差MSE值调整自编码器AE模型参数,在MSE达到最小时输出自编码器AE模型的最佳参数,并得到空缺值与异常值补全、修正处理后的施工信息数据集X

(x
′1‑
x

13
)以及作业标签数据集Y

(y

)。
[0039]自编码器AE模型是一种无监督式学习模型,它基于反向传播算法与最优化方法(如梯度下降法),利用输入原始数据集X本身作为输出标签来指导神经网络学习映射关系,得到重构输出数据集X

。利用这个特性,可以很好地对原始数据集X中存在的异常值与空缺值进行补全处理,并且贴合数据本身分布情况。自编码器AE主要包括两个部分:Encoder(编码器)和Decoder(解码器),其中编码器的作用是把高维输入的原始数据集X编码成低维的隐变量h,从而强迫神经网络学习最有信息量的特征;解码器的作用是把隐藏层的隐变量h还原到初始维度,通过调整超参数使解码器的输出尽可能地恢复出原来的输入,即X

≈X。
[0040]S4、数据集划分:将步骤S3补全和修正处理后的施工信息数据集、作业标签数据集中的样本划分为训练集(X
′1,Y
′1)和测试集(X
′2,Y
′2)。
[0041]S5、训练梯度提升决策树GBDT模型:将训练集(X
′1,Y
′1)输入GBDT模型进行训练,获得GBDT模型的最佳超参数。
[0042]梯度提升决策树GBDT模型由基函数线性组合而成,它通过不断减小训练过程产生的误差来达到将数据分类或者回归。该算法通过多轮迭代,每轮迭代会产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练,最终将每轮训练得到的弱分类器加权求和得到总分类器。
[0043]本实施例中,将经过自编码器AE补全和同化处理过的作业专业数据(如变电、输电、配电、基建、营销等)、施工内容的量化数据(如挖掘深度、是否有脚手架、支模高度、基坑支护、是否室外作业、是否高空作业等)、天气信息、作业人员参与同类型工作次数等施工信
息数据集X

,与是否超节奏作业标签数据集Y

进行GBDT模型的训练,并通过准确率、F1值与AUC值等指标数据来确定GBDT模型的最佳超参数。
[0044]S6、筛选重要特征:根据GBDT模型输出的特征重要性筛选排名前85%的特征,得到降维后的特征集。
[0045]对模型进行训练时,梯度提升决策树GBDT模型可以输出所有特征的重要性,根据F1值与AUC值,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力施工作业节奏预测方法,其特征在于,包括以下步骤:获取原始数据,包括施工信息数据、作业人员是否超节奏作业标签数据;预处理所获取的原始数据;训练自编码器模型,将所述施工信息数据及所述作业标签数据输入自编码器模型中进行训练,获得自编码器模型的最佳参数,并得到空缺值与异常值补全、修正处理后的施工信息数据集X

以及作业标签数据集Y

;数据集划分,将补全和修正处理后的施工信息数据集、作业标签数据集中的样本划分为训练集(X
′1,Y
′1)和测试集(X
′2,Y
′2);将训练集(X
′1,Y
′1)输入梯度提升决策树模型进行训练,获得梯度提升决策树模型的最佳超参数;筛选重要特征,根据梯度提升决策树模型输出的特征重要性筛选排名靠前的特征,得到降维后的特征集;构造新特征,将降维后的特征集输入训练好的梯度提升决策树模型中,将梯度提升决策树模型输出的叶子节点作为新特征,得到新的离散特征集X

;特征独热化,对离散特征集X

进行one

hot编码处理,得到编码处理后的特征集X
″′
;将编码处理后的特征集X
″′
中的特征数据(X1″′
,Y1)输入支持向量机模型中,对支持向量机模型进行训练,获得最佳的分离超平面;选取最佳参数,将测试集(X
′2,Y
′2)输入训练好的梯度提升决策树与支持向量机的混合模型中,使用网格法对混合模型进行调参,以F1值与AUC值为调参后的混合模型评估指标,选取混合模型的最佳超参数;结果预测,把需要预测的无标签样本数据输入调参后的混合模型中,得到所述样本数据是否存在超节奏作业的标签数据。2.根据权利要求1所述的电力施工作业节奏预测方法,其特征在于,所述施工信息数据包括作业专业数据、施工内容的量化数据、天气信息及作业人员参与同类型工作次数。3.根据权利要求2所述的电力施工作业节奏预测方法,其特征在于,所述作业专业数据包括变电数据、输电数据、配电数据、基建数据及营销数据;所述施工内容的量化数据包括挖掘深度、是否有脚手架、支模高度、基坑支护、是否室外作业及是否高空作业。4.根据权利要求1所述的电力施工作业节奏预测方法,其特征在于,训练自编码器模型时,根据均方误差MSE值调整自编码器模型参数,在MSE达到最小时输出自编码器模型的最佳参数。5.根据权利要求1所述的电力施工作业节奏预测方法,其特征在于,训练梯度提升决策树模型时,通过准确率、F1值与AUC值指标数据来确定GBDT模型的最佳超参数。6.根据权利要求1所述的电力施工作业节奏预测方法,其特征在于,构造新特征时,通过梯度提升决策树模型建树,自动进行特征组合和特征离散化,然后将从所建的树的根节点到叶子节点的这条路径作为不同特征的特征组合,并用叶子节点唯一地表示这条路径。7.根据权利要求1所述的电力施工作业节奏预测方法,其特征在于,结果预测时,通过n条历史特征值与是否超节奏作业标签数据对支持向量机进行求解,支持向量机的目标函数为:
其中,a
i
为非负Lagrange乘子,ω为自变量x
i
的权重,b为常数项,为正则项,防止模型过拟合;y
i
是第i个样本数据的观测值,取值为0或者1,y
i
=0表示该样本数据不存...

【专利技术属性】
技术研发人员:姜磊向思源杜双育程绪敏曲滨涛苏建朝吴天磊田永海
申请(专利权)人:佰聆数据股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1