一种相异模型下Stacking集成算法的异常用电用户识别方法技术

技术编号:26764656 阅读:42 留言:0更新日期:2020-12-18 23:41
本发明专利技术公开了一种相异模型下Stacking集成算法的异常用电用户识别方法,从用电信息采集系统中单个用户用电负荷数据的记录情况、时间序列划分统计量以及用户用电相似度三个维度建立用电特征指标,提取用户用电特征集,更加有效挖掘数据深层次特征。相比于单一模型,本发明专利技术从跨越空间的概念选取SVM、GBDT、RF以及Deep Forest四种不同种类算法的分类相异模型做为Stacking集成结构的基分类模型。基于相异模型、相异特征构建大量模型为基模型进行原特征的学习,从不同层次、不同角度挖掘数据信息,对用户异常用电有更优的识别性能。

【技术实现步骤摘要】
一种相异模型下Stacking集成算法的异常用电用户识别方法
本专利技术涉及用电监察的
,尤其涉及到一种相异模型下Stacking集成算法的异常用电用户识别方法。
技术介绍
用电侧电力用户异常用电模式背后存在着窃电、欺诈等一系列欺骗性用电行为,所导致的损失称为非技术性损失NTL(Non-TechnicalLoss)。非技术性损失在实际运行的电网中普遍存在,对电网的正常运行会产生严重的影响,扰乱地区电网的正常调度,甚至会由于用户私自改接线路而引发安全事故。当今电网公司主要通过加强计量设备管理、采用专用计量箱和人工巡检等方法来识别异常用电用户从而降低非技术性损失。但这些方法需要投入大量的人力物力,且不能及时发现非技术性损失,供电企业的用电检查工作异常艰巨。如何准确及时的检测出配电网异常用电用户,从而减少非技术性损失,挽回巨额的经济损失是供电企业填补电力缺口维护正常用电秩序所需要解决的难题。异常用电用户识别是指在电网公司的计量数据系统中,对用户历史用电数据进行挖掘分析,采用一定手段对异常用电用户进行筛选与识别。如何有效挖掘历史数本文档来自技高网...

【技术保护点】
1.一种相异模型下Stacking集成算法的异常用电用户识别方法,其特征在于,包括以下步骤:/nS1、选取SVM、GBDT、RF以及Deep Forest四种不同种类算法的分类相异模型作为Stacking集成结构第一阶段的的基分类模型,Xgboost作为Stacking集成结构第二阶段的元分类器模型;/nS2、输入历史用户用电数据;/nS3、从用电信息采集系统中单个用户用电负荷数据的统计记录、时间序列划分统计量以及用户用电相似度三个维度建立用电特征指标,提取用户用电特征集;/nS4、结合各用户相应标签,将用户用电特征集分为Stacking模型的训练集与测试集;/nS5、利用第一阶段的基分类模型...

【技术特征摘要】
1.一种相异模型下Stacking集成算法的异常用电用户识别方法,其特征在于,包括以下步骤:
S1、选取SVM、GBDT、RF以及DeepForest四种不同种类算法的分类相异模型作为Stacking集成结构第一阶段的的基分类模型,Xgboost作为Stacking集成结构第二阶段的元分类器模型;
S2、输入历史用户用电数据;
S3、从用电信息采集系统中单个用户用电负荷数据的统计记录、时间序列划分统计量以及用户用电相似度三个维度建立用电特征指标,提取用户用电特征集;
S4、结合各用户相应标签,将用户用电特征集分为Stacking模型的训练集与测试集;
S5、利用第一阶段的基分类模型对训练集和测试集进行Stacking转换,得到元训练集和元测试集;
S6、将经过Stacking第一阶段转换后的元训练集以及相对应用户标签输入第二阶段的元分类器模型Xgboost中训练优化,最后输入元测试集进行预测,输出最终的分类结果,判断该用户用电的是否异常。


2.根据权利要求1所述的一种相异模型下Stacking集成算法的异常用电用户识别方法,所述步骤S3中,提取统计记录特征时,剔除无意义数据后,利用拉格朗日插值法及线性二次插值法进行数据插值处理。

【专利技术属性】
技术研发人员:程超鹏彭显刚黄景林刘云凯
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1