The invention discloses a theft analysis method and device, wherein the method comprises the following steps: collecting user file data and user data behavior; the data will be collected from the sample data, the sample data including training data, test data and forecast data, the training data and test data with labels, tags are based on user the Historical Records label and electricity; the training data and test data is loaded into the Xgboost algorithm to build the model of machine learning based on the training and test of the model; the prediction model of loading data to the trained, stealing user behavior analysis results obtained. The invention can realize an efficient and accurate analysis of suspected electricity theft.
【技术实现步骤摘要】
窃电分析方法及装置
本专利技术涉及电力管理
,尤其涉及一种窃电分析方法及装置。
技术介绍
窃电是伴随着供电产生之初就一直存在的不法行为,窃电行为给电力部门和人民的生活带来了极大的危害,轻则损坏低压电气设备,损害电力公司的财产利益,重则导致大面积网域停电甚至因窃电造成触电伤亡事故,威胁他人的人身安全。为了打击窃电行为,供电企业一直致力于反窃电的工作中,但是随着科技的发展,窃电手段越来越“高超”,行为越来越隐蔽,反窃电的工作难度也不断增大。窃电的形式多种多样,但最终目的是修改计量数据,所以大多是通过改变计量装置来进行窃电。传统的反窃电方式主要是更换为更先进的计量装置或增加监督设备。具体分为以下3种方式:1.合理选取计量设备,比如互感器等,由于计量装置经常会受电流互感器的影响而出现误差,所以互感器的工作环境和互感器倍率很重要,工作人员应该控制好这两个因素。2.更新电能表,安装具有防窃电方式的电能表。3.安装对应的电量监视器,监视器可以监察和分析电量实际的运行情况和在线运行的数据,工作人员通过监视器可以基本掌握窃电的相关数据,从而减小排查范围。这些方法虽然起到了不错 ...
【技术保护点】
一种窃电分析方法,其特征在于,包括:采集用户的用电行为数据以及用户的档案数据;将采集的数据制成样本数据,样本数据包括训练数据、测试数据和预测数据,其中,训练数据和测试数据携带标签,标签是根据用户的历史窃电记录一一标记而成;将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试;将预测数据加载至训练好的模型,获得用户的窃电行为分析结果。
【技术特征摘要】
1.一种窃电分析方法,其特征在于,包括:采集用户的用电行为数据以及用户的档案数据;将采集的数据制成样本数据,样本数据包括训练数据、测试数据和预测数据,其中,训练数据和测试数据携带标签,标签是根据用户的历史窃电记录一一标记而成;将训练数据和测试数据加载至基于Xgboost算法建立的机器学习的模型,对模型进行训练与测试;将预测数据加载至训练好的模型,获得用户的窃电行为分析结果。2.如权利要求1所述的方法,其特征在于,用户的用电行为数据包括以下数据其中之一或任意组合:负荷曲线数据,电压曲线数据,电流曲线数据,日冻结电能示值数据,日冻结电能量数据。3.如权利要求1所述的方法,其特征在于,用户的档案数据包括以下数据其中之一或任意组合:电能表信息,用户信息,计量点信息。4.如权利要求1所述的方法,其特征在于,在采集用户的用电行为数据以及用户的档案数据时,若数据为训练数据和测试数据则用Kettle工具从数据库中采集,若数据为预测数据则用Python工具从数据库中采集。5.如权利要求1所述的方法,其特征在于,进一步包括:根据训练和测试效果对数据进行分析后,通过修改数据的特征项和模型参数对模型进行优化。6.如权利要求1所述的方法,其特征在于,加载训练数据和测试数据前,进一步包括:将Xgboost算法的参数设置为以下参数:分类器每次迭代的模型为:基于树的模型;需要被最小化的损失函数为:二分类的逻辑回归;有效数据的度量方法为:auc曲线下面积;权重的L2正则化项为:50;学习效率为:0.3。7.如权利要求6所述的方法,其特征在于,参数设置完毕后,按照12:4的比例加载训练数据和测试数据,对模型进行训练与测试。8.如权利要求1至7任一所述的方法,其特征在于,在采集用户的用电行为数据以及用户的档案数据后,进一步包括:对采集的数据进行特征选取。9.如权利要求1至7任一所述的方法,其特征在于,在采集用户的用电行为数据以及用户的档案数据后,进一步包括:对采集的数据进行数据清洗。10.一种窃电分析装置,其特征在于,包括:采集模块,用于采集用户的用电行为数据以及用户的档案数据;数据处理模块,用于将采集的数据制成样本数据,样本数据包括训练数据、测试数据和预测数据,其中,训练数据和测试数据携带标签,标签是根据用户的...
【专利技术属性】
技术研发人员:刘岩,丁恒春,袁瑞铭,易忠林,巨汉基,钟侃,殷庆铎,史辉,黄昌宝,魏彤珈,崔文武,郑思达,田晓溪,庞富宽,李文文,张春娟,
申请(专利权)人:国网冀北电力有限公司电力科学研究院,华北电力科学研究院有限责任公司,国家电网公司,中能瑞通北京科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。