【技术实现步骤摘要】
基于孤立森林算法的用电信息采集数据异常分析方法
本专利技术涉及用电信息采集
,具体是一种基于孤立森林算法的用电信息采集数据异常分析方法。
技术介绍
随着信息化时代的迅速发展,率先展开大数据相关研究的是互联网、信息通信行业。对电力行业而言,大数据也同样具有深远的研究意义和光明的应用前景。随着下一代电力系统逐步演进,基于数据驱动的电力供应链将逐步取代传统的电力供应链。其中用电信息采集系统的推广,为我国电力行业开展基于电力数据分析的管理运营决策和供电服务优化提供了必要的数据基础。同时随着电能数据、工况数据、事件信息等用电数据呈指数增长,大数据特征越来越显著,用电大数据的应用需求日益迫切。海量的用电数据主要来源于各类计量装置及系统,由于多种设备故障、通信故障、电网波动和管理等原因,出现了大量异常的用电数据。面对这种海量用电数据的增加,多数电力部门仅使用传统的统计方法进行异常数据分析,并且大多需要依赖现场检验来实现。由于受到人力、物力、财力的限制,异常数据背后隐藏的深层次原因无法有效得以提炼,却带来了“数据灾难”和“数据荒废”。因此,用传统分析手段己难以满足要求,需要 ...
【技术保护点】
1.基于孤立森林算法的用电信息采集数据异常分析方法,其特征在于包括以下步骤:步骤一:建立基于用电信息采集系统的台区线损管理指标,制定基于用电信息采集系统的台区线损管理方法;步骤二:针对线损类台区,采用云存储技术实现多个线损类台区用电信息数据采集、分类、处理;步骤三:分析总结脏数据的类型,根据其表现形式消除噪音;步骤四:通过数据变换将经过清理筛选后的数据,转换为利于数据挖掘的形式;步骤五:应用孤立森林算法建立数据分析模型,并应用受试者工作特征ROC曲线与曲线下面积AUC、及累积查全率曲线与P‑R曲线,以查准率为纵轴,查全率为横轴作图,进行模型评估,并将此模型应用到多个线损类台 ...
【技术特征摘要】
1.基于孤立森林算法的用电信息采集数据异常分析方法,其特征在于包括以下步骤:步骤一:建立基于用电信息采集系统的台区线损管理指标,制定基于用电信息采集系统的台区线损管理方法;步骤二:针对线损类台区,采用云存储技术实现多个线损类台区用电信息数据采集、分类、处理;步骤三:分析总结脏数据的类型,根据其表现形式消除噪音;步骤四:通过数据变换将经过清理筛选后的数据,转换为利于数据挖掘的形式;步骤五:应用孤立森林算法建立数据分析模型,并应用受试者工作特征ROC曲线与曲线下面积AUC、及累积查全率曲线与P-R曲线,以查准率为纵轴,查全率为横轴作图,进行模型评估,并将此模型应用到多个线损类台区用电信息数据集上,对经过筛选后的数据进行数据挖掘,筛选用电异常用户。2.根据权利要求1所述基于孤立森林算法的用电信息采集数据异常分析方法,其特征在于:步骤一中,建立的台区线损管理指标包括覆盖类、户变类、可采类、数据类、线损类五种状态标识及其层级关系;覆盖类:台区内采集设备安装率未达到100%;户变类:采集覆盖率已达到100%的台区,但户变关系尚不准确;可采类:釆集覆盖率己达到100%,但可采率尚未达到95%;数据类:覆盖率达到100%、可采率达到95%且户变关系正确,但采集的数据与人工抄表数据误差大于均值;线损类:覆盖率、可采率、准确率均已达到100%且户变关系正确,但线损率异常。3.根据权利要求1所述基于孤立森林算法的用电信息采集数据异常分析方法,其特征在于:步骤二中,采用云存储的分布式文件存储机制,将用电信息数据分散存储在多台独立的存储服务器上,它包括卷管理、元数据管理、块数据管理服务;元数据是指文件的名称、属性、数据块位置信息;块数据是指文件数据被...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。