一种基于电力大数据的企业排污预测方法技术

技术编号:38150859 阅读:6 留言:0更新日期:2023-07-13 09:14
本发明专利技术公开了一种基于电力大数据的企业排污预测方法,包括以下步骤:基础信息获取:获取企业的历史用电数据和历史排污数据;数据预处理:根据历史排污数据对所述历史用电数据进行数据清洗;特征指标构建:对数据清洗后的历史用电数据提取多维的用电特征指标;构建用户排污预测模型:将所述用电特征指标作为自变量,并将所述历史排污数据作为因变量,将自变量作为输入,将因变量作为输出来训练逻辑回归模型,将训练好的逻辑回归模型作为企业排污预测模型。本发明专利技术实现对潜在水污染企业的排污情况进行预测,节省人工现场核查人次。节省人工现场核查人次。节省人工现场核查人次。

【技术实现步骤摘要】
一种基于电力大数据的企业排污预测方法


[0001]本专利技术涉及电力
,尤其涉及一种基于电力大数据的企业排污预测方法。

技术介绍

[0002]目前全国水环境质量总体保持持续改善势头,水域周边城市要定期对流域内重点排污单位进行例行排污检测,人力物力消耗较大。
[0003]随着智能电网和信息化建设,电力行业积累了海量数据,这些数据在数据量、多样性、速度和价值方面具有大数据的特征。电力行业已进入大数据时代。电力大数据是通过传感器、智能设备、视频监控设备、音频通信设备、移动终端等各种数据采集渠道,收集到的海量结构化、半结构化、非结构化的业务数据集合。如何借助电力大数据实现企业排污情况分析和预警,是值得考虑的问题。

技术实现思路

[0004]本专利技术要解决的技术问题就在于:针对现有技术存在的技术问题,本专利技术提供一种基于电力大数据的企业排污预测方法,实现对潜在水污染企业的排污情况进行预测,辅助提升监督效率,节省人工现场核查人次。
[0005]为解决上述技术问题,本专利技术提出的技术方案为:
[0006]一种基于电力大数据的企业排污预测方法,包括以下步骤:
[0007]步骤1、基础信息获取:获取企业的历史用电数据和历史排污数据;
[0008]步骤2、数据预处理:根据历史排污数据对所述历史用电数据进行数据清洗;
[0009]步骤3、特征指标构建:对数据清洗后的历史用电数据提取多维的用电特征指标;
[0010]步骤4、构建用户排污预测模型:将所述用电特征指标作为自变量,并将所述历史排污数据作为因变量,将自变量作为输入,将因变量作为输出来训练逻辑回归模型,将训练好的逻辑回归模型作为企业排污预测模型。
[0011]进一步的,所述历史用电数据包括用户名称、用户编号、合同容量、计量点编号、采集时间点、尖电量、峰电量、谷电量、平电量、时点负荷、时点电流、时点电压、时点功率;所述历史排污数据包括企业名称、污水检测时间、检测结果。
[0012]进一步的,步骤2具体包括:根据历史排污数据中的污水检测时间和检测结果,确定有排污监测结果的时间段,提取历史用电数据中有排污监测结果的时间段对应的用电数据,删除该用电数据中的缺失数据,并采用箱线图剔除该用电数据中的异常值。
[0013]进一步的,步骤3具体包括:使用OSM模型,确定业务目标并制定行动策略,根据所述行动策略对数据清洗后的历史用电数据构建指标并评估,得到多维的用电特征指标。
[0014]进一步的,根据所述行动策略对数据清洗后的历史用电数据构建指标并评估的具体步骤包括:
[0015]对于第一类数据,绘制同一个周期内超标样本企业和未超标样本企业关于该数据的趋势图,观察所述趋势图,并根据观察结果,将第一类数据拆分为对应的指标;
[0016]对于第二类数据,根据专家经验,将该数据直接作为一类指标。
[0017]进一步的,所述第一类数据的数据量大于预设阈值。
[0018]进一步的,步骤4中所述自变量的用电特征指标与对应因变量的历史排污数据的时间错位,且所述用电特征指标的时间在对应的历史排污数据的时间之前。
[0019]进一步的,步骤4中所述逻辑回归模型的表达式如下:
[0020][0021]上式中,P(ω,b)表示企业排污概率,x表示逻辑回归模型的输入样本的特征向量,ω表示每一个输入特征的权重值组成的权重向量,b表示回归模型的偏差。
[0022]进一步的,步骤4中训练逻辑回归模型包括:模型拟合过程中,通过调整分类权重优化模型,模型拟合完成后,在准确率相同的情况下接受召回率更大的模型。
[0023]进一步的,步骤4中训练逻辑回归模型包括:将自变量和因变量均按照3:1的比例划分训练集和测试集,设定训练参数中的分类方式为多项模式,设定训练参数中各种类型的权重是0:0.25和1:0.75,其中0表示企业排污结果为未排污,1表示企业排污结果为排污,使用训练集训练逻辑回归模型。
[0024]与现有技术相比,本专利技术的优点在于:
[0025]本专利技术区别于使用传统污水采集监测和安装额外的硬件设施,无需改造硬件设备,创新地使用了电力数据助力企业监测排污预测,还根据业务需求和用电数据构建了全新的用电特征指标,最后运用逻辑回归算法构建企业排污风险预测模型,通过该模型计算企业排污可能性。
附图说明
[0026]图1为本专利技术实施例的方法流程图。
[0027]图2为本专利技术实施例中同一个周期内超标样本企业和未超标样本的负荷率趋势图。
[0028]图3为本专利技术实施例中企业排污风险预测原理图。
[0029]图4为本专利技术实施例中模型预测结果混淆矩阵图。
具体实施方式
[0030]以下结合说明书附图和具体优选的实施例对本专利技术作进一步描述,但并不因此而限制本专利技术的保护范围。
[0031]在介绍本实施例的具体方案之前,先对于相关内容介绍如下:
[0032]2021年国家电网有限公司大力推进数字化转型,强化电力数据增值服务,通过运用“大数据”技术,深入挖掘电力数据价值,构建电力大数据+流域环保监测模式。基于大数据的分析预测能力,实现对潜在水污染企业的排污情况进行在线分析、在线预警,提供数字化依据,辅助提升监督效率,节省人工现场核查人次。电力大数据主要来源于发电、输电、变电、配电、用电和调度等各环节,可大致分为三类:
[0033]电网运行、设备检测或监测数据。主要包含在能量管理系统、配网管理系统、广域量测管理系统、生产管理系统、电网调度管理系统、故障管理系统、图像监控系统等。
[0034]电力企业营销数据,如交易电价、售电量、用电客户等数据。主要包含在营销业务系统、95598客户服务系统、电能量计量系统、用电信息采集系统等。
[0035]电力企业管理数据。主要包含在协同办公系统、企业资源计划系统(ERP)等。
[0036]本实施例提出一种基于电力大数据的企业排污预测方法,如图1所示,包括以下步骤:
[0037]步骤1、基础信息获取:获取企业的历史用电数据和历史排污数据;
[0038]步骤2、数据预处理:根据历史排污数据对所述历史用电数据进行数据清洗;
[0039]步骤3、特征指标构建:对数据清洗后的历史用电数据提取多维的用电特征指标;
[0040]步骤4、构建用户排污预测模型:将所述用电特征指标作为自变量,并将所述历史排污数据作为因变量,将自变量作为输入,将因变量作为输出来训练逻辑回归模型,将训练好的逻辑回归模型作为企业排污预测模型。
[0041]本实施例的步骤1中,考虑到企业的用电数据主要基于用户信息、业扩、用电量、负荷、电流、电压、功率等数据表,其历史用电数据包括用户名称、用户编号、合同容量、计量点编号、采集时间点、尖电量、峰电量、谷电量、平电量、时点负荷、时点电流、时点电压、时点功率等重点字段;企业的排污数据主要基于环保局提供的历史排污监测结果表,其历史排污数据包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于电力大数据的企业排污预测方法,其特征在于,包括以下步骤:步骤1、基础信息获取:获取企业的历史用电数据和历史排污数据;步骤2、数据预处理:根据历史排污数据对所述历史用电数据进行数据清洗;步骤3、特征指标构建:对数据清洗后的历史用电数据提取多维的用电特征指标;步骤4、构建用户排污预测模型:将所述用电特征指标作为自变量,并将所述历史排污数据作为因变量,将自变量作为输入,将因变量作为输出来训练逻辑回归模型,将训练好的逻辑回归模型作为企业排污预测模型。2.根据权利要求1所述的基于电力大数据的企业排污预测方法,其特征在于,所述历史用电数据包括用户名称、用户编号、合同容量、计量点编号、采集时间点、尖电量、峰电量、谷电量、平电量、时点负荷、时点电流、时点电压、时点功率;所述历史排污数据包括企业名称、污水检测时间、检测结果。3.根据权利要求1所述的基于电力大数据的企业排污预测方法,其特征在于,步骤2具体包括:根据历史排污数据中的污水检测时间和检测结果,确定有排污监测结果的时间段,提取历史用电数据中有排污监测结果的时间段对应的用电数据,删除该用电数据中的缺失数据,并采用箱线图剔除该用电数据中的异常值。4.根据权利要求1所述的基于电力大数据的企业排污预测方法,其特征在于,步骤3具体包括:使用OSM模型,确定业务目标并制定行动策略,根据所述行动策略对数据清洗后的历史用电数据构建指标并评估,得到多维的用电特征指标。5.根据权利要求4所述的基于电力大数据的企业排污预测方法,其特征在于,根据所述行动策略对数据清洗后的历史用电数据构建...

【专利技术属性】
技术研发人员:何卓丽梁翼园易德辉陈潮周娟周波韩博文李娜吴波萧文韬刘睿谭卓
申请(专利权)人:湖南思极科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1