基于随机森林算法的依据企业用电对排污行为的监测方法技术

技术编号:33703899 阅读:16 留言:0更新日期:2022-06-06 08:21
本发明专利技术涉及一种基于随机森林算法的依据企业用电对排污行为的监测方法,其包括以下步骤:对排污企业用电数据进行聚类分析;建立随机森林计算模型,对不同的聚类进行分析计算;依据计算结果,进行监测,识别异常企业。本发明专利技术可以对环保部门重点关注的排污企业开展全天用电趋势分析,反映企业生产/排污时段;甄别偷排行为,监督错峰生产。监督错峰生产。监督错峰生产。

【技术实现步骤摘要】
基于随机森林算法的依据企业用电对排污行为的监测方法


[0001]本专利技术涉及电力大数据分析领域,尤其涉及一种基于各个维度的企业排污行为监测方法。

技术介绍

[0002]近年来,随着环境保护事业的发展,一些新的理念正在被广大企业所接受和实践,比如清 洁生产、循环经济、环保认证等,这些都是现代企业发展过程中所必须遵循的原则。那种以 牺牲环境为代价换来的经济发展是暂时的也是不可持续的,是最终要被淘汰的。目前,在经济 发展的同时,环境也付出了很大代价,企业的污水污染仍呈高态势发展。工业排污,主要是乡镇 企业排污,如焦化厂、电解铝厂、造纸厂、钢铁厂、淀粉厂、肉类加工厂,大量排污,导致附 近小河污染;大中城市排污,如工业及生活用水污染;生活排污,有的企业没有污水处理厂, 工厂生活污水直接排入村近河流导致污染。
[0003]随着电网公司智能化的进步与发展,电网公司也逐渐步入了大数据时代。电网企业在发 电端、输变电端及用电端都会产生海量的数据,如对电网设备实时状况进行的在线监测,会 产生庞大的监测数据库;对电网信息的拓展也会产生大量的数据;为获取电网实时运行状态 信息而实时进行采样而生成的大量数据信息。对于海量的数据信息,传统的数据处理技术显 然无能为力,所以这就需要电网公司借助实时数据库、分布式存储以及检索以及大数据挖掘 技术等先进的电力大数据技术来对海量数据信息进行采集、存储以及分析处理,从而保障电 网的良好稳定运行。
[0004]目前,还没有针对排污企业的电力监测,因此,针对排污企业研究电力大数据在国家电 网公司的应用有着十分重要的现实意义。

技术实现思路

[0005]本专利技术针对以上问题,提供了一种针对排污企业的用电特点,便于识别异常企业的基于 随机森林算法的依据企业用电对排污行为的监测方法。
[0006]本专利技术的技术方案为:包括以下步骤:
[0007](1)对排污企业用电数据进行聚类分析;
[0008](2)建立随机森林计算模型,对不同的聚类进行分析计算;
[0009](3)依据计算结果,进行监测,识别异常企业。
[0010]步骤(1)中,对排污企业用电数据进行如下聚类分析:
[0011](1.1)档案匹配:通过将生态环境机构提供的排污企业清单与电网企业的用户档案进行 分析,从企业名称与用户名称、统一社会信用代码、法定代表人、注册地址与用电地址信息 出发,查找排污企业的用电编号;
[0012](1.2)对不同区域的排污企业进行聚类,获取所属行政区划地址、所属电力区划信息、 地理位置信息;
[0013](1.3)对不同行业的排污企业监测情况进行展示,获取行业大类、行业细分和电力
分类。
[0014]步骤(2)中,包括:
[0015](2.1)针对不同聚类确定不同决策树;
[0016](2.2)确定随机森林模型和变量重要性评估;分析计算。
[0017]步骤(2.1)中,包括:
[0018](2.11)确定不同类型的聚类结果;
[0019](2.12)对不同聚类结果决定不同的决策树。
[0020]步骤(2.2)中,包括:
[0021](2.21)首先采用bootstrap重抽样技术,在原始训练集N中有放回地重复随机抽取k组 样本生成新的训练样本集合;
[0022](2.22)然后根据k组样本建立k棵决策树,将会得到k种输出结果;
[0023](2.23)最终的分类结果将根据分类树投票表决确定。
[0024]本专利技术在工作中,对纳入管控的排污企业用电情况进行展示,获取所属市、县(区)、乡 (镇)、村(街道)等行政区划地址,所属供电所、台区等电力区划信息,经纬度、海拔等地 理位置信息,获取行业大类(污水处理厂、重点监测企业、工业园区、其他),行业细分(如 水泥厂、冶金厂、造纸厂等),用电类别、用户分类、供电电压等电力分类。对纳入管控的排 污企业用电趋势进行分析,方便开展区域和行业的用电量横向对比和用电变化趋势对比。这 样,便于监测在应急管控状态(停产、限产)下,排污企业的用电行为、用电趋势,识别异 常生产企业明细清单,及时预警当地环保部门。
[0025]本专利技术可以对环保部门重点关注的排污企业开展全天用电趋势分析,反映企业生产/排 污时段;甄别偷排行为,监督错峰生产。
附图说明
[0026]图1是K

means聚类算法流程图,
[0027]图2是随机森林模型流程图,
[0028]图3是污染企业按行业聚类同比环比分析,
[0029]图4是污染企业按地区聚类同比环比分析,
[0030]图5是本专利技术的流程图。
具体实施方案
[0031]下面结合附图对本专利技术的技术方案作进一步说明。应当了解,以下提供的实施例仅是为 了详尽地且完全地公开本专利技术,并且向所属
的技术人员充分传达本专利技术的技术构思, 本专利技术还可以用许多不同的形式来实施,并且不局限于此处描述的实施例。对于表示在附图 中的示例性实施方式中的术语并不是对本专利技术的限定。
[0032]本专利技术如图5所示,包括以下步骤:
[0033](1)对排污企业用电数据进行聚类分析;
[0034](2)建立随机森林计算模型,对不同的聚类进行分析计算;
[0035](3)依据计算结果,进行监测,识别异常企业。
[0036]步骤(1)中,对排污企业用电数据进行如下聚类分析:
[0037](1.1)档案匹配;档案匹配是开展企业监测的第一步。通过将生态环境机构提供的排污 企业清单与电网企业的用户档案进行分析,从企业名称与用户名称、统一社会信用代码、法 定代表人、注册地址与用电地址信息等方面出发,利用算法自动匹配,查找排污企业的用电 编号,作为排污企业数据抽取的依据。
[0038](1.2)对不同区域的排污企业进行聚类,获取所属市、县(区)、乡(镇)、村(街道) 等行政区划地址,所属供电所、台区等电力区划信息,经纬度、海拔等地理位置信息,对分 析区域、下级区域(省、市、县)排污许可证企业的用电趋势进行分析;
[0039](1.3)对不同行业的排污企业监测情况进行展示,获取行业大类(污水处理厂、重点监 测企业、工业园区、其他),行业细分(如水泥厂、冶金厂、造纸厂等),用电类别、用户分 类、供电电压等电力分类。开展不同行业排污许可证企业的用电趋势进行分析。
[0040]步骤(2)中,包括:
[0041](2.1)针对不同聚类确定不同决策树;
[0042](2.2)确定随机森林模型和变量重要性评估;分析计算。
[0043]步骤(2.1)中,包括:
[0044](2.11)确定不同类型的聚类结果;
[0045](2.12)对不同聚类结果决定不同的决策树。
[0046]步骤(2.2)中,包括:
[0047](2.21)首先采用bootstrap重抽样技术,在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于随机森林算法的依据企业用电对排污行为的监测方法,其特征在于,包括以下步骤:(1)对排污企业用电数据进行聚类分析;(2)建立随机森林计算模型,对不同的聚类进行分析计算;(3)依据计算结果,进行监测,识别异常企业。2.根据权利要求1所述的基于随机森林算法的依据企业用电对排污行为的监测方法,其特征在于:步骤(1)中,对排污企业用电数据进行如下聚类分析:(1.1)档案匹配:通过将生态环境机构提供的排污企业清单与电网企业的用户档案进行分析,从企业名称与用户名称、统一社会信用代码、法定代表人、注册地址与用电地址信息出发,查找排污企业的用电编号;(1.2)对不同区域的排污企业进行聚类,获取所属行政区划地址、所属电力区划信息、地理位置信息;(1.3)对不同行业的排污企业监测情况进行展示,获取行业大类、行业细分和电力分类。3.根据权利要...

【专利技术属性】
技术研发人员:赵申顾斌刘梅招刘琛张宸于翔阮文青
申请(专利权)人:国网江苏省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1