一种涉污企业用电信息匹配及数据处理方法技术

技术编号:24331490 阅读:24 留言:0更新日期:2020-05-29 19:47
本发明专利技术为一种涉污企业用电信息匹配及数据处理方法,包括以下步骤:S1:采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号;S2:根据企业用户编号,从电网企业用电信息采集系统中抽取企业用电数据;S3:对抽取得到的企业用电数据进行预处理和脱敏处理;S4:将经过步骤S3处理后的企业用电数据通过隔离装置,完成从电网企业内部网络到外部网络的安全传输。该方法能够有效提取企业用户编号,并根据企业用户编号从电网企业用电信息采集系统中抽取企业用电数据,对企业电数据进行预处理和脱敏处理后,进行从电网企业内部网络到外部网络的安全传输,弥补了现有技术无法通过企业用电数据实现环保在线监测的问题。

A method of power information matching and data processing for pollution related enterprises

【技术实现步骤摘要】
一种涉污企业用电信息匹配及数据处理方法
本专利技术涉及信息匹配及数据处理
,具体涉及一种涉污企业用电信息匹配及数据处理方法。
技术介绍
目前,各地生态环境系统主要采取高排放企业在重污染天气下停产、限产或轮产等管控措施,降低排污企业的污染物排放量,保障空气质量。各地生态环境系统为确保相关企业落实减低排放措施,传统上一般抽选部分企业,并指派执法人员进行现场监督检查。这种方式管控效率低下,覆盖面窄,难以及时发现违规生产企业,影响空气质量及时改善。部分地区推进污染源工况在线监测,在企业的主要排污点装设终端监测设备,采集企业污染数据,实现企业污染物排放的监测和管理。也有部分地区采用在主要排污生产设备和治污设备的供电点加装电能计量装置,采集排污生产设备和治污设备的用电数据,实现企业生产情况的监测。但是,上述两种方式均需单独建立数据采集、数据传输和存储系统,同时需常态开展设备和系统的运行维护,监测成本较高,不宜大规模推广应用至一般工业企业,以致当前绝大多数一般企业未安装在线监测设备,无法满足生态环境系统开展企业生产活动和排污情况实时监控的需求。
技术实现思路
本专利技术提供一种涉污企业用电信息匹配及数据处理方法,解决了现有技术无法通过企业用电数据实现污染防治管控过程中的生产情况和减排措施响应情况在线监测的问题。本专利技术通过下述技术方案实现:一种涉污企业用电信息匹配及数据处理方法,包括以下步骤:S1:采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号;S2:根据企业用户编号,从电网企业用电信息采集系统中抽取企业用电数据;S3:对抽取得到的企业用电数据进行预处理和脱敏处理;S4:将经过步骤S3处理后的企业用电数据通过隔离装置,完成从电网企业内部网络到外部网络的安全传输;本技术方案中,随着电网企业加快推进智能电表换装工作,电网企业的用电信息采集系统实现了用户用电信息的全采集覆盖;因此,通过企业用电量可以直接反应企业的生产情况以反映该企业的排污状况;由于生态环境系统中的企业信息与电网企业用电客户信息没有进行标准化格式录入,因此,要从电网企业用电信息采集系统中抽取企业用电数据,就需要采用生态环境系统中的企业信息与电网企业用电客户信息首先进行匹配,再信息匹配成功后,才能提取出企业用户编号,并根据企业用户编号从电网企业用电信息采集系统中抽取企业用电数据;当提取了企业用电数据后,需要对企业电数据进行预处理和脱敏处理,并将处理后的数据进行从电网企业内部网络到外部网络的安全传输,以帮助有关部门根据处理后的数据对涉污企业用电数据进行分析以达到环保在线监测的目的;通过本技术方案,能够利用电网企业广泛覆盖的涉污企业智能电表采集数据,通过信息匹配、数据处理和安全隔离传输,实现企业生产用电数据的在线监测。作为本专利技术的进一步改进,步骤S1中,采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号包括基于Jieba分词的涉污企业信息匹配并提取企业用户编号和基于税务信息的信息匹配并提取企业用户编号;其中,只有在基于Jieba分词的涉污企业信息匹配并提取企业用户编号失败后,才使用基于税务信息的信息匹配并提取企业用户编号;本技术方案中,Jieba分词用于中文自然语言处理分词,对句子中的词汇根据语义进行划分;首先通过Jieba分词,对涉污企业信息进行匹配并提取企业用户编号;当基于Jieba分词的涉污企业信息匹配并提取企业用户编号失败后,才使用基于税务信息的信息匹配并提取企业用户编号;这样,就可以有多重方式来保证提取出企业用户编号,会后续提取企业用电数据提供依据。进一步,所述基于Jieba分词的涉污企业信息匹配并提取企业用户编号具体包括以下步骤:S101:整理生态环境系统提供的涉及污染排放企业信息,包括企业名称、增值税税号、法人名称和联系电话;同时,抽取电力客户档案信息,包括电力用户名称、用户编号、联系人、联系电话、用电容量、电表倍率、电表电压等级和增值税税号,其中,电表倍率包括综合倍率和CT倍率;S102:构建行政区划、行业属性、组织形式和后缀信息四个自定义字典,并为每个自定义字典中的词条定义词性;S103:利用Jieba分词,对企业名称和电力用户名称分别进行分词处理,并借助步骤S102构建的自定义字典,提取企业名称中的字号信息;S104:采用匹配方法,对提取到的字号信息进行匹配,获取企业用电信息中的用户名称;S105:利用用户名称,提取企业用户编号;本技术方案中,由于生态环境系统中的企业信息与电网企业用电客户信息没有进行标准化格式录入,因此,需要整理出生态环境系统提供的涉及污染排放企业信息和电网企业用电客户信息中的电力客户档案信息,方便后续进行相关信息的匹配;由于企业名称和电力用户名称包括行政区划、字号信息、行业属性、组织形式和后缀信息五个部分,因此,需要构建行政区划、行业属性、组织形式和后缀信息四个自定义字典,并为每个自定义字典中的词条定义词性;这样,就可以利用Jieba分词,对企业名称和电力用户名称分别进行分词处理,区分出行政区划、字号、行业属性、组织形式和后缀信息五个部分,并借助自定义字典,再次区分出行政区划、行业属性、组织形式和后缀信息四个分部,从而提取出企业名称和电力用户名称中仅剩下的字号信息;如果企业名称和电力用户名称中的字号信息相互匹配,就可以根据字号信息获取企业的用户名称,进而利用用户名称,提取企业用户编号。进一步,所述基于税务信息的信息匹配并提取企业用户编号具体包括以下步骤:S201:利用企业的增值税税号与电网中的增值税税号进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;否则,进入步骤S202;S202:利用涉污企业法人名称与电力客户的联系人进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;否则,进入步骤S203;S203:利用涉污企业联系电话与电力客户的联系电话进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;本技术方案中,当基于Jieba分词的涉污企业信息匹配并提取企业用户编号失败后,可以根据步骤S101中,生态环境系统提供的涉及污染排放企业信息和电力客户档案信息进行匹配,其中,企业的增值税税号与电网中的增值税税号进行匹配,涉污企业法人名称与电力客户的联系人进行匹配,涉污企业联系电话与电力客户的联系电话进行匹配;这样,就可以通过这三种匹配方式,更有效的获取用户名称和用户编号。进一步,步骤S2具体包括以下步骤:S301:根据用户编号,查找企业的供电单位编号;S302:利用用户编号和企业的供电单位编号,从用电信息采集系统统一接口平台抽取企业用电数据;其中,对具备高频采集的企业,抽取时段冻结电能示值、功率和电流数据;对不具备高频采集能力的企业,抽取日冻结电能示值数据。进一步,步骤S3中,所述本文档来自技高网...

【技术保护点】
1.一种涉污企业用电信息匹配及数据处理方法,其特征在于,包括以下步骤:/nS1:采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号;/nS2:根据企业用户编号,从电网企业用电信息采集系统中抽取企业用电数据;/nS3:对抽取得到的企业用电数据进行预处理和脱敏处理;/nS4:将经过步骤S3处理后的企业用电数据通过隔离装置,完成从电网企业内部网络到外部网络的安全传输。/n

【技术特征摘要】
1.一种涉污企业用电信息匹配及数据处理方法,其特征在于,包括以下步骤:
S1:采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号;
S2:根据企业用户编号,从电网企业用电信息采集系统中抽取企业用电数据;
S3:对抽取得到的企业用电数据进行预处理和脱敏处理;
S4:将经过步骤S3处理后的企业用电数据通过隔离装置,完成从电网企业内部网络到外部网络的安全传输。


2.根据权利要求1所述的一种涉污企业用电信息匹配及数据处理方法,其特征在于,步骤S1中,采用企业信息与电网企业用电客户信息进行匹配并提取企业用户编号包括基于Jieba分词的涉污企业信息匹配并提取企业用户编号和基于税务信息的信息匹配并提取企业用户编号;其中,只有在基于Jieba分词的涉污企业信息匹配并提取企业用户编号失败后,才使用基于税务信息的信息匹配并提取企业用户编号。


3.根据权利要求2所述的一种涉污企业用电信息匹配及数据处理方法,其特征在于,所述基于Jieba分词的涉污企业信息匹配并提取企业用户编号具体包括以下步骤:
S101:整理生态环境系统提供的涉及污染排放企业信息,包括企业名称、增值税税号、法人名称和联系电话;同时,抽取电力客户档案信息,包括电力用户名称、用户编号、联系人、联系电话、用电容量、电表倍率、电表电压等级和增值税税号,其中,电表倍率包括综合倍率和CT倍率;
S102:构建行政区划、行业属性、组织形式和后缀信息四个自定义字典,并为每个自定义字典中的词条定义词性;
S103:利用Jieba分词,对企业名称和电力用户名称分别进行分词处理,并借助步骤S102构建的自定义字典,提取企业名称中的字号信息;
S104:采用匹配方法,对提取到的字号信息进行匹配,获取企业用电信息中的用户名称;
S105:利用用户名称,提取企业用户编号。


4.根据权利要求3所述的一种涉污企业用电信息匹配及数据处理方法,其特征在于,所述基于税务信息的信息匹配并提取企业用户编号具体包括以下步骤:
S201:利用企业的增值税税号与电网中的增值税税号进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;否则,进入步骤S202;
S202:利用涉污企业法人名称与电力客户的联系人进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库;否则,进入步骤S203;
S203:利用涉污企业联系电话与电力客户的联系电话进行匹配,并提取相应的用户名称和用户编号;如果提取成功,则记录用户名称和用户编号,存入匹配成功企业数据库。


5.根据权利要求1所述的一种涉污企业用电信息匹配及数据处理方法,其特征在于,步骤S2具体包括以下步骤:
S301:根据用户编号,查找企业的供电单位编号;
S302:利用用户编号和企业的供电单位编号,从用电信息采集系统统一接口平台抽取企业用电数据;其中,对具备高频采集的企业,抽取时段冻结电能示值、功率和电流数据;对不具备高频采集能力的企业,抽取日冻结电能示值数据。


6.根据权利要求5所述的一种涉污企业用电信息匹配及数据处理方法,其特征在于,步骤S3中,所述对抽取得到的企业用电数据进行预处理和脱敏处理具体包括以下步骤:
S401:对抽取的用电数据进行清洗;

【专利技术属性】
技术研发人员:苏少春唐伟杨迎春常晓青滕予非沈军李赋欣魏阳严磊刘畅张军
申请(专利权)人:国网四川省电力公司电力科学研究院
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1