一种企业级电力用户智能分类方法及装置制造方法及图纸

技术编号:29968299 阅读:20 留言:0更新日期:2021-09-08 09:40
本发明专利技术公开一种企业级电力用户智能分类方法及装置,其中,方法包括:首先修正行业分类标准以匹配该地区行业发展实际情况,形成分类标准;其次利用已知行业的企业级电力用户集合经自然语言处理并基于名称

【技术实现步骤摘要】
一种企业级电力用户智能分类方法及装置


[0001]本专利技术涉及电力用户服务管理
,尤其涉及一种企业级电力用户智能分类方法及装置。

技术介绍

[0002]自第二次工业革命进入电气时代以来,电能逐渐成为不可或缺的能源形式之一,在我们的生活中起到重大的作用,社会生产、日常生活等各方各面都离不开电能的利用。电能的广泛使用意味着电力用户数量的不断攀升,如何高效有序地管理庞大的用户量对减少供电局工作量、快速响应用户需求等具有重要意义。
[0003]目前供电局主要依据报装容量和电能敏感度等电量信息实现电力用户的分类管理。一方面,现有分类可能造成不同行业的用户归为一类,而在服务需求上却缺乏相似性,达不到智能分类的意义;另一方面,电力大数据信息具有探究行业动态的潜在价值,现有分类无法对此进行深入挖掘。由此而言,基于行业属性对电力用户重新分类能够有效解决上述问题。
[0004]但随着社会经济结构日益复杂,地区产业转型持续推进,新兴产业层出不穷,现有行业分类比较单一粗糙,难以适应各地区具体实际产业分布情况。为使得分类结果划分行业类别的用户数量相当,需要对现有行业分类标准作一定的修改,以适应不同地区实际情况。

技术实现思路

[0005]本专利技术所要解决的技术问题在于,提供一种企业级电力用户智能分类方法及装置,以减少各类用户在数量上的差异性,实现相似用户统一管理。
[0006]为了解决上述技术问题,本专利技术实施例提供一种企业级电力用户智能分类方法,包括:
[0007]步骤S1,修正行业分类标准以匹配目标地区实际情况,形成初次分类标准;
[0008]步骤S2,按照所述初次分类标准生成已知行业的企业级电力用户集合,并利用所述已知行业的企业级电力用户集合经自然语言处理分别训练基于名称

行业映射关系的第一对照词库和基于经营范围

行业映射关系的第二对照词库;
[0009]步骤S3,获取目标地区待分类的企业级电力用户名称;
[0010]步骤S4,判断是否能按名称对待分类企业级电力用户进行初次行业分类,若能则根据第一对照词库对所述用户进行初次行业分类,若不能则根据第二对照词库,按照经营范围对待分类企业级电力用户进行初次行业分类;
[0011]步骤S5,根据各初次分类行业内的用户日负荷序列确定最佳聚类数,进一步得到最终分类。
[0012]进一步地,所述步骤S1具体包括:在《国民经济行业分类》标准基础上,结合目标地区各行业企业实际数量规模,增补该标准中不涉及的新兴产业,拆解企业数量较多的行业
条目,删除没有或极少相关企业的行业条目,合并企业数量较少的行业条目,得到m个行业分类条目trade1,trade2,

,trade
m

[0013]进一步地,所述步骤S2中,基于名称

行业映射关系的第一对照词库List 1具体为:对已知行业的企业级电力用户的名称分词后,将其中带有明显行业属性的词汇及该行业组成第一对照词库List 1,即:
[0014][0015]其中,词汇word
ij
需满足在第i个行业的企业级电力用户名称中多次出现,且在除第i个行业外的企业级电力用户名称极少出现,即:
[0016][0017]上式中,n
ij
表示词汇word
ij
在第i个行业的企业级电力用户名称分词结果中出现的次数;N
i
表示第i个行业的企业级电力用户名称分词结果总词数;α为灵敏度系数,α≥1;n

ij
表示词汇word
ij
在除第i个行业外的企业级电力用户名称分词结果中出现的次数;σ为准确率系数,0≤σ≤1。
[0018]进一步地,所述步骤S2中,基于经营范围

行业映射关系的第二对照词库List 2具体为:对已知行业的企业级电力用户的经营范围分词后,利用改进TF

IDF算法提取每个行业的经营范围关键词,并对每个行业的关键词按Q
ij
值排序,过滤掉无意义关键词后,取排序前若干个关键词与对应行业组成第二对照词库List 2,即:
[0019][0020][0021]上式中,W
i
表示第i个行业经营范围分词结果总词数;w
ij
表示关键词j在第i个行业的企业级电力用户经营范围分词结果中出现的次数;w

ij
表示关键词j在除第i个行业外的企业级电力用户经营范围分词结果中出现的次数。
[0022]进一步地,所述步骤S4具体包括:根据第一对照词库List 1对该用户进行初次行业分类,包括:对待分类企业级电力用户名称进行分词,若分词结果中含有List 1中的word
ij
,则将该用户归为第i个行业的用户,若不含List 1中任意一个word
ij
,则不能按名称分类;再根据第二对照词库List 2对该用户进行初次行业分类,包括:先从网上爬取该用户
的经营范围并对其分词,进而将分词结果与第二对照词库List 2进行匹配,统计分词结果所含对照词库List 2中各行业对应的词语的个数以及顺序号,比较与各行业的匹配个数,确定匹配个数最多的行业为该用户所属行业,当存在与多个行业匹配个数相同时,则比较顺序号与个数的乘积和,确定该乘积和最小的行业为该用户所属行业。
[0023]进一步地,所述步骤S5具体包括:对企业级电力用户完成行业分类后,利用K

Means聚类方法对各行业内用户的日负荷序列进行聚类,逐步增加聚类数直至当前聚类数下的每个聚类簇中存在不少于一定比例的用户至少与同一簇下1个用户日负荷序列间的Pearson相关系数大于某一给定值时,确定该聚类数为最佳聚类数,并将此聚类结果作为最终分类结果。
[0024]进一步地,所述步骤S5具体包括:对企业级电力用户完成行业分类后,利用K

Means聚类方法并设置聚类数t=1对各行业内用户的日负荷序列X
i
进行聚类,然后逐步增加聚类数t直至当前聚类数下的每个聚类簇X
i,k
(k=1,2,

,t)中存在不少于一定比例μ的用户日负荷序列X
i,k,p
至少与同一簇下的1个其它用户日负荷序列X
i,k,q
间的Pearson相关系数大于某一给定值M,即
[0025][0026]上式中,cov(
·
,
·
)表示协方差;σ表示标准差;E(
·
)表示样本期望;
[0027]则确定该聚类数t为最佳聚类数,并将此聚类结果作为最终分类结果。
[0028]进一步地,确定完待分类用户所属行业后,将其纳入步骤S2已知行业的企业级电力用户集合中,用于修正第一对照词库List 1和第二对照词库L本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种企业级电力用户智能分类方法,其特征在于,包括:步骤S1,修正行业分类标准以匹配目标地区实际情况,形成初次分类标准;步骤S2,按照所述初次分类标准生成已知行业的企业级电力用户集合,并利用所述已知行业的企业级电力用户集合经自然语言处理分别训练基于名称

行业映射关系的第一对照词库和基于经营范围

行业映射关系的第二对照词库;步骤S3,获取目标地区待分类的企业级电力用户名称;步骤S4,判断是否能按名称对待分类企业级电力用户进行初次行业分类,若能则根据第一对照词库对所述用户进行初次行业分类,若不能则根据第二对照词库,按照经营范围对待分类企业级电力用户进行初次行业分类;步骤S5,根据各初次分类行业内的用户日负荷序列确定最佳聚类数,进一步得到最终分类。2.根据权利要求1所述的企业级电力用户智能分类方法,其特征在于,所述步骤S1具体包括:在《国民经济行业分类》标准基础上,结合目标地区各行业企业实际数量规模,增补该标准中不涉及的新兴产业,拆解企业数量较多的行业条目,删除没有或极少相关企业的行业条目,合并企业数量较少的行业条目,得到m个行业分类条目trade1,trade2,

,trade
m
。3.根据权利要求2所述的企业级电力用户智能分类方法,其特征在于,所述步骤S2中,基于名称

行业映射关系的第一对照词库List 1具体为:对已知行业的企业级电力用户的名称分词后,将其中带有明显行业属性的词汇及该行业组成第一对照词库List 1,即:其中,词汇word
ij
需满足在第i个行业的企业级电力用户名称中多次出现,且在除第i个行业外的企业级电力用户名称极少出现,即:上式中,n
ij
表示词汇word
ij
在第i个行业的企业级电力用户名称分词结果中出现的次数;N
i
表示第i个行业的企业级电力用户名称分词结果总词数;α为灵敏度系数,α≥1;n

ij
表示词汇word
ij
在除第i个行业外的企业级电力用户名称分词结果中出现的次数;σ为准确率系数,0≤σ≤1。4.根据权利要求3所述的企业级电力用户智能分类方法,其特征在于,所述步骤S2中,基于经营范围

行业映射关系的第二对照词库List 2具体为:对已知行业的企业级电力用户的经营范围分词后,利用改进TF

IDF算法提取每个行业的经营范围关键词,并对每个行业的关键词按Q
ij
值排序,过滤掉无意义关键词后,取排序前若干个关键词与对应行业组成第二对照词库List 2,即:
上式中,W
i
表示第i个行业经营范围分词结果总词数;w
ij
表示关键词j在第i个行业的企业级电力用户经营范围分词结果中出现的次数;w

ij
表示关键词j在除第i个行业外的企业级电力用户经营范围分词结果中出现的次数。5.根据权利要求4所述的企业级电力用户智能分类方法,其特征在于,所述步骤S4具体包括:根据第一对照词库List 1对该用户进行初次行业分类,包括:对待分类企业级电力用户名称进行分词,若分词结果中含有List 1中的word
i...

【专利技术属性】
技术研发人员:严玉婷方力谦李扬龙干罗陆宁刘家学钟田勇何林荫郑林灵常碧玉吴霜郭建杰刘帅
申请(专利权)人:深圳供电局有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1