【技术实现步骤摘要】
用户的识别方法及装置
本申请涉及数据处理领域,尤其涉及到一种用户的识别方法及装置。
技术介绍
随着电力需求增长,供电企业在为用户供电的同时,窃电事件越发严重;为保障供电企业的合法经营权益,确定用电用户中的窃电嫌疑用户尤为重要。然传统采用的确定窃电嫌疑用户的方式为:通过大量的工作人员进行拉网式排查,人工排查出窃电嫌疑用户。采用这这种排查方式,由于用电用户数量巨多,拉网式排查窃电嫌疑用户需要大量的工作人员和耗费大量的时间,导致排查成本高和排查大量的时间,导致排除成本高、排查效率低。
技术实现思路
有鉴于此,本申请提供了一种用户的识别方法及装置,以向用户提供一种依据用户用电情况自动筛选出窃电嫌疑用户的服务。为实现上述目的,本申请实施例提供如下技术方案:本申请第一方面提供了一种用户的识别方法,包括:针对待排查用电台区的每一个用户,统计所述用户在排查周期内的用电量数据,并利用所述用电量数据,确定所述用户的用电特征;利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取出与基准窃电用户的用电特征相似的类簇所对应的目标用户;将所述目标用户按照窃电嫌疑度的高低进行排序,并从所述目标用户中选取出窃电嫌疑度高的目标用户;其中,所述窃电嫌疑度高的目标用户的数量为预设数量;将所述窃电嫌疑度高的部分目标用户确定为窃电嫌疑用户。可选的,所述统计所述用户在排查周期内的用电量数据,确定所述用户的用电特征,包括:统计在排查周期内,所述用户 ...
【技术保护点】
1.一种用户的识别方法,其特征在于,包括:/n针对待排查用电台区的每一个用户,统计所述用户在排查周期内的用电量数据,并利用所述用电量数据,确定所述用户的用电特征;/n利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取出与基准窃电用户的用电特征相似的类簇所对应的目标用户;/n将所述目标用户按照窃电嫌疑度的高低进行排序,并从所述目标用户中选取出窃电嫌疑度高的目标用户;其中,所述窃电嫌疑度高的目标用户的数量为预设数量;/n将所述窃电嫌疑度高的部分目标用户确定为窃电嫌疑用户。/n
【技术特征摘要】
1.一种用户的识别方法,其特征在于,包括:
针对待排查用电台区的每一个用户,统计所述用户在排查周期内的用电量数据,并利用所述用电量数据,确定所述用户的用电特征;
利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取出与基准窃电用户的用电特征相似的类簇所对应的目标用户;
将所述目标用户按照窃电嫌疑度的高低进行排序,并从所述目标用户中选取出窃电嫌疑度高的目标用户;其中,所述窃电嫌疑度高的目标用户的数量为预设数量;
将所述窃电嫌疑度高的部分目标用户确定为窃电嫌疑用户。
2.根据权利要求1所述的识别方法,其特征在于,所述统计所述用户在排查周期内的用电量数据,确定所述用户的用电特征,包括:
统计在排查周期内,所述用户每天的用电量数据;
基于所述用户每天的用电量数据,分别计算得到所述用户的用电量的均值、标准差及四分位数;
将所述均值、标准差及四分位数作为所述用户的用电特征。
3.根据权利要求2所述的识别方法,其特征在于,所述利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取与基准窃电用户的用电特征相似的类簇所对应的目标用户,包括:
利用轮廓系数确定多个聚类中心;其中,所述多个聚类中心的每一个聚类中心,聚合了所述待排查用电台区内的至少一个用户的用电特征;
将所述多个聚类中心中,符合预设条件的目标聚类中心确定为嫌疑类簇;其中,所述预设条件为所述目标聚类中心聚合的用户的用电特征满足:平均四分位数最小、且平均标准差最大;
从所述嫌疑类簇中,选取所述标准差大于所述均值的用户,确定为与基准窃电用户的用电特征相似的目标用户。
4.根据权利要求2所述的识别方法,其特征在于,一个用户的所述窃电嫌疑度的计算方式,包括:
计算用户对应的标准差与均值的商,得到所述用户的窃电嫌疑度。
5.根据权利要求1所述的识别方法,其特征在于,所述基准窃电用户的用电特征的确定方式,包括:
建立多个样本用户的用电量数据的频次直方图,其中,所述多个样本用户中包括有窃电用户和正常用户;
对每一个样本用户,分析所述样本用户的频次直方图,确定所述每一个样本用户的用电特征;
对所述窃电用户的用电特征与所述正常用户的用电特征进行比较,得到比较结果,并依据所述比较结果确定基准窃电用户的用电特征。
<...
【专利技术属性】
技术研发人员:万泉,陈雁,闫富荣,张文,袁葆,欧阳红,戴永新,张浩,周春,
申请(专利权)人:北京中电普华信息技术有限公司,国网信息通信产业集团有限公司,国家电网有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。