用户的识别方法及装置制造方法及图纸

技术编号:25638621 阅读:48 留言:0更新日期:2020-09-15 21:30
本申请提供了一种用户的识别方法及装置,该方法包括:针对待排查用电台区的每一个用户,统计所述用户在排查周期内的用电量数据,并利用所述用电量数据,确定所述用户的用电特征;利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取出与基准窃电用户的用电特征相似的类簇所对应的目标用户;将所述目标用户按照窃电嫌疑度的高低进行排序,并从所述目标用户中选取出窃电嫌疑度高的目标用户;其中,所述窃电嫌疑度高的目标用户的数量为预设数量;将所述窃电嫌疑度高的部分目标用户确定为窃电嫌疑用户。

【技术实现步骤摘要】
用户的识别方法及装置
本申请涉及数据处理领域,尤其涉及到一种用户的识别方法及装置。
技术介绍
随着电力需求增长,供电企业在为用户供电的同时,窃电事件越发严重;为保障供电企业的合法经营权益,确定用电用户中的窃电嫌疑用户尤为重要。然传统采用的确定窃电嫌疑用户的方式为:通过大量的工作人员进行拉网式排查,人工排查出窃电嫌疑用户。采用这这种排查方式,由于用电用户数量巨多,拉网式排查窃电嫌疑用户需要大量的工作人员和耗费大量的时间,导致排查成本高和排查大量的时间,导致排除成本高、排查效率低。
技术实现思路
有鉴于此,本申请提供了一种用户的识别方法及装置,以向用户提供一种依据用户用电情况自动筛选出窃电嫌疑用户的服务。为实现上述目的,本申请实施例提供如下技术方案:本申请第一方面提供了一种用户的识别方法,包括:针对待排查用电台区的每一个用户,统计所述用户在排查周期内的用电量数据,并利用所述用电量数据,确定所述用户的用电特征;利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取出与基准窃电用户的用电特征相似的类簇所对应的目标用户;将所述目标用户按照窃电嫌疑度的高低进行排序,并从所述目标用户中选取出窃电嫌疑度高的目标用户;其中,所述窃电嫌疑度高的目标用户的数量为预设数量;将所述窃电嫌疑度高的部分目标用户确定为窃电嫌疑用户。可选的,所述统计所述用户在排查周期内的用电量数据,确定所述用户的用电特征,包括:统计在排查周期内,所述用户每天的用电量数据;基于所述用户每天的用电量数据,分别计算得到所述用户的用电量的均值、标准差及四分位数;将所述均值、标准差及四分位数作为所述用户的用电特征。可选的,所述利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取与基准窃电用户的用电特征相似的类簇所对应的目标用户,包括:利用轮廓系数确定多个聚类中心;其中,所述多个聚类中心的每一个聚类中心,聚合了所述待排查用电台区内的至少一个用户的用电特征;将所述多个聚类中心中,符合预设条件的目标聚类中心确定为嫌疑类簇;其中,所述预设条件为所述目标聚类中心聚合的用户的用电特征满足:平均四分位数最小、且平均标准差最大;从所述嫌疑类簇中,选取所述标准差大于所述均值的用户,确定为与基准窃电用户的用电特征相似的目标用户。可选的,一个用户的所述窃电嫌疑度的计算方式,包括:计算用户对应的标准差与均值的商,得到所述用户的窃电嫌疑度。可选的,所述基准窃电用户的用电特征的确定方式,包括:建立多个样本用户的用电量数据的频次直方图,其中,所述多个样本用户中包括有窃电用户和正常用户;对每一个样本用户,分析所述样本用户的频次直方图,确定所述每一个样本用户的用电特征;对所述窃电用户的用电特征与所述正常用户的用电特征进行比较,得到比较结果,并依据所述比较结果确定基准窃电用户的用电特征。本申请第二方面提供了用户的识别装置,包括:统计单元,用于针对待排查用电台区的每一个用户,统计所述用户在排查周期内的用电量数据,并利用所述用电量数据,确定所述用户的用电特征;筛选单元,用于利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取出与基准窃电用户的用电特征相似的类簇所对应的目标用户;排序单元,用于将所述目标用户按照窃电嫌疑度的高低进行排序,并从所述目标用户中选取出窃电嫌疑度高的目标用户;其中,所述窃电嫌疑度高的目标用户的数量为预设数量;确定单元,用于将所述窃电嫌疑度高的部分目标用户确定为窃电嫌疑用户。可选的,所述统计单元,包括:统计子单元,用于统计在排查周期内,所述用户每天的用电量数据;第一计算子单元,用于基于所述用户每天的用电量数据,分别计算得到所述用户的用电量的均值、标准差及四分位数;第一确定子单元,用于将所述均值、标准差及四分位数作为所述用户的用电特征。可选的,所述筛选单元,包括:第二确定子单元,用于利用轮廓系数确定多个聚类中心;其中,所述多个聚类中心的每一个聚类中心,聚合了所述待排查用电台区内的至少一个用户的用电特征;第三确定子单元,用于将所述多个聚类中心中,符合预设条件的目标聚类中心确定为嫌疑类簇;其中,所述预设条件为所述目标聚类中心聚合的用户的用电特征满足:平均四分位数最小、且平均标准差最大;第四确定子单元,用于从所述嫌疑类簇中,选取所述标准差大于所述均值的用户,确定为与基准窃电用户的用电特征相似的目标用户。可选的,上述的任意一项用户的识别装置,还包括:第二计算子单元,用于计算用户对应的标准差与均值的商,得到所述用户的窃电嫌疑度。可选的,上述的任意一项用户的识别装置,还包括:建立单元,用于建立多个样本用户的用电量数据的频次直方图,其中,所述多个样本用户中包括有窃电用户和正常用户;分析单元,用于对每一个样本用户,分析所述样本用户的频次直方图,确定所述每一个样本用户的用电特征;比较单元,用于对所述窃电用户的用电特征与所述正常用户的用电特征进行比较,得到比较结果,并依据所述比较结果确定基准窃电用户的用电特征。与现有技术相比,本申请具有以下优点:本申请提供的用户的识别方法中,针对待排查用电台区的每一个用户,统计所述用户在排查周期内的用电量数据,并利用所述用电量数据,确定所述用户的用电特征;利用K均值聚类算法,分别对所述待排查用电台区内的用户的用电特征进行筛选,提取与基准窃电用户的用电特征相似的类簇所对应的目标用户;将所述目标用户按照窃电嫌疑度的高低进行排序,并从所述目标用户中选取出窃电嫌疑度高的目标用户;其中,所述窃电嫌疑度高的目标用户的数量为预设数量;将所述窃电嫌疑度高的部分目标用户确定为窃电嫌疑用户。由此可见,应用本申请提供的用户识别方法,能够依据待排查用电台区内的用户的用电量数据,自动筛选出窃电嫌疑用户,使得工作人员无需进行拉网式排查,节省了大量的人力物力,提高了排查窃电用户的效率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的一种用户的识别方法的方法流程图;图2为本申请实施例提供的用户用电量数据的示意图;图3为本申请实施例提供的确定用户的用电特征的方法流程图;图4为本申请另一实施例提供的一种步骤S102的实现方法的流程图;图5为本申请实施例提供的一种基准窃电用户的用电特征的确定方法的流程图;图6-1为本申请实施例提供的一种窃电用户的频次直方图的示意图;图6-2为本申请实施例提供的一种正常用户的频次直方图的示意本文档来自技高网...

【技术保护点】
1.一种用户的识别方法,其特征在于,包括:/n针对待排查用电台区的每一个用户,统计所述用户在排查周期内的用电量数据,并利用所述用电量数据,确定所述用户的用电特征;/n利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取出与基准窃电用户的用电特征相似的类簇所对应的目标用户;/n将所述目标用户按照窃电嫌疑度的高低进行排序,并从所述目标用户中选取出窃电嫌疑度高的目标用户;其中,所述窃电嫌疑度高的目标用户的数量为预设数量;/n将所述窃电嫌疑度高的部分目标用户确定为窃电嫌疑用户。/n

【技术特征摘要】
1.一种用户的识别方法,其特征在于,包括:
针对待排查用电台区的每一个用户,统计所述用户在排查周期内的用电量数据,并利用所述用电量数据,确定所述用户的用电特征;
利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取出与基准窃电用户的用电特征相似的类簇所对应的目标用户;
将所述目标用户按照窃电嫌疑度的高低进行排序,并从所述目标用户中选取出窃电嫌疑度高的目标用户;其中,所述窃电嫌疑度高的目标用户的数量为预设数量;
将所述窃电嫌疑度高的部分目标用户确定为窃电嫌疑用户。


2.根据权利要求1所述的识别方法,其特征在于,所述统计所述用户在排查周期内的用电量数据,确定所述用户的用电特征,包括:
统计在排查周期内,所述用户每天的用电量数据;
基于所述用户每天的用电量数据,分别计算得到所述用户的用电量的均值、标准差及四分位数;
将所述均值、标准差及四分位数作为所述用户的用电特征。


3.根据权利要求2所述的识别方法,其特征在于,所述利用K均值聚类算法,对所述待排查用电台区内的所有用户的用电特征进行筛选,提取与基准窃电用户的用电特征相似的类簇所对应的目标用户,包括:
利用轮廓系数确定多个聚类中心;其中,所述多个聚类中心的每一个聚类中心,聚合了所述待排查用电台区内的至少一个用户的用电特征;
将所述多个聚类中心中,符合预设条件的目标聚类中心确定为嫌疑类簇;其中,所述预设条件为所述目标聚类中心聚合的用户的用电特征满足:平均四分位数最小、且平均标准差最大;
从所述嫌疑类簇中,选取所述标准差大于所述均值的用户,确定为与基准窃电用户的用电特征相似的目标用户。


4.根据权利要求2所述的识别方法,其特征在于,一个用户的所述窃电嫌疑度的计算方式,包括:
计算用户对应的标准差与均值的商,得到所述用户的窃电嫌疑度。


5.根据权利要求1所述的识别方法,其特征在于,所述基准窃电用户的用电特征的确定方式,包括:
建立多个样本用户的用电量数据的频次直方图,其中,所述多个样本用户中包括有窃电用户和正常用户;
对每一个样本用户,分析所述样本用户的频次直方图,确定所述每一个样本用户的用电特征;
对所述窃电用户的用电特征与所述正常用户的用电特征进行比较,得到比较结果,并依据所述比较结果确定基准窃电用户的用电特征。
<...

【专利技术属性】
技术研发人员:万泉陈雁闫富荣张文袁葆欧阳红戴永新张浩周春
申请(专利权)人:北京中电普华信息技术有限公司国网信息通信产业集团有限公司国家电网有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1