一种基于聚类分析的用户用电行为检测方法技术

技术编号:15355691 阅读:120 留言:0更新日期:2017-05-17 14:05
本发明专利技术提供了一种基于聚类分析的用户用电行为检测方法,该检测方法通过建立用户数据仓库以收集用户用电信息,对所建立的用户数据仓库进行处理形成主成分数据,以处理大样本数据,提高挖掘效率;对主成分数据进行聚类计算得到不同的用户用电模式,其中,用户用电模式中的离群点对象可能为窃电用户,进而对离群点对象采用层次聚类方法计算得出窃电嫌疑用户。本发明专利技术提供的基于聚类分析的用户用电行为检测方法中,层次聚类方法只需对对象之间的距离排序,并根据距离序列进行聚类,不需要检查和估算对象;同时,离群点的检测与聚类计算能够高度互补,具有很好的伸缩性。

【技术实现步骤摘要】

本专利技术涉及用电行为检测
,尤其涉及一种基于聚类分析的用户用电行为检测方法
技术介绍
窃电是指以不缴或少缴电费为目的而采用非法手段不计量或少计量用电量的行为。窃电行为不但严重损害供电企业的利益,而且还扰乱正常的供用电秩序,严重影响了电力事业的发展,并给用电安全带来了严重威胁。窃电行为一旦形成一定规模会大大增加供电线路的负担,轻则影响整个小区的电压稳定,重则会导致整片区域停电,影响用户使用电量。从近年来的各种窃电案件来看,不但窃电的手段越来越狡诈,窃电的数额也越来越大,同时,还有不少窃电者想方设法逃避应有的法律惩罚,因此,防治窃电问题已成为一个不容忽视的、迫切需要解决的重要课题,引起了各级供电企业和有关部门的重视。窃电行为一般在查抄电表或缴费时才被发现,然而此时已发生窃电行为,供电系统已经遭到破坏,此时只能对窃电者进行惩罚并改正其窃电行为,因此,窃电行为并不能提前知晓,也就不能提前制止窃电行为。目前,我国防窃电的方法主要包括采用专用计量箱或专用电表箱、装设防窃电设备等,然而上述方法需要大量更换计量箱或电表箱、装设新设备,大大浪费人力、物力。若只针对个别用户更换防窃电设备,则只能对安装有更换防窃电设备的用户进行控制,并不能对整片区域的所有用户的用电行为进行检测,因而仍然可能存在有漏检的窃电用户。
技术实现思路
本专利技术提供一种基于聚类分析的用户用电行为检测方法,以通过大量的用户用电数据分析该片区域内用户的用电行为,进而确定窃电嫌疑用户。本专利技术提供了一种基于聚类分析的用户用电行为检测方法,所述方法包括:根据用户用电信息建立用户数据仓库;对所述用户数据仓库进行处理,以选取主成分数据;对所述主成分数据进行聚类计算得到离群点对象;选取所述用户数据仓库中所述离群点对象的用电数据;对所述用电数据进行层次聚类计算得到距离矩阵;判断所述距离矩阵中类簇之间的最小距离是否大于预设阈值,且所述最小距离的数量是否大于预设数量;若所述最小距离大于所述预设阈值,且所述最小距离的数量大于预设数量,则所述离群点对象为窃电嫌疑用户。优选地,根据用户用电信息建立用户数据仓库包括:将用户用电信息添加到事实表,以建立逻辑模型,所述用户用电信息包括电流、电压、用户的类型、地理位置、年均用电量、月均用电量和/或日用电量;将所述逻辑模型转化为数据模型;使用ETL对所述数据模型中的用电数据进行清洗,形成用户数据仓库。优选地,对所述用户数据仓库进行处理包括对所述用户数据仓库中的数据进行切块或切片操作。优选地,对所述主成分数据进行聚类计算得到离群点对象包括通过k-means算法或FCM算法对所述主成分数据进行聚类计算得到离群点对象。优选地,通过k-means算法对所述主成分数据进行聚类计算得到离群点对象包括:所述主成分数据构成数据集;在所述数据集中选取k个对象为初始聚类中心,设定差异程度s;计算所述数据集中其余数据与各初始聚类中心的欧式距离;根据所述欧式距离及所述初始聚类中心将所述其余数据划分为k个类簇;计算所述k个类簇的簇内变差E;根据所述簇内变差E重新确定聚类中心;根据重新确定的所述聚类中心重新划分类簇,直至连续两次划分的类簇相同,得到最终类簇及最终聚类中心;计算所述最终类簇中的每个数据与所述最终聚类中心的距离dist(o,c0)及每个数据与所述最终聚类中心的平均距离根据所述距离dist(o,c0)和所述平均距离计算判断所述与所述差异程度s的大小;若所述大于所述差异程度s,则为离群点对象;若所述小于或等于所述差异程度s,则为正常对象。优选地,通过FCM算法对所述主成分数据进行聚类计算得到离群点对象包括:将所述主成分数据划分为c个类簇;分别确立c个所述类簇的初始聚类中心;设定模糊因子m,差异程度s;计算所述主成分数据中的每个数据隶属于c个类簇的隶属度;根据所述隶属度确定隶属度矩阵U;根据计算聚类中心矩阵V;根据所述隶属度矩阵U和所述聚类中心矩阵V计算目标函数J(U,V);若连续两次计算的所述目标函数J(U,V)的差值大于或等于终止误差,则重新计算隶属度矩阵U,直至连续两次计算的所述目标函数J(U,V)的差值小于终止误差,得到最终隶属度矩阵U;根据所述最终隶属度矩阵U对所述主成分数据划分最终类簇及最终聚类中心;计算所述最终类簇中的每个数据与所述最终聚类中心的距离dist(o,c0)及每个数据与所述最终聚类中心的平均距离根据所述距离dist(o,c0)和所述平均距离计算判断所述与所述差异程度s的大小;若所述大于所述差异程度s,则为离群点对象;若所述小于或等于所述差异程度s,则为正常对象。优选地,对所述用电数据进行层次聚类计算得到距离矩阵包括:将每个所述用电数据设定为一个初始类簇;计算每两个初始类簇之间的欧式距离;所述欧式距离形成距离矩阵。本专利技术的实施例提供的技术方案可以包括以下有益效果:本专利技术提供一种基于聚类分析的用户用电行为检测方法,所述方法包括:根据用户用电信息建立用户数据仓库;对所述用户数据仓库进行处理,以选取主成分数据;对所述主成分数据进行聚类计算得到离群点对象;选取所述用户数据仓库中所述离群点对象的用电数据;对所述用电数据进行层次聚类计算得到距离矩阵;判断所述距离矩阵中类簇之间的最小距离是否大于预设阈值,且所述最小距离的数量是否大于预设数量;若所述最小距离大于所述预设阈值,且所述最小距离的数量大于预设数量,则所述离群点对象为窃电嫌疑用户。本专利技术提供的基于聚类分析的用户用电行为检测方法通过建立用户数据仓库以收集用户用电信息,对所建立的用户数据仓库进行处理形成主成分数据,以处理大样本数据,提高挖掘效率;对主成分数据进行聚类计算得到不同的用户用电模式,其中,用户用电模式中的离群点对象可能为窃电用户,进而对离群点对象采用层次聚类方法计算得出窃电嫌疑用户。本专利技术提供的基于聚类分析的用户用电行为检测方法中,层次聚类方法只需对对象之间的距离排序,并根据距离序列进行聚类,不需要检查和估算对象;同时,离群点的检测与聚类计算能够高度互补,具有很好的伸缩性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的基于聚类分析的用户用电行为检测方法的流程示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。请参考附图1,附图1示出了本专利技术实施例提供的基于聚类分析的用户用电行为检测方法的流程示意图,以下检测方法的描述均以附图1为基础。本专利技术实施例提供了一种基于聚类分析的用户用电行为检测方法,该检测方法包括:S01:根据用户用本文档来自技高网...
一种基于聚类分析的用户用电行为检测方法

【技术保护点】
一种基于聚类分析的用户用电行为检测方法,其特征在于,所述方法包括:根据用户用电信息建立用户数据仓库;对所述用户数据仓库进行处理,以选取主成分数据;对所述主成分数据进行聚类计算得到离群点对象;选取所述用户数据仓库中所述离群点对象的用电数据;对所述用电数据进行层次聚类计算得到距离矩阵;判断所述距离矩阵中类簇之间的最小距离是否大于预设阈值,且所述最小距离的数量是否大于预设数量;若所述最小距离大于所述预设阈值,且所述最小距离的数量大于预设数量,则所述离群点对象为窃电嫌疑用户。

【技术特征摘要】
1.一种基于聚类分析的用户用电行为检测方法,其特征在于,所述方法包括:根据用户用电信息建立用户数据仓库;对所述用户数据仓库进行处理,以选取主成分数据;对所述主成分数据进行聚类计算得到离群点对象;选取所述用户数据仓库中所述离群点对象的用电数据;对所述用电数据进行层次聚类计算得到距离矩阵;判断所述距离矩阵中类簇之间的最小距离是否大于预设阈值,且所述最小距离的数量是否大于预设数量;若所述最小距离大于所述预设阈值,且所述最小距离的数量大于预设数量,则所述离群点对象为窃电嫌疑用户。2.根据权利要求1所述的基于聚类分析的用户用电行为检测方法,其特征在于,根据用户用电信息建立用户数据仓库包括:将用户用电信息添加到事实表,以建立逻辑模型,所述用户用电信息包括电流、电压、用户的类型、地理位置、年均用电量、月均用电量和/或日用电量;将所述逻辑模型转化为数据模型;使用ETL对所述数据模型中的用电数据进行清洗,形成用户数据仓库。3.根据权利要求1所述的基于聚类分析的用户用电行为检测方法,其特征在于,对所述用户数据仓库进行处理包括对所述用户数据仓库中的数据进行切块或切片操作。4.根据权利要求1所述的基于聚类分析的用户用电行为检测方法,其特征在于,对所述主成分数据进行聚类计算得到离群点对象包括通过k-means算法或FCM算法对所述主成分数据进行聚类计算得到离群点对象。5.根据权利要求4所述的基于聚类分析的用户用电行为检测方法,其特征在于,通过k-means算法对所述主成分数据进行聚类计算得到离群点对象包括:所述主成分数据构成数据集;在所述数据集中选取k个对象为初始聚类中心,设定差异程度s;计算所述数据集中其余数据与各初始聚类中心的欧式距离;根据所述欧式距离及所述初始聚类中心将所述其余数据划分为k个类簇;计算所述k个类簇的簇内变差E;根据所述簇内...

【专利技术属性】
技术研发人员:王昕李川曹敏李英娜黄炜赵艳峰李翔赵旭蒋婷婷
申请(专利权)人:云南电网有限责任公司电力科学研究院昆明理工光智检测科技有限公司
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1