【技术实现步骤摘要】
一种基于数据挖掘的台区线损异常关联用户精准定位方法
本专利技术属于大数据下精准定位异常
,具体涉及一种基于数据挖掘的台区线损异常关联用户精准定位方法。
技术介绍
随着国家能源资源高效开发和利用战略决策的实施,节能逐渐成为缓解能源供应矛盾的重要手段,而电力行业是节能工作重要的领域之一。电力作为经济社会发展的重要支撑,降低电能在传输、分配和销售过程中的损耗与损失,是供电企业的重要工作之一。现有的台区线损异常关联用户定位方法,在具体算例和功能实现的考虑等方面存在一些缺陷。一是仅仅考虑到使用皮尔逊系数算法确定用户电量波动和线损率变化的关联程度,没有具体分析异常用户电量和线损率两条曲线之间的形状相似性;二是由于线损数据量庞大,需通过数据挖掘算法分析线损波动和电量波动的关系,精确定位异常用户,开展线损的针对性治理,目前的台区线损异常关联用户定位方法是人工进行海量数据计算后的粗略定位以及逐一排查,忽略了对台区大数据的分析与挖掘,不仅加大了计算量,也缺乏准确性。
技术实现思路
本专利技术针对现有技术中的不足,提供一种基于数据挖掘的台区线损异常关联用户精准定位方法。本专利技术在历史线损率K-means聚类结果的基础上,建立了台区线损率标准库和异常库;同时,根据生成的异常库数据,确定异常时间段T;从用电数据缺失值、噪声值和归一化三个处理方面展开,针对用电数据进行预处理,得到具有研究意义的用户电量集合{Wj};分别计算异常时间段内集合{Wj}内各用户电量和线损率的皮尔逊系数rxy;利用设定的阈值进行初步筛 ...
【技术保护点】
1.一种基于数据挖掘的台区线损异常关联用户精准定位方法,其特征在于,包括如下步骤:/nS1、导入给定的异常台区线损率;/nS2、针对导入的异常台区线损率进行K-means聚类;/nS3、基于聚类结果建立异常台区线损率标准库和异常库;/nS4、根据异常库确定异常时间段T;/nS5、进行用电数据预处理,得到具有研究意义的用户电量集合{W
【技术特征摘要】
1.一种基于数据挖掘的台区线损异常关联用户精准定位方法,其特征在于,包括如下步骤:
S1、导入给定的异常台区线损率;
S2、针对导入的异常台区线损率进行K-means聚类;
S3、基于聚类结果建立异常台区线损率标准库和异常库;
S4、根据异常库确定异常时间段T;
S5、进行用电数据预处理,得到具有研究意义的用户电量集合{Wj};
S6、分别计算异常时间段T内集合{Wj}中各用户电量和对应线损率的皮尔逊系数rxy;
S7、利用设定的阈值进行初步筛选,得到和线损异常关联性较大的用户电量集合{Wk};
S8、分别计算集合{Wk}中各用户电量曲线与线损率曲线的欧氏距离DE;
S9、基于加权皮尔逊系数和欧氏距离的相似性度量,计算皮尔逊系数和欧式距离的权重系数,精准定位所有异常用户。
2.如权利要求1所述的一种基于数据挖掘的台区线损异常关联用户精准定位方法,其特征在于:步骤S1中的台区线损率是用于判断台区是否存在异常的依据,其值由用电信息采集系统提供的线损电量计算得出,线损率计算公式如下式(1):
式中,LLR表示线损率,Em表示抄表电量,Es表示实际售电量。
3.如权利要求1所述的一种基于数据挖掘的台区线损异常关联用户精准定位方法,其特征在于:步骤S2中针对异常台区线损率进行K-means聚类,在软件IBMSPSSStatistics25中实现功能,算法流程如下:
S21、首先从数据空间中选k个数据点为初始聚类均值;
S22、计算每个数据点到这些聚类均值的距离,然后将各数据点分配给离它最近的那个聚类;
S23、若所有数据点不再被重新分配,则停止并保持现有聚类;
S24、如果仍有数据点被重新分配,则重新计算均值,并返回步骤S22。
4.如权利要求1所述的一种基于数据挖掘的台区线损异常关联用户精准定位方法,其特征在于:步骤S3中根据K-means聚类结果建立异常台区线损率标准库和异常库,异常库中不仅存放异常用户电量,还存储有对应的具体日期;
建立异常台区线损率标准库和异常库包括如下步骤:
S31、导入该台区所有线损率数据;
S32、对台区线损率进行K-means聚类;
S33、找出个案数目最多的聚类,确定该聚类的聚类中心;
S34、计算该聚类中所有点到聚类中心的最大距离;
S35、若满足如下的规则,则将线损率存放至一个特定的集合中并称之为线损率标准库;反之,则将其存放在线损率异常库中,评判规则如下式(2):
|LLRi-x|≤r+Δr(2)
式中,LLRi表示导入该台区所有线损率数据,x表示个案数目最多的聚类中心,r表示该聚类中所有点到该聚类中心的最大距离,Δr表示误差。
5.如权利要求4所述的一种基于数据挖掘的台区线损异常关联用户精准定位方法,其特征在于:步骤S4中,根据已经生成的异常台区线损率异常库确定异常时间段T,其中,T是时间区间,由若干个连续的日期组成。
6.如权利要求1所述的一种基于数据挖掘的台区线损异常关联用户精准定位方法,其特征在于:步骤S5中,对用户用电数据进行预处理,包括缺失值和异常值的处理以及规范化处理,通过规范化处理,去除其量纲形式,转化为更加规范化的数据形式。
7.如权利要求1所述的一种基于数据挖掘的台区线损异常关联用户精准定位方法,其特征在于:步骤S6中,面对用户电量集合{Wj},计算异常时间段T内各用户电量Wj和对...
【专利技术属性】
技术研发人员:陈光宇,徐嘉杰,张仰飞,郝思鹏,刘海涛,吕干云,
申请(专利权)人:南京工程学院,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。