一种基于分类算法的用户用电廉情预警方法技术

技术编号:25123991 阅读:41 留言:0更新日期:2020-08-05 02:53
一种基于分类算法的用户用电廉情预警方法。所述用户用电廉情预警方法包括如下步骤:步骤S1,采集正常的历史用户用电数据,将用户分成不同的组合类型;步骤S2,对每一种组合类型的用户的用电数据进行建模,通过回归算法拟合出对应的线性公式,将线性公式中的参数抽取出来,作为特征向量保存;步骤S3,以特征向量数据为基础,搭建KNN数据集;步骤S4,输入对新的用户用电数据进行组合类型识别,若识别结果与该新的用户用电数据原本所属的所述组合类型不一致,则判定该新的用户用电数据为异常数据并进行预警。如此,通过大数据分析算法对数据进行分类分析,快速识别用户违规用电行为,对异常数据实现自动预警,从而提升纪检监督执纪工作水平。

【技术实现步骤摘要】
一种基于分类算法的用户用电廉情预警方法
本专利技术涉及数据分析
,具体涉及一种基于分类算法的用户用电廉情预警方法。
技术介绍
营销稽查是供电局纪检监察工作中重要的一环,如何在海量数据中精准发现违规用电行为是该项工作要解决的难点问题。由于数据量庞大,以往纪检工作人员对廉情风险的判断大多凭经验、凭感觉,缺乏有效统计数据支撑,需耗费大量人力和时间进行取证,工作效率亟待提高。
技术实现思路
本专利技术所要解决的技术问题是,针对上述现有技术中提到的纪检工作人员无法从海量营销业务数据中精准发现违规用电行为的问题,提供一种基于分类算法的用户用电廉情预警方法,所述用户用电廉情预警方法对营销用户的用电负荷数据,通过大数据分析算法对数据进行分类分析,识别用户违规用电行为,对异常数据实现自动预警,从而提升纪检监督执纪工作水平。为解决上述的技术问题,本专利技术所采用的技术方案是提供一种基于分类算法的用户用电廉情预警方法,包括如下步骤:步骤S1,采集正常的历史用户用电数据,将用户分成不同的组合类型;步骤S2,对每一种组合类型的用户的用电数据进行建模,通过回归算法拟合出对应的线性公式,将线性公式中的参数抽取出来,作为特征向量保存;步骤S3,以特征向量数据为基础,搭建KNN数据集;步骤S4,输入对新的用户用电数据进行组合类型识别,若识别结果与该新的用户用电数据原本所属的所述组合类型不一致,则判定该新的用户用电数据为异常数据并进行预警。本专利技术提供的基于分类算法的用户用电廉情预警方法中,在所述步骤S1中,对采集到的大量的历史用户用电数据,按4个不同的维度进行分类;所述的4个不同的维度分别为用电类别、电压等级、用户分类和用户类别。本专利技术提供的基于分类算法的用户用电廉情预警方法中,所述用电类别包括L种类别;所述电压等级包括M种级别;所述用户分类包括N种类型;所述用户类别包括X种客户类型;其中,L、M、N和X均为正整数。本专利技术提供的基于分类算法的用户用电廉情预警方法中,在所述步骤S1中,将用户分成种组合类型。本专利技术提供的基于分类算法的用户用电廉情预警方法中,在所述步骤S2中,所述线性公式为F(x)=ax^2+bx+c,其中,a、b、c为有理数;所述特征向量为[a,b]。本专利技术提供的基于分类算法的用户用电廉情预警方法中,在所述步骤S3中,建立直角坐标系,并在所述直角坐标系中用点来表示所述特征向量,形成所述KNN数据集。本专利技术提供的基于分类算法的用户用电廉情预警方法中,在所述步骤S4中,所述的“输入对新的用户用电数据进行组合类型识别”包括:步骤S41,根据所述新的用户用电数据得出对于所述新的用户用电数据的特征向量;步骤S42,在所述直角坐标系中,用点表示所述新的用户用电数据的特征向量,将对应所述新的用户用电数据的特征向量的点记为待识别数据点;步骤S43,根据所述直角坐标系中最靠近所述待识别数据点的K个点对所述新的用户用电数据进行组合类型的识别,其中,K为大于等于3的整数。本专利技术提供的基于分类算法的用户用电廉情预警方法中,在所述步骤S43中,K个点中的半数以上的点所对应的特征向量所代表的组合类型即为所述新的用户用电数据的组合类型识别结果。本专利技术提供的基于分类算法的用户用电廉情预警方法中,K的取值为3。本专利技术提供的基于分类算法的用户用电廉情预警方法中,L、M、N和X的取值分别为4、2、28和2。实施本专利技术提供的用户用电廉情预警方法,可以达到以下有益效果:所述用户用电廉情预警方法包括如下步骤:步骤S1,采集正常的历史用户用电数据,将用户分成不同的组合类型;步骤S2,对每一种组合类型的用户的用电数据进行建模,通过回归算法拟合出对应的线性公式,将线性公式中的参数抽取出来,作为特征向量保存;步骤S3,以特征向量数据为基础,搭建KNN数据集;步骤S4,输入对新的用户用电数据进行组合类型识别,若识别结果与该新的用户用电数据原本所属的所述组合类型不一致,则判定该新的用户用电数据为异常数据并进行预警。如此,通过大数据分析算法对数据进行分类分析,快速识别用户违规用电行为,对异常数据实现自动预警,从而提升纪检监督执纪工作水平。附图说明图1为本专利技术提供多的用户用电廉情预警方法的步骤流程图;图2为本专利技术中的用户用电数据的不同维度的分类图;图3为本专利技术中的居民服务样本的功率散点图的效果图;图4为本专利技术中的公共照明样本的功率散点图的效果图;图5为本专利技术中的KNN数据集示意图;图6为本专利技术中新的用户用电数据的识别过程示意图。具体实施方式为了对本专利技术的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本专利技术的具体实施方式。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种基于分类算法的用户用电廉情预警方法。参见图1,所述用户用电廉情预警方法包括如下步骤:步骤S1,采集正常的历史用户用电数据,将用户分成不同的组合类型;步骤S2,对每一种组合类型的用户的用电数据进行建模,通过回归算法拟合出对应的线性公式,将线性公式中的参数抽取出来,作为特征向量保存;步骤S3,以特征向量数据为基础,搭建KNN数据集;步骤S4,输入对新的用户用电数据进行组合类型识别,若识别结果与该新的用户用电数据原本所属的所述组合类型不一致,则判定该新的用户用电数据为异常数据并进行预警。本实施例中,在所述步骤S1中,对采集到的大量的历史用户用电数据,按4个不同的维度进行分类;所述的4个不同的维度分别为用电类别、电压等级、用户分类和用户类别。具体的,所述用电类别包括L种类别;所述电压等级包括M种级别;所述用户分类包括N种类型;所述用户类别包括X种客户类型;其中,L、M、N和X均为正整数。也就是说,在所述步骤S1中,我们将用户分成种组合类型。在这里,L、M、N和X的取值分别为4、2、28和2。更具体的,参见图2,在用电类别维度上,全部用户被粗分为一般工商业及其他、大工业用电、普通工业以及商业这4种大类;在电压等级维度上,所采集到的用户用电数据可分为交流380V和交流10kV这2种;在用户分类维度上,存在28种不同行业的类型,如批发和零售业、道路运输业等;在用户类别维度上,存在有公变客户、公线专变客户,这2种。从而组合类型的种类为=448种。本实施例中,在所述步骤S2中,所述线性公式为F(x)=ax^2+bx+c,其中,a、b、c为有理数;所述特征向量为[a,b]。实际操作中,我们需要对上述所有的448种组合类型的用户用电数据进行建模。下面以组合类型为“商业用电+交流10kV+居民服务、修理和其他服务业+公线专变客户”(下文简称为居民服务)和“商业用电+交流10kV+公共照明+公线专变客户”(下文简称为公共照明)的两种用本文档来自技高网...

【技术保护点】
1.一种基于分类算法的用户用电廉情预警方法,其特征在于,包括如下步骤:/n步骤S1,采集正常的历史用户用电数据,将用户分成不同的组合类型;/n步骤S2,对每一种组合类型的用户的用电数据进行建模,通过回归算法拟合出对应的线性公式,将线性公式中的参数抽取出来,作为特征向量保存;/n步骤S3,以特征向量数据为基础,搭建KNN数据集;/n步骤S4,输入对新的用户用电数据进行组合类型识别,若识别结果与该新的用户用电数据原本所属的所述组合类型不一致,则判定该新的用户用电数据为异常数据并进行预警。/n

【技术特征摘要】
1.一种基于分类算法的用户用电廉情预警方法,其特征在于,包括如下步骤:
步骤S1,采集正常的历史用户用电数据,将用户分成不同的组合类型;
步骤S2,对每一种组合类型的用户的用电数据进行建模,通过回归算法拟合出对应的线性公式,将线性公式中的参数抽取出来,作为特征向量保存;
步骤S3,以特征向量数据为基础,搭建KNN数据集;
步骤S4,输入对新的用户用电数据进行组合类型识别,若识别结果与该新的用户用电数据原本所属的所述组合类型不一致,则判定该新的用户用电数据为异常数据并进行预警。


2.根据权利要求1所述的基于分类算法的用户用电廉情预警方法,其特征在于,在所述步骤S1中,对采集到的大量的历史用户用电数据,按4个不同的维度进行分类;所述的4个不同的维度分别为用电类别、电压等级、用户分类和用户类别。


3.根据权利要求2所述的基于分类算法的用户用电廉情预警方法,其特征在于,所述用电类别包括L种类别;所述电压等级包括M种级别;所述用户分类包括N种类型;所述用户类别包括X种客户类型;其中,L、M、N和X均为正整数。


4.根据权利要求3所述的基于分类算法的用户用电廉情预警方法,其特征在于,在所述步骤S1中,将用户分成种组合类型。


5.根据权利要求1所述的基于分类算法的用户用电廉情预警方法,其特征在于,在所述步骤S2中,所述线性公式为F(x)=ax...

【专利技术属性】
技术研发人员:王忠军李寿荣彭文钦李硕鑫
申请(专利权)人:深圳市康拓普信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1