【技术实现步骤摘要】
一种基于机器学习算法的用户用电异常检测方法
[0001]本专利技术涉及用户用电异常检测方法,特别是一种基于机器学习算法的用户用电异常检测方法,属于电力电子控制
技术介绍
[0002]随着科技的进步以及大数据等相关技术在电力系统中的运用,通过智能电表所采集的用户用电数据传回终端,技术人员便可利用各种算法从海量的数据中提取出所需要的特征和信息以便分析用户的用电行为。常见的用电异常行为主要分为:电力欺诈即偷电、漏电或者窃电,设备异常和居民家中突发异常情况等。
[0003]当前,检测用户异常用电行为主要分为两种。一是依靠安装硬件设备配合人工巡回检查的方式。二是采用数据分析的方式检测,对智能电表采集到的用户用电数据采用机器学习的方法分析,如神经网络、K
‑
means聚类、深度学习等。由于安装硬件设备配合人工巡回检查的方式存在着成本高,设备需要人员定期维护耗时耗力且效率不高等问题,因此使用该方法进行用电异常检测的应用较少。异常数据检测算法可分为无监督学习和有监督学习两类,它们均被广泛的用于电网异常数据 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习算法的用户用电异常检测方法,其特征在于,包括如下步骤:(1)数据预处理:利用政府社会信息系统中获取用户用电数据,通过对用电数据异常原因的分析,可以提取电流、电压、功率因数的电气特征,发现异常;数据中难免会有因各种原因未采集到数据的时间点而形成空缺值,因此需要对数据中的空缺值进行填充;使用拉格朗日插值法填充数据集中的空缺值,其公式如下:式中:i和j缺失值和非缺失值a、b的下标号;M为缺失数据前后值的数量;L
M(a)
为缺失数值插入后的结果;(2)特征融合:多特征融合是基于概率模型的D
‑
S证据理论的组合规则基础上进行改进;需要先将特征转化为正常概率、怀疑概率和异常概率;首先用K
‑
means聚类算法将电流、电压、功率因数三个特征中每个特征分为三类,分别代表正常、怀疑和异常;每个特征可以得到三个聚类中心和两个阈值,其中阈值是集群中心的中点;该方法主要对单日数据进行分析和检测;电流平衡度、电压平衡度、功率因数相关小时特征,每天24个特征;根据正常区间、可疑区间和异常区间的比例得到相应的概率:式中m是概率函数,A
i
是表示正常、可疑或异常的符号;N
i
是每天在相应聚类间隔内的特征数量;对于日常特征,如电流的相关系数,每天有一个特征;根据距离逆公式得到相应的概率如下:式中d
i
为特征与聚类中心之间的距离,所以我们可以看到,特征与聚类中心的距离越大,对应的概率就越大;(3)多特征融合模型:该多特征融合模型基于D
‑
S证据理论,并从步骤(2)可知每个特征都可得到对应的异常用电分布,例如{m(A
1)
,m(A2),m(A3)};其中A1代表正常,A2代表可疑,A3代表异常;多特征融合的具体算法如下:
①
假设m1,m2,m3,...,m
n
是n个电气特征的基本概率分布,然后{m(A1),m(A2),M(A3)}代表异常电力可靠性分布,假设k
ij
代表特征i和j之间的冲突程度:
②
定义k是n个特征的冲突程度,公式如下...
【专利技术属性】
技术研发人员:王鑫萌,孔令稷,李海奇,仪孝光,石文秀,孟旭,孔晶,赵承楠,张轲舜,李付生,徐伟,王新玲,田俊强,张建军,仝庆跃,陈思佳,
申请(专利权)人:国网山东省电力公司菏泽供电公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。