基于电力数据的异常检测算法制造技术

技术编号:28502928 阅读:24 留言:0更新日期:2021-05-19 22:50
本发明专利技术公开了一种基于电力数据的异常检测算法,分析功率的差值,采用当前时刻减去前面第四个时刻的值,并且连续4个值都低于阈值则判断为异常;画出其当前时刻功率差值的直方图,采用核密度估计算法,设其概率密度函数为f,公式如下:本发明专利技术通过对所采集的功率数据进行差值计算,画出其当前时刻的历史数据的直方图,由于异常数据较少,可将其近似为高斯模型,根据历史数据的分布,来计算当前时刻该功率值出现的概率,低于某个阈值则为异常。于某个阈值则为异常。于某个阈值则为异常。

【技术实现步骤摘要】
基于电力数据的异常检测算法


[0001]本专利技术属于电力数据异常检测
,特别是涉及一种基于电力数据的异常检测算法。

技术介绍

[0002]在电力数据异常检测中大多使用k

means算法和孤立森林算法,其中k

means算法对初始中心敏感,容易陷入局部最优并且需要事先确定聚类的数量等问题,而使用孤立森林算法时由于电力数据波动较大,会将正常数据检测为异常。

技术实现思路

[0003]本专利技术的目的在于提供一种基于电力数据的异常检测算法,通过对所采集的功率数据进行差值计算,画出其当前时刻的历史数据的直方图,由于异常数据较少,可将其近似为高斯模型,根据历史数据的分布,来计算当前时刻该功率值出现的概率,低于某个阈值则为异常。
[0004]为达上述目的,本专利技术是通过以下技术方案实现的:
[0005]基于电力数据的异常检测算法,分析功率的差值,采用当前时刻减去前面第四个时刻的值,并且连续4个值都低于阈值则判断为异常;画出其当前时刻功率差值的直方图,采用核密度估计算法,设其概率密度函数为f,公式如下:
[0006][0007]进一步的,用平均积分平方误差来衡量带宽h的优劣,公式如下:
[0008][0009]在弱假设下,其中AMISE为渐进的MISE,而AMISE有,
[0010][0011]其中,
[0012]R(g)=∫g(x)2dx
[0013]m2(K)=∫x2K(x)dx
[0014]为了使MISE(h)最小,则转化为求极点问题,
[0015][0016][0017]进一步的,K的公式为:
[0018]进一步的,取值范围为0~100。
[0019]进一步的,交叉验证方法采用留一法。
[0020]本专利技术的实施例具有以下有益效果:通过对所采集的功率数据进行差值计算,画出其当前时刻的历史数据的直方图,由于异常数据较少,可将其近似为高斯模型,根据历史数据的分布,来计算当前时刻该功率值出现的概率,低于某个阈值则为异常。
附图说明
[0021]构成本申请的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0022]图1为功率差值直方分布图。
[0023]图2为实施例1中去除周日数据的异常数据。
[0024]图3为实施例1中去除周日数据的检测结果。
[0025]图4为实施例1中周日异常数据。
[0026]图5为实施例1中周日异常数据的检测结果。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。
[0028]为了保持本专利技术实施例的以下说明清楚且简明,本专利技术省略了已知功能和已知部件的详细说明。
[0029]在电力数据异常检测中,所采集的数据为电流、电压、功率、频率等数据,但电压基本稳定在330V,频率为50HZ,并不会因为异常情况而发生改变,又由于功率为电压与电流的乘积,很好的显示异常发生时的情况,故本专利技术解决问题的思路在于对功率数据进行分析。
[0030]电力数据异常情况大多体现在功率的突增和突降,所以采用功率的差值进行分析。但由于功率数据比不稳定,正常情况也会有突变,故采用当前时刻减去前面第四个时刻的值,并且连续4个值都低于阈值则判断为异常。
[0031]画出其当前时刻功率差值的直方图,根据图1可知其近似于高斯分布,故可采用核函数为高斯函数的核密度估计算法。
[0032]核密度估计(Kernel density estimation),是一种用于估计概率密度函数的非参数方法,为独立同分布F的n个样本点,设其概率密度函数为f,核密度估计为以下:
[0033][0034]K(.)为核函数(非负、积分为1,符合概率密度性质,并且均值为0),为高斯函数
[0035][0036]h>0为一个平滑参数,称作带宽(bandwidth),也看到有人叫窗口。
[0037]为缩放核函数(scaled Kernel)。
[0038]带宽反映了KDE曲线整体的平坦程度,也即观察到的数据点在KDE曲线形成过程中所占的比重。带宽越大,观察到的数据点在最终形成的曲线形状中所占比重越小,KDE整体曲线就越平坦;带宽越小,观察到的数据点在最终形成的曲线形状中所占比重越大,KDE整体曲线就越陡峭。
[0039]用平均积分平方误差(mean intergrated squared error)来衡量带宽h的优劣。
[0040][0041]在弱假设下,其中AMISE为渐进的MISE。而AMISE有,
[0042][0043]其中,
[0044]R(g)=∫g(x)2dx
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0045]m2(K)=∫x2K(x)dx
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0046]为了使MISE(h)最小,则转化为求极点问题,
[0047][0048][0049]K即为公式(2),f(x)为功率差值直方分布近似的高斯分布概率密度函数。
[0050]本次用GridSearchCV函数来确定h,分类器用高斯函数,取值范围为0~100,模型评价标准为平均积分平方误差,采用交叉验证中的留一法。
[0051]留一法就是每次只留下一个样本做测试集,其他样本做训练集,如果有k个样本,则需要训练k次,测试k次。留一法计算繁琐但样本利用率高。
[0052]实施例1
[0053]请参阅图2至图5,由于该公司周日用电数据与周一至周六用电数据相差较大,故将数据分为去除周日数据和周日数据,分别用KDE算法进行检测,通过GridSearchCV函数分别计算最佳带宽,算得去除周日数据带宽为21.36,周日数据带宽为33.05,确定好带宽用KDE算法进行训练根据实际情况调整阈值,去除周日数据阈值为0.0007,周日数据阈值为0.001。
[0054]图2为10月17日及其前7天的数据,其中Z1为异常数据,可以发现在15时25分出现
异常,15点55分恢复。
[0055]检测结果如图3所示,其中一条为10月17日一天的功率数据,另一条为KDE计算出的概率曲线,Z2为检测为异常(突降和突增)进行报警。
[0056]图4为8月30日及其前7天的数据,其中Z3为异常数据,可以发现在7时40分出现异常。
[0057]检测结果如图5所示,其中一条为8月30日一天的功率数据,另一条为KDE计算出的概率曲线,Z4为检测为异常(突降或突本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于电力数据的异常检测算法,其特征在于:分析功率的差值,采用当前时刻减去前面第四个时刻的值,并且连续4个值都低于阈值则判断为异常;画出其当前时刻功率差值的直方图,采用核密度估计算法,设其概率密度函数为f,公式如下:2.如权利要求1所述的基于电力数据的异常检测算法,其特征在于:用平均积分平方误差来衡量带宽h的优劣,公式如下:在弱假设下,其中AMISE为渐进的MISE,而AMISE有,其中,R(g...

【专利技术属性】
技术研发人员:虞海张添良陈旻昕吴晨健陈景润
申请(专利权)人:苏州安极能新能源发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1