一种基于曲线相似度和集成学习算法的窃电识别方法技术

技术编号:29040375 阅读:18 留言:0更新日期:2021-06-26 05:50
本发明专利技术涉及一种基于曲线相似度和集成学习算法的窃电识别方法,属于用户用电行为异常识别领域。用户正常的用电行为具有一定的规律性,当出现窃电行为时,其用电趋势会偏离以往的用电规律,相关电气参量指标数值产生异常变化。本发明专利技术对用户历史用电数据进行分析,首先通过对负荷曲线数据进行聚类,得出特征曲线并划分用电行为,其次对比分析待测用户负荷曲线与特征曲线之间的相似度,初步筛选窃电嫌疑用户,最后将相关指标数据代入AdaBoost集成学习模型中做进一步的窃电识别。本发明专利技术能有效缩小对窃电用户的识别范围,有很好的窃电识别效果。果。果。

【技术实现步骤摘要】
一种基于曲线相似度和集成学习算法的窃电识别方法


[0001]本专利技术涉及一种基于曲线相似度和集成学习算法的窃电识别方法,属于用户用电行为异常识别领域。

技术介绍

[0002]电力在生产生活中起着非常重要的作用,随着社会和经济的发展,电力的需求也越来越多,呈现出逐年递增的趋势。电力的充足供应,极大的支持了社会的发展和进步,使得生产生活更加稳定,经济健康发展。但是,受到非法利益的驱使,窃电现象变得尤为明显,窃电方式、手段日益多样化,由传统的窃电方式向高科技窃电方式发展,极具隐蔽性。传统窃电手段大多依靠改变计量装置的正常接线或破坏计量装置来达到不计量电能或少计量的目的。高科技窃电手段通过干扰信号使计量装置产生负误差,以达到电能表走字异常或损坏的目的,干扰手段消失,计量装置就能正常工作,极具隐蔽性。智能电表的普及,也伴随着高科技智能窃电现象的发生,强磁场干扰、强无线电干扰或高频高压干扰等非接触式的窃电行为越来越常见。总的来说,非法窃电就是利用各种手段(包括技术手段和非技术手段),减少缴纳电费,达到获取非法利益的目的。窃电行为严重影响电力系统的正规运行,增加了安全隐患,给供电企业造成了重大经济损失,也严重影响了正常的供用电秩序。为进一步提高社会用电的安全,保障发电企业、电网企业和电力用户的正常利益,尽可能的杜绝窃电行为的发生。在电力数据分析中,出现了数据挖掘和机器学习等智能检测、智能识别的方法,对用户的历史数据进行分析,挖掘出用户潜在的窃电行为,构建窃电识别模型或规则。通过模型或规则的检测及识别,及时发现用电异常行为,采取相关的应对措施,尽可能的保障电力企业和电力用户的正常利益,将经济损失降到最低。

技术实现思路

[0003]针对上述问题,本专利技术提出一种基于曲线相似度和集成学习算法的窃电识别方法。对用户历史用电数据进行分析,结合曲线相似度分析和AdaBoost集成学习算法对窃电行为进行识别,有很好的识别效果。
[0004]本专利技术的技术方案是:一种基于曲线相似度和集成学习算法的窃电识别方法,包括如下步骤:
[0005]Step1、抽取用户的用电负荷数据;
[0006]Step2、数据预处理,过滤负荷值全部为0或者出现负值的数据记录,剔除异常数据达到30%以上的用户,对保留数据中的部分缺失项,采用均值替换法进行填补,为保证每个个体在分析过程中具有同等重要程度,对数据进行极差归一化处理;
[0007]Step3、通过对相同时间点的负荷值进行加权平均计算,形成典型日负荷曲线;
[0008]Step4、通过FCM算法对典型日负荷曲线进行聚类,得到的聚类中心曲线即为日负荷特征曲线。不同的聚类中心曲线即代表不同类型的日负荷特征曲线,根据此将用电行为划分成不同类别;
[0009]Step5、通过计算待测用户典型日负荷曲线与负荷特征曲线之间的相似度,并与设置的相似度阈值进行比较,若待测用户负荷曲线与特征曲线之间的相似度小于相似度阈值,则初步筛选为窃电嫌疑用户;
[0010]Step6、将筛选出的窃电嫌疑用户和部分正常用户作为样本集,随机挑选正常用户,其数量相对于窃电嫌疑用户不要过多或者过少即可,按比例随机划分训练集样本与测试集样本,对AdaBoost集成学习模型进行训练和测试,提取样本集的相关电气参量指标数值,进行相关计算及归一化处理,转换成可以作为输入的窃电判别指标数据,并用训练集样本对AdaBoost集成学习模型进行训练,再利用训练后的AdaBoost集成学习模型对测试集样本进行分类预测;
[0011]Step7、根据AdaBoost集成学习模型分类预测结果识别判断是否为窃电用户。
[0012]具体地,所述步骤Step3中,包括:采用加权平均的方法来构造典型日负荷曲线:
[0013]设某用户第i天的负荷曲线数据为D
i
={d
i1
,d
i2


,d
im
},一共抽取了n天的数据。根据该用户n天的用电数据,计算第i天在时间点j的负荷权重
[0014]则该用户在时间点j的加权平均负荷为通过对相同时间点的负荷值进行加权平均就可以得到该用户典型的日负荷曲线。
[0015]具体地,所述步骤Step5中,包括:对待测用户典型日负荷曲线与特征曲线之间的相似度度量方法,采用基于时间序列的相似性来度量。动态时间弯曲距离能很好地反映曲线之间的整体动态特性,所以先计算DTW距离,再将其转化为相似度。
[0016]具体地,所述步骤Step6中,包括:当出现窃电行为时,其相关电气参量指标数值产生异常变化,所以选取的窃电判别指标数据为功率因数不平衡率、额定电压偏离度、电压不平衡率、电流不平衡率、相位角不平衡率、电量不平衡率、线损率、月用电量同比、合同容量比。
[0017]具体地,所述步骤Step6中,包括:采用AdaBoost集成学习模型解决分类问题。采用Logistic作为AdaBoost集成学习模型的弱分类器。样本集按照7∶3比例分配至训练集样本与测试集样本中。
[0018]本专利技术的有益效果是:
[0019]本专利技术从表征特性出发,当用户存在窃电行为时,其用电趋势会偏离以往的用电规律,相关电气参量指标数值产生异常变化,对用户历史用电数据进行分析,通过对负荷曲线数据进行聚类,得出特征曲线并划分用电行为,对比分析待测用户负荷曲线与特征曲线之间的相似度,初步筛选窃电嫌疑用户,能够缩小窃电识别的范围。AdaBoost集成学习模型相对于单一分类模型精度更高,稳定性更好,将相关指标数据代入AdaBoost集成学习模型中做进一步的窃电识别,能够提高窃电行为的识别效率。
附图说明
[0020]图1为本专利技术方法的流程图。
具体实施方式
[0021]为了更详细的描述本专利技术和便于本领域人员的理解,下面结合附图以及实施例对本专利技术做进一步的描述。
[0022]实施例1:一种基于曲线相似度和集成学习算法的窃电识别方法按照如图1所示的步骤以及
技术实现思路
中的方案进行:
[0023]抽取用户的用电负荷数据,采样间隔为15分钟,所以每条记录包含96个点的负荷数据。
[0024]数据预处理,过滤负荷值全部为0或者出现负值的数据记录,剔除异常数据达到30%以上的用户,对保留数据中的部分缺失项,采用均值替换法进行填补,再对数据进行极差归一化处理。
[0025]通过对相同时间点的负荷值进行加权平均计算,形成典型日负荷曲线。
[0026]通过FCM算法对典型日负荷曲线进行聚类,得到的聚类中心曲线即为日负荷特征曲线。不同的聚类中心曲线即代表不同类型的日负荷特征曲线,根据此将用电行为划分成不同类别。
[0027]通过计算待测用户典型日负荷曲线与负荷特征曲线之间的DTW距离,再将其转化为相似度。
[0028]设置相似度阈值,若待测用户典型日负荷曲线与负荷特征曲线之间的相似度小于设置的相似度阈值,则初步筛选为窃电嫌疑用户。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于曲线相似度和集成学习算法的窃电识别方法,其特征在于,包括以下步骤:Step1、抽取用户的用电负荷数据;Step2、数据预处理,过滤负荷值全部为0或者出现负值的数据记录,剔除异常数据达到30%以上的用户,对保留数据中的部分缺失项,采用均值替换法进行填补,再对数据进行极差归一化处理;Step3、通过对相同时间点的负荷值进行加权平均计算,形成典型日负荷曲线;Step4、通过FCM算法对典型日负荷曲线进行聚类,得到的聚类中心曲线即为日负荷特征曲线;不同的聚类中心曲线即代表不同类型的日负荷特征曲线,根据此将用电行为划分成不同类别;Step5、通过计算待测用户典型日负荷曲线与负荷特征曲线之间的相似度,并与设置的相似度阈值进行比较,若待测用户负荷曲线与特征曲线之间的相似度小于相似度阈值,则初步筛选为窃电嫌疑用户;Step6、将筛选出的窃电嫌疑用户和部分正常用户作为样本集,按比例划分训练集样本与测试集样本,对AdaBoost集成学习模型进行训练和测试,提取样本集的相关电气参量指标数值,进行相关计算及归一化处理,转换成可以作为输入的窃电判别指标数据,并用训练集样本对AdaBoost集成学习模型进行训练,再利用训练后的AdaBoost集成学习模型对测试集样本进行分类预测;Step7、根据AdaBoost集成学习模型分类预测结果识别判断是否为窃电用户。2.根据权利要求1所述的基于曲线相似度和集成学习算法的窃电识别方法,其特征在于,所述步骤Step3中,包括:负荷曲线是反映用户在一段时间内的负荷变化规律的曲线,某一天的用电负荷曲线并不能综合反映用户的日用电行为,采用加权平均的方法来构造典型日负荷曲线:设某用户...

【专利技术属性】
技术研发人员:宋少杰张长胜李英娜李川
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1