基于机器学习的违规用电筛查方法及装置制造方法及图纸

技术编号:39597840 阅读:6 留言:0更新日期:2023-12-03 19:56
本发明专利技术提出一种基于机器学习的违规用电筛查方法及装置,通过对大数据的清洗

【技术实现步骤摘要】
基于机器学习的违规用电筛查方法及装置


[0001]本专利技术涉及电力大数据

电网维护
,尤其涉及一种基于机器学习的违规用电筛查方法及装置


技术介绍

[0002]随着社会经济的发展,出现了一些违规用电的现象

例如,当用户同时存在居民合表和工商业用电时,为了节约成本违规将居民用电转移到工商业使用,从而享受较低的电价成本

大量的用户数据使人工方式难以有效全面排查这种违规行为

[0003]目前,用检人员主要通过计算居民合表与工商业两者电量占比,大致筛查违约用户

然而,这种方法存在一些问题

首先,占比阈值因用户的不同而存在差异,难以界定

其次,如果用户仅使用合表电价,违约行为很难被发现

[0004]综合上述,因此急需一种有效的措施来监管和排查用电客户是否存在违规行为


技术实现思路

[0005]针对现有技术存在的缺陷和不足,本专利技术提出了一种基于机器学习的违规用电筛查方法及装置,通过对大数据的清洗

剔除特殊用户

平滑数据筛查等特殊处理,结合
KNN
分类模型的构建以实现对大数据的有效利用,以达成监管和排查用电客户是否存在违规行为的目的

[0006]其具体包括以下
技术实现思路
:一种基于机器学习的违规用电筛查方法,包括以下步骤:步骤
S1
采用一个时间段的全域专变用电负荷数据作为基础样本;步骤
S2
:数据清洗,包括:剔除重复数据

筛选三相负荷以及部分空白数据进行填充或清除;步骤
S3
:用电类型匹配,筛选居民合表和工业用电;步骤
S4
:剔除特殊用户,包括采用居民合表电价但实际非居民使用的用户;步骤
S5
:数据归一化处理,以提升机器学习效果,归一化公式如下:步骤
S6
:平滑数据筛查,采用傅里叶变换并计算振幅,通过设定和调整振幅阈值,以有效地识别和剔除平滑数据,从而提高模型的准确性和可靠性;步骤
S7
:通过训练样本构建
KNN
模型,并利用已训练的
KNN
模型对数据进行分类,与台账不一致的列为异常数据清单;对异常数据清单和步骤
S6
筛查获得的平滑数据清单进行数据可视化处理,以辅助人工排查

[0007]进一步地,样本数据通过以下方式获得:通过用电信息采集系统,获取包括每台专变每日三相
96
个时段的负荷数据,然后制作专变负荷类型清单,以记录目前在运所有专变的用电类型,通过包括用户编号的数据
列,匹配专变负荷数据表内专变用电类型

[0008]以及,一种基于机器学习的违规用电筛查装置,包括:数据采集模块

特殊用户剔除模块

傅里叶平滑筛查模块

数据归一化模块
、KNN
模型和异常数据清单可视化模块;所述数据采集模块通过用电信息采集系统,获取包括每台专变每日三相
96
个时段的负荷数据,然后制作专变负荷类型清单,以记录目前在运所有专变的用电类型,通过包括用户编号的数据列,匹配专变负荷数据表内专变用电类型;所述特殊用户剔除模块用于剔除特殊用户,包括采用居民合表电价但实际非居民使用的用户;所述数据归一化模块用于在训练和筛查之前对数据进行归一化处理;所述傅里叶平滑筛查模块用于采用傅里叶变换并计算振幅,通过设定和调整振幅阈值,以有效地识别和剔除平滑数据,从而提高模型的准确性和可靠性;所述
KNN
模型通过训练样本训练获得,用于对数据进行分类,与台账不一致的列为异常数据清单;所述异常数据清单可视化模块用于对异常数据清单和筛查获得的平滑数据清单进行数据可视化处理,以辅助人工排查

[0009]相比于现有技术,本专利技术及其优选方案创新地将机器学习应用于用电检查工作,构建了一套能有效筛查违约用电的模型

[0010]考虑传统方法不仅费时费力,而且效果不尽人意

通过数字化手段铸造了“大数据
+
机器学习
+
用电检查”的全新工作模式,有效提升用电检查工作效率,推动业务数字化转型

[0011]并且对大数据进行了充分有效的利用,以进一步挖掘其价值

附图说明
[0012]下面结合附图和具体实施方式对本专利技术进一步详细的说明:图1是本专利技术实施例获取的负荷数据示意图

[0013]图2是本专利技术实施例专变负荷类型清单示意图

[0014]图3是本专利技术实施例方案总体流程示意图

[0015]图4是本专利技术实施例傅里叶变换示意图

[0016]图5是本专利技术实施例
KNN
算法示意图

[0017]图6是本专利技术实施例部分平滑清单数据可视化示意图

[0018]图7是本专利技术实施例部分异常清单数据可视化示意图

[0019]图8是本专利技术实施例现场排查部分情况示意图

[0020]图9‑

13
是本专利技术实施例实现的主要代码示意图

具体实施方式
[0021]为让本专利的特征和优点能更明显易懂,下文特举实施例,并配合附图,作详细说明如下:在此需要说明的是,对于这些实施方式的说明用于帮助理解本专利技术,但并不构成对本专利技术的限定

此外,下面所描述的本专利技术各个实施方式中所涉及的技术特征只要彼此
之间未构成冲突就可以相互组合

[0022]1.
工业用电和居民合表用电曲线特征分析工业用电曲线特征:工业用电的曲线相对较稳定,呈现出白天负荷高

夜间负荷低的特点

[0023]居民合表曲线特征:居民合表用电受生活方式

气候影响较大,如外出工作

家用电器和空调使用(尤其是夏天)

因此其用电曲线波动性较大,呈现夜间负荷高

白天负荷低的特点

[0024]2.
针对上述的问题和曲线特征,本实施例采用某时段共计5天的晋江全域专变用电负荷曲线数据,运用
Pandas
(数据分析)
、Scikit

Learn
(机器学习)
、Matplotlib
(数据可视化)等数字化工具,建立一种违约用电筛查模型,可快速准确地定位违约用户,为用电检查工作提供有力支撑

[0025]数据来源本实施例数据来源于用电信息采集系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于机器学习的违规用电筛查方法,其特征在于:包括以下步骤:步骤
S1
:采用一个时间段的全域专变用电负荷数据作为基础样本;步骤
S2
:数据清洗,包括:剔除重复数据

筛选三相负荷以及部分空白数据进行填充或清除;步骤
S3
:用电类型匹配,筛选居民合表和工业用电;步骤
S4
:剔除特殊用户,包括采用居民合表电价但实际非居民使用的用户;步骤
S5
:数据归一化处理,以提升机器学习效果,归一化公式如下:步骤
S6
:平滑数据筛查,采用傅里叶变换并计算振幅,通过设定和调整振幅阈值,以有效地识别和剔除平滑数据,从而提高模型的准确性和可靠性;步骤
S7
:通过训练样本构建
KNN
模型,并利用已训练的
KNN
模型对数据进行分类,与台账不一致的列为异常数据清单;对异常数据清单和步骤
S6
筛查获得的平滑数据清单进行数据可视化处理,以辅助人工排查
。2.
根据权利要求1所述的基于机器学习的违规用电筛查方法,其特征在于:样本数据通过以下方式获得:通过用电信息采集系统,获取包括每台专变每日三相
...

【专利技术属性】
技术研发人员:曾扬鸣蔡珊珊叶晓毅颜泽露林昱达李桂婷林仁杰
申请(专利权)人:国网福建省电力有限公司晋江市供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1