一种结合云端与边端的窃电用户识别方法及装置制造方法及图纸

技术编号:30105551 阅读:26 留言:0更新日期:2021-09-18 09:14
本发明专利技术公开一种结合云端与边端的窃电用户识别方法及装置,方法包括:响应于获取边端的用户历史用电数据以及终端设备窃电记录,分别提取窃电识别评估指标和窃电标签,使形成训练数据集;基于训练数据集对组合分类模型进行训练,其中,组合分类模型为基于LightGBM子模型和神经网络子模型的组合模型;将某一用户实时用电数据输入组合分类模型中,输出某一用户的窃电嫌疑系数,使确定窃电嫌疑用户。通过边端服务器对数据进行预处理并生成窃电识别标签,降低了云端服务器的计算负担,提高计算效率与检测效率,并且采用LightGBM模型和BP神经网络的组合模型,加快了运算的速度并提高了分类的准确度。类的准确度。类的准确度。

【技术实现步骤摘要】
一种结合云端与边端的窃电用户识别方法及装置


[0001]本专利技术属于电网反窃电
,尤其涉及一种结合云端与边端的窃电用户识别方法及装置。

技术介绍

[0002]随着我国现代化建设步伐的加快,国家对能源的消耗也在不断增长,尤其是对电力的需求量呈现逐年增加的态势。在此背景下,一些不法分子通过破坏计量装置、私接线路等手段窃取电力资源,从而减少用电成本。窃电行为不仅严重影响正常的供用电秩序,给电网企业带来较大的经济损失,还会造成触电事故和电气火灾事故,危及人身及电网安全。
[0003]目前具有窃电嫌疑的用户的识别方法大多为工人巡检,定期逐户排查,但这种方式效率低下,耗费大量的人力、物力,同时对于一些隐蔽的窃电方式很难进行准确的识别。

技术实现思路

[0004]本专利技术提供一种结合云端与边端的窃电用户识别方法,用于至少解决上述技术问题之一。
[0005]第一方面,本专利技术提供一种结合云端与边端的窃电用户识别方法,包括:响应于获取边端的用户历史用电数据以及终端设备窃电记录,分别提取窃电识别评估指标和窃电标签,使形成训练数据集; 基于所述训练数据集对组合分类模型进行训练,其中,所述组合分类模型为基于LightGBM子模型和神经网络子模型的组合模型,所述LightGBM子模型的构建过程具体如下:对数据集中的连续型特征进行预排序,并将连续的浮点数据转换为离散数据;基于特征数据生成决策树,综合考虑决策树的准确程度与决策树的复杂程度,定义决策树的目标函数计算如下式:,式中,为计算决策树判断的准确程度,与分别为决策树的对数据集的标签预测值和数据集的标签实际值;为计算决策树的复杂程度,其中,,为叶子节点的数量,为不同叶子节点的权重向量,和均为正则项系数;采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树,每棵决策树拟合目标之间的关系如下式:,式中,为第t棵树在数据集合上的预测结果,为前棵树整体的预测结果,为当前棵树的预测结果;根据第棵决策树的生成过程,定义目标函数如下式:,对
进行泰勒展开,定义一对一阶偏导函数为、二阶偏导函数为,将目标函数改写为:,定义,,求解损失函数,得到叶子节点的最佳权重与简化的子树分枝评分函数,如下式:,,对当前每一个叶子节点计算分割增益,选择当前最大增益的节点进行分割,直到决策树整体的目标函数值满足设定要求,第t棵决策树即生成完毕,其中,计算分割增益的表达式为:,式中,表示对当前节点划分后,左边叶子节点分数,表示对当前节点划分后,右边叶子节点分数,表示对节点不分割时决策树的分数,表示加入新叶子节点引入的复杂度代价;基于已有的决策树集合,对特征值进行预测,得到当前t颗决策树的预测值,计算与真实值的差,并将其放入下一棵决策树的拟合目标中,直到生成的决策树数量满足设定值,或决策树集合整体的预测精度满足要求;将某一用户实时用电数据输入所述组合分类模型中,输出某一用户的窃电嫌疑系数,使确定窃电嫌疑用户。
[0006]第二方面,本专利技术提供一种结合云端与边端的窃电用户识别装置,包括:获取模块,配置为响应于获取边端的用户历史用电数据以及终端设备窃电记录,分别提取窃电识别评估指标和窃电标签,使形成训练数据集; 训练模块,配置为基于所述训练数据集对组合分类模型进行训练,其中,所述组合分类模型为基于LightGBM子模型和神经网络子模型的组合模型,所述LightGBM子模型的构建过程具体如下:对数据集中的连续型特征进行预排序,并将连续的浮点数据转换为离散数据;基于特征数据生成决策树,综合考虑决策树的准确程度与决策树的复杂程度,定义决策树的目标函数计算如下式:,式中,为计算决策树判断的准确程度,与分别为决策树的对数据集的标签预测值和数据集的标签实际值;为计算决策
树的复杂程度,其中,,为叶子节点的数量,为不同叶子节点的权重向量,和均为正则项系数;采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树,每棵决策树拟合目标之间的关系如下式:,式中,为第t棵树在数据集合上的预测结果,为前棵树整体的预测结果,为当前棵树的预测结果;根据第棵决策树的生成过程,定义目标函数如下式:,对进行泰勒展开,定义一对一阶偏导函数为、二阶偏导函数为,将目标函数改写为:,定义,,求解损失函数,得到叶子节点的最佳权重与简化的子树分枝评分函数,如下式:,,对当前每一个叶子节点计算分割增益,选择当前最大增益的节点进行分割,直到决策树整体的目标函数值满足设定要求,第t棵决策树即生成完毕,其中,计算分割增益的表达式为:,式中,表示对当前节点划分后,左边叶子节点分数,表示对当前节点划分后,右边叶子节点分数,表示对节点不分割时决策树的分数,表示加入新叶子节点引入的复杂度代价;基于已有的决策树集合,对特征值进行预测,得到当前t颗决策树的预测值,计算与真实值的差,并将其放入下一棵决策树的拟合目标中,直到生成的决策树数量满足设定值,或决策树集合整体的预测精度满足要求;输出模块,配置为将某一用户实时用电数据输入所述组合分类模型中,输出某一用户的窃电嫌疑系数,使确定窃电嫌疑用户。
[0007]第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处
理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的结合云端与边端的窃电用户识别方法的步骤。
[0008]第四方面,本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本专利技术任一实施例的结合云端与边端的窃电用户识别方法的步骤。
[0009]本申请的一种结合云端与边端的窃电用户识别方法及装置,通过边端服务器对数据进行预处理并生成窃电识别标签,降低了云端服务器的计算负担,提高计算效率与检测效率,并且采用LightGBM模型和BP神经网络的组合模型,加快了运算的速度并提高了分类的准确度。
附图说明
[0010]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1为本专利技术一实施例提供的一种结合云端与边端的窃电用户识别方法的流程图;图2为本专利技术一实施例提供的又一种结合云端与边端的窃电用户识别方法的流程图;图3为本专利技术一实施例提供的一种结合云端与边端的窃电用户识别装置的结构框图;图4是本专利技术一实施例提供的电子设备的结构示意图。
具体实施方式
[0012]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合云端与边端的窃电用户识别方法,其特征在于,包括:响应于获取边端的用户历史用电数据以及终端设备窃电记录,分别提取窃电识别评估指标和窃电标签,使形成训练数据集;基于所述训练数据集对组合分类模型进行训练,其中,所述组合分类模型为基于LightGBM子模型和神经网络子模型的组合模型,所述LightGBM子模型的构建过程具体如下:对数据集中的连续型特征进行预排序,并将连续的浮点数据转换为离散数据;基于特征数据生成决策树,综合考虑决策树的准确程度与决策树的复杂程度,定义决策树的目标函数计算如下式:,式中,为计算决策树判断的准确程度,与分别为决策树的对数据集的标签预测值和数据集的标签实际值;为计算决策树的复杂程度,其中,,为叶子节点的数量,为不同叶子节点的权重向量,和均为正则项系数;采用损失函数的负梯度作为当前决策树的残差近似值,拟合新的决策树,每棵决策树拟合目标之间的关系如下式:,式中,为第t棵树在数据集合上的预测结果,为前棵树整体的预测结果,为当前棵树的预测结果;根据第棵决策树的生成过程,定义目标函数如下式:,对进行泰勒展开,定义一对一阶偏导函数为、二阶偏导函数为,将目标函数改写为:,定义,,求解损失函数,得到叶子节点的最佳权重与简
化的子树分枝评分函数,如下式:,,对当前每一个叶子节点计算分割增益,选择当前最大增益的节点进行分割,直到决策树整体的目标函数值满足设定要求,第t棵决策树即生成完毕,其中,计算分割增益的表达式为:,式中,表示对当前节点划分后,左边叶子节点分数,表示对当前节点划分后,右边叶子节点分数,表示对节点不分割时决策树的分数,表示加入新叶子节点引入的复杂度代价;基于已有的决策树集合,对特征值进行预测,得到当前t颗决策树的预测值,计算与真实值的差,并将其放入下一棵决策树的拟合目标中,直到生成的决策树数量满足设定值,或决策树集合整体的预测精度满足要求;将某一用户实时用电数据输入所述组合分类模型中,输出某一用户的窃电嫌疑系数,使确定窃电嫌疑用户。2.根据权利要求1所述的一种结合云端与边端的窃电用户识别方法,其特征在于,所述组合分类模型的输入量为所述窃电识别评估指标,输出量为所述窃电标签。3.根据权利要求1所述的一种结合云端与边端的窃电用户识别方法,其特征在于,所述窃电识别评估指标包括负荷曲线斜率指标、线损指标以及告警类指标。4.根据权利要求1所述的一种结合云端与边端的窃电用户识别方法,其特征在于,在响应于获取边端的用户历史用电数据以及终端设备窃电记录,分别提取窃电识别评估指标和窃电标签,使形成训练数据集之前,所述方法还包括:响应于获取边端的用户历史用电数据以及终端设备窃电记录,对所述用户历史用电数据和所述终端设备窃电记录进行预处理,其中,所述预处理包括数据清洗以及缺失值处理。5.根据权利要求4所述的一种结合云端与边端的窃电用户识别方法,其特征在于,所述缺失值处理具体包括:从原始数据集中...

【专利技术属性】
技术研发人员:户艳琴张吴敏刘念傅皆恺李承霖黄天翔张延石德文李柯舟胡志强范志夫李晨晨宋伟业
申请(专利权)人:国家电网有限公司华北电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1