用户用能异常数据检测方法及设备技术

技术编号:28943384 阅读:21 留言:0更新日期:2021-06-18 21:52
本申请提供了一种用户用能异常数据检测方法及设备,该方法包括:获取待检测样本,其中,待检测样本由待检测用户的用能数据生成;将待检测样本遍历孤立森林模型中的每棵孤立树,以确定待检测样本落在每棵孤立树中的子节点的高度,以及待检测样本与每棵孤立树的根节点中训练样本之间的距离;根据高度,确定待检测样本的高度异常分值;根据距离,确定待检测样本的密度异常分值;在高度异常分值和密度异常分值满足预设条件时,确定待检测用户的用能数据为异常数据。本申请能够提高用户用能异常数据的检测速度和精度。

【技术实现步骤摘要】
用户用能异常数据检测方法及设备
本申请属于异常数据检测
,更具体地说,是涉及一种用户用能异常数据检测方法及设备。
技术介绍
在电网实际运行过程中,电力用户用能数据的质量对电力数据分析挖掘、用电客户准确定位、电网稳定运行都有着决定性的影响。为确保电力用户用能数据的准确性与完整性,需要对用能数据中的异常数据进行检测。异常数据检测作为数据挖掘的重要环节,在电力大数据领域有着广泛而重要的应用。传统的异常检测算法依据数据分布进行异常点判断,如N-σ检测方法,其缺点在于需要构建合适的数据分布且无法满足海量数据检测的要求。近年来,基于机器学习方法的异常检测应用发展迅速,部分行业采用孤立森林(IsolationForest,iForest)算法来解决异常数据检测问题,然而此类方法对数据局部异常不敏感、异常检测精度较低,不适用于10kV专变用户用能数据。
技术实现思路
本申请的目的在于提供一种用户用能异常数据检测方法及设备,以解决用户用能异常数据检测的精度低的问题。本申请实施例的第一方面,提供了一种用户用能异常数据检测方本文档来自技高网...

【技术保护点】
1.一种用户用能异常数据检测方法,其特征在于,包括:/n获取待检测样本,所述待检测样本由待检测用户的用能数据生成;将所述待检测样本遍历孤立森林模型中的每棵孤立树,以确定所述待检测样本落在每棵孤立树中的子节点的高度,以及所述待检测样本与每棵孤立树的根节点中各训练样本之间的距离;所述孤立森林模型经由多个选定用户的用能数据生成的训练样本训练,所述孤立森林模型包括多棵孤立树,每棵孤立树的根节点包括多个训练样本;根据所述高度,确定所述待检测样本的高度异常分值;根据所述距离,确定所述待检测样本的密度异常分值;在所述高度异常分值和所述密度异常分值满足预设条件时,确定所述待检测用户的用能数据为异常数据。/n

【技术特征摘要】
1.一种用户用能异常数据检测方法,其特征在于,包括:
获取待检测样本,所述待检测样本由待检测用户的用能数据生成;将所述待检测样本遍历孤立森林模型中的每棵孤立树,以确定所述待检测样本落在每棵孤立树中的子节点的高度,以及所述待检测样本与每棵孤立树的根节点中各训练样本之间的距离;所述孤立森林模型经由多个选定用户的用能数据生成的训练样本训练,所述孤立森林模型包括多棵孤立树,每棵孤立树的根节点包括多个训练样本;根据所述高度,确定所述待检测样本的高度异常分值;根据所述距离,确定所述待检测样本的密度异常分值;在所述高度异常分值和所述密度异常分值满足预设条件时,确定所述待检测用户的用能数据为异常数据。


2.如权利要求1所述的一种用户用能异常数据检测方法,其特征在于,所述根据所述距离,确定所述待检测样本的密度分值,包括:
针对每棵孤立树,从该孤立树的根节点中所有训练样本中,选取与所述待检测样本距离最近的k个训练样本,其中所述k为正整数,计算所述待检测样本与k个训练样本之间的平均距离的倒数,作为所述待检测样本在该孤立树中的相对密度;
计算所述待检测样本在每棵孤立树中的相对密度的平均值,作为所述待检测样本的密度异常分值。


3.如权利要求2所述的一种用户用能异常数据检测方法,其特征在于,在计算所述待检测样本在该孤立树中的相对密度之后,所述方法还包括:
计算所述待检测样本在该孤立树中的多个临近点的相对密度;
基于所述多个临近点的相对密度,对所述待检测样本在该孤立树中的相对密度进行修正;
计算所述待检测样本在每棵孤立树中的修正后的相对密度的平均值,作为所述待检测样本的密度分值。


4.如权利要求1所述的一种用户用能异常数据检测方法,其特征在于,所述在所述高度异常分值和所述密度异常分值满足预设条件时,确定所述待检测用户的用能数据为异常数据,包括:
基于预设权重,计算所述密度异常分值和所述高度异常分值的加权和,作为所述待检测样本的综合异常分值;
在所述综合异常分值小于或等于预设阈值时,确定所述待检测用户的用能数据为异常数据。


5.如权利要求1所述的一种用户用能异常数据检测方法,其特征在于,所述根据所述高度,确定所述待检测样本的高度异常分值,包括:
将所述待检测样本落在每棵孤立树中的子节点的高度求均值,以得到所述待检测样本的平均高度;
对所述平均高度进行归一化处理,以得到所述待检测样本的高度异常分值。

【专利技术属性】
技术研发人员:刘林青付文杰王晓甜马浩王立斌刘家丞
申请(专利权)人:国网河北省电力有限公司营销服务中心国家电网有限公司国网河北省电力有限公司电力科学研究院
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1