【技术实现步骤摘要】
基于段一致性判别自编码器电能表异常检测方法及装置
[0001]本专利技术涉及电能表检测
,并且更具体地,涉及一种基于段一致性判别自编码器电能表异常检测方法及装置
。
技术介绍
[0002]智能电能表可以采集家庭
、
商业等用户的电流
、
电压
、
电能示值等多变量时间序列检测数据,通过对单一变量时间序列属性随时间的周期
、
趋势的分析和多变量时间序列属性间相关关系和可能的因果关系的分析,可以学习多变量时间序列的正常模式并识别判断异常模式,从而全面地分析和监测智能电能表的运行情况
。
[0003]在实际情况中收集到的智能电能表数据大都缺少准确的正异常标签,且由于电表设备的鲁棒性,从实际电表中收集的数据大部分为正常数据,异常稀少且隐藏在大量的正常数据中,收集并人工标注足够数量的异常数据需要花费大量成本与时间,因此只需要使用正常运行状态下的历史监控数据进行训练的无监督多维时间序列异常检测方法更适用于智能电能表
。
传统的无监督异常检测方法独立地考虑历史检测数据,忽略时间点之间的上下文关系,所以它们无法捕捉检测数据中的复杂结构和非线性关系
。
此外,传统方法在测试过程中需要对训练数据进行再次遍历,巨大的计算成本限制了传统方法向大规模数据的扩展
。
因此现在主流的方法是使用基于深度学习的方法来更好地挖掘多变量时间序列中的时间依赖性和变量间的关联性,取得更好地异常检测结果
。 />基于深度学习的多变量时间序列异常检测方法是利用复杂的神经网络学习正常时间序列的模式并根据这个特性来分辨正常和异常数据
,
其可以分为基于预测的方法和基于重构的方法
。
基于预测的方法通过学习历史的时间序列数据,提取时序模式并预测下一个时间点或时间段的数据,然后将真实值与预测值的差值作为异常分数来分辨正异常数据
。
基于重构的方法通常使用编码器压缩原始数据,学习并保留时间序列中的关键信息
。
然后使用解码器逐点重构原始时间序列,将原始时间序列和重构时间序列之间的重构误差作为异常分数来检测异常数据
。
为了应对智能电能表在实际环境中收集到的数据中存在噪声,导致基于重构方法的模型在学习过程中产生的过拟合问题,有研究人员在多变量时间序列异常检测中引入了对比学习方法
。
但由于这些方法仍然沿用来自计算机视觉和自然语言处理领域对比学习的做法,采用了不适合时间序列异常检测的归纳偏置和代理任务进行数据增强和模型学习,限制了这些多变量时间序列异常检测方法的性能的进一步提高
。
[0004]根据国内外相关文献调研,当前智能电能表的异常检测方法主要有基于单一系统的简单阈值判定方法和基于静态离线数据的分析方法
。
基于单一系统的简单阈值判定方法具有局限性,一方面对智能电能表信息利用率和状态评价正确率都偏低,另一方面难以检测出智能电能表的周期趋势异常和多变量间的相关关系异常,而且相关规范标准中的固定阈值难以结合智能电能表运行工况的差异性
。
基于静态离线数据的分析方法存在与智能电能表在线运行结合不紧密
、
不能快速反映智能电能表运行状态和及时发现异常现象等问题
。
基于在线时间序列数据的异常检测方法虽然在引擎维护
、
污水处理等领域取得了一定
成绩,但在智能电能表领域未见应用
。
现有的在线异常检测方法并不直接适用于电能表数据,异常检测性能也有待进一步提高
。
技术实现思路
[0005]针对现有技术的不足,本专利技术提供一种基于段一致性判别自编码器电能表异常检测方法及装置
。
[0006]根据本专利技术的一个方面,提供了一种基于段一致性判别自编码器电能表异常检测方法,包括:
[0007]获取待测电能表历史检测的多变量长时间序列数据;
[0008]对多变量长时间序列数据进行归一化处理,划分预设窗口长度的多个时间窗口数据;
[0009]将多个时间窗口数据输入至预先训练的异常检测模型中,输出每个时间窗口数据对应的重构数据;
[0010]根据每个时间窗口数据的重构数据以及原始数据确定该时间窗口数据每个时间点的异常分数,并根据异常分数,确定待测电能表每个时间点的异常程度
。
[0011]可选地,多变量长时间序列数据包括:
A
相电流
、B
相电流
、C
相电流
、A
相电压
、B
相电压
、C
相电压
、
正向有功电能示值
、
反向有功电能示值
、
正向无功电能示值
、
反向无功电能示值
、A
相有功功率
、B
相有功功率
、C
相有功功率
、
有功功率总值
、A
相无功功率
、B
相无功功率
、C
相无功功率
、
无功功率总值
、A
相功率因数
、B
相功率因数
、C
相功率因数
、
功率因数总值
。
[0012]可选地,获取待测电能表历史检测的多变量长时间序列数据之后,还包括:
[0013]利用
Z
‑
Score
标准化使多变量长时间序列数据中的每一个变量的所有值符合标准正态分布
。
[0014]可选地,
Z
‑
Score
标准化的公式为:
[0015][0016]式中,
X
i
为多变量长时间序列数据,表示标准化后的
X
i
,
μ
表示
X
i
中每个变量所有样本数据的均值,
σ
表示
X
i
中每个变量所有样本数据的标准差
。
[0017]可选地,异常检测模型的训练过程如下:
[0018]获取多个电能表历史检测的多变量时间序列数据样本,合并成一个多变量长时间序列数据样本;
[0019]利用
Z
‑
Score
标准化使多变量长时间序列数据样本中的每一个变量的所有值符合标准正态分布;
[0020]对标准化的多变量长时间序列数据样本进行窗口化,划分成预设窗口的多个时间窗口数据样本;
[0021]采用多分辨率随机下采样数据增强方法对多个时间窗口数据样本进行数据增强,确定正负样本对;
[0022]采用由
GRU
组成的编码器对正负样本对进行特征提取,确定正负样本对特征;
[0023]通本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于段一致性判别自编码器电能表异常检测方法,其特征在于,包括:获取待测电能表历史检测的多变量长时间序列数据;对所述多变量长时间序列数据进行归一化处理,划分预设窗口长度的多个时间窗口数据;将多个所述时间窗口数据输入至预先训练的异常检测模型中,输出每个所述时间窗口数据对应的重构数据,其中所述异常检测模型采用段一致性判别自编码器;根据每个时间窗口数据的重构数据以及原始数据确定该时间窗口数据每个时间点的异常分数,并根据所述异常分数,确定所述待测电能表每个时间点的异常程度
。2.
根据权利要求1所述的方法,其特征在于,所述多变量长时间序列数据包括:
A
相电流
、B
相电流
、C
相电流
、A
相电压
、B
相电压
、C
相电压
、
正向有功电能示值
、
反向有功电能示值
、
正向无功电能示值
、
反向无功电能示值
、A
相有功功率
、B
相有功功率
、C
相有功功率
、
有功功率总值
、A
相无功功率
、B
相无功功率
、C
相无功功率
、
无功功率总值
、A
相功率因数
、B
相功率因数
、C
相功率因数
、
功率因数总值
。3.
根据权利要求1所述的方法,其特征在于,获取待测电能表历史检测的多变量长时间序列数据之后,还包括:利用
Z
‑
Score
标准化使所述多变量长时间序列数据中的每一个变量的所有值符合标准正态分布
。4.
根据权利要求3所述的方法,其特征在于,所述
Z
‑
Score
标准化的公式为:式中,
X
i
为多变量长时间序列数据,表示标准化后的
X
i
,
μ
表示
X
i
中每个变量所有样本数据的均值,
σ
表示
X
i
中每个变量所有样本数据的标准差
。5.
根据权利要求1所述的方法,其特征在于,所述异常检测模型的训练过程如下:获取多个电能表历史检测的多变量时间序列数据样本,合并成一个多变量长时间序列数据样本;利用
Z
‑
Score
标准化使所述多变量长时间序列数据样本中的每一个变量的所有值符合标准正态分布;对标准化的多变量长时间序列数据样本进行窗口化,划分成所述预设窗口的多个时间窗口数据样本;采用多分辨率随机下采样数据增强方法对多个时间窗口数据样本进行数据增强,确定...
【专利技术属性】
技术研发人员:高欣,薛冰,李保丰,翟峰,赵兵,郜波,秦煜,陈昊,梁晓兵,许斌,徐萌,卢建生,肖春,任宇路,杨帅,贾勇,姚俊峰,
申请(专利权)人:中国电力科学研究院有限公司国网山西省电力公司营销服务中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。