一种基于密度空间聚类的信息流异常数据监测方法及装置制造方法及图纸

技术编号:27619448 阅读:13 留言:0更新日期:2021-03-10 10:57
本发明专利技术公开了一种基于密度空间聚类的信息流异常数据监测方法及装置,包括:S1、实时采集电能信息交互设备上传主站电能量测数据,将电能测量数据分组为幅值量测数据和相角量测数据;S2、利用长短期记忆LSTM方法计算电能信息交互测量数据幅值特征分量;S3、利用斜率特征量计算电能信息数据相角特征分量;S4、采用基于密度空间聚类DBSC监测模型,将所述幅值特征分量、相角特征分量分别输入基于密度空间聚类DBSC监测模型,并进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据,并输出监测结果。本发明专利技术大大提高了动态条件下监测和筛选异常数据的精度,满足现场实际应用的大部分需求。大部分需求。大部分需求。

【技术实现步骤摘要】
一种基于密度空间聚类的信息流异常数据监测方法及装置


[0001]本专利技术涉及电力系统
,具体涉及一种基于密度空间聚类的信息流异常数据监测方法及装置。

技术介绍

[0002]随着国家电网公司不断提高供电可靠性、减少停电时间,提升电能服务能力的要求,势必要实现电力系统电能信息全覆盖、多维度的实时采集。新型电能信息交互设备由于其快速、实时、准确的特点而广泛用于电力系统的动态监测、自适应保护等领域。然而,随着电能信息交互设备的推广应用,因互感器误差,设备故障、时间同步偏差、通信系统中断等诸多因素,现场部分实测电能信息流数据容易出现丢失、跳变、偏差等数据异常问题。另外,随着现代电力系统交互信息不断融合,系统调控中心对实时量测数据的依赖程度越来越高,导致电能信息监测数据面临着较高的潜在网络攻击风险。同时,因信息交互主站利用卫星信号授时,容易受到许多内外因素的影响,例如信道干扰,卫星定位系统(GPS或北斗导航系统)信号丢失和设备错误,都将大大降低系统的可观性,甚至影响电力系统的安全性和稳定性。
[0003]针对监测电力系统电能信息交互设备可能存在的信息流异常数据,目前业内存在很多方法,目前大致可以划分为基于系统拓扑状态估计和基于数据驱动的两类方法。其中,基于系统拓扑状态估计的方法需要预先掌握电力系统拓扑及状态参数,尽管其异常数据监测精度很高,但是当发生系统拓扑错误时,很容易引起误判。而随着数据挖掘技术的兴起,引申出一系列基于神经网络和深度学习的异常数据监测方法。这些方法在静态情况下取得了良好的异常数据监测效果。但是在动态条件(低频振荡、次同步振荡等)下,由于电能信息交互数据本身也在随时间发生振荡波动,导致其中某些不良数据与系统正常数据间仅存在细微差别。因此,在此类动态工况下,传统数据学习方法的在动态条件下误检率很高,难以大面积推广应用。

技术实现思路

[0004]本专利技术所要解决的技术问题是现有技术下传统的信息流异常数据监测方法普遍存在动态条件下无法放大并辨识异常数据细微特征,最终导致误检率大幅增高的问题。
[0005]基于此,本专利技术基于密度空间聚类(density

based spatial clustering,DBSC)方法,提出了一种基于密度空间聚类的信息流异常数据监测方法及装置,该方法通过长短期记忆(long short

term memory,LSTM)神经网络有选择地使用电能信息采集数据,从相角斜率特征出发,通过计算残差值放大了异常数据的特征信息,最后通过DBSC对电能信息流数据幅值/相角特征进行聚类分析,有效解决动态条件下电能信息流数据幅值和相位角数据监测异常的问题。该方法通过长短期记忆LSTM神经网络有选择地使用电能信息流数据,从电能信息测量值相角数据的斜率特征出发,通过计算残差值放大了异常数据的特征信息,最后通过基于密度空间聚类DBSC对电能信息幅值/相角特征进行聚类分析,有效解决
动态条件下电能信息流数据幅值和相位角数据监测异常的问题。根据实施例结果表明,本专利技术方法能够抑制外界干扰因素对异常数据监测的影响,大大提高了动态条件下监测和筛选异常数据的精度,满足现场实际应用的大部分需求。
[0006]本专利技术通过下述技术方案实现:
[0007]一方面,本专利技术提供了一种基于密度空间聚类的信息流异常数据监测方法,该方法包括以下步骤:
[0008]S1、实时采集电能信息交互设备上传主站电能量测数据,将电能测量数据分组为幅值量测数据和相角量测数据;
[0009]S2、将所述幅值量测数据的幅值序列分为训练集和测试集两类,采用长短期记忆LSTM神经网络,并将所述训练集和测试集分别输入到所述长短期记忆LSTM神经网络进行训练得到映射的神经网络特征,作为电能信息流交互数据幅值特征分量;
[0010]S3、对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;
[0011]S4、采用基于密度空间聚类DBSC监测模型,将所述幅值特征分量、相角特征分量分别输入基于密度空间聚类DBSC监测模型,并进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据,并输出监测结果。
[0012]进一步地,步骤S2中所述长短期记忆LSTM神经网络的结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于LSTM神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。
[0013]进一步地,步骤S2中利用长短期记忆LSTM方法计算电能信息交互测量数据幅值特征分量的具体步骤如下:
[0014]S21:将前一时刻的电能信息测量数据幅值特征分量h
t
‑1和当前时刻的待训练的输入信号x
t
输入遗忘门模块,计算得到当前时刻遗忘门的状态参数f
t

[0015]f
t
=σ(W
f
·
[h
t
‑1,x
t
]+b
f
)
[0016]其中:W
f
是遗忘门的权重系数矩阵;x
t
是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;h
t
‑1是前一时刻的电能信息测量数据幅值特征分量,b
f
是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e

x

[0017]同时,通过将x
t
数据保存到输入门得到当前时刻输入门的状态参数i
t

[0018]i
t
=σ(W
i
·
[h
t
‑1,x
t
]+b
i
)
[0019]其中:W
i
是输入门的权重系数矩阵;b
i
是输入门的偏项;
[0020]S22:利用激活函数计算当前时刻的记忆储存单元状态参数
[0021][0022]其中:W
c
是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(e
x

e

x
)/(e
x
+e

x
);b
c
是记忆储存单元的偏项;
[0023]S23:假如定义符号“ο”表示不同状态的合成,长短期记忆LSTM神经网络结合记忆储存单元状态参数和上一时刻长期记忆状态参数c
t
‑1联立求解得到当前时刻的长期记忆状态参数c
t

[0024][0025]S24:输出门控制多个c
t
输出长短期记本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于密度空间聚类的信息流异常数据监测方法,其特征在于,该方法包括以下步骤:S1、实时采集电能信息交互设备上传主站电能量测数据,将电能测量数据分组为幅值量测数据和相角量测数据;S2、将所述幅值量测数据的幅值序列分为训练集和测试集两类,采用长短期记忆LSTM神经网络,并将所述训练集和测试集分别输入到所述长短期记忆LSTM神经网络进行训练得到映射的神经网络特征,作为电能信息流交互数据幅值特征分量;S3、对所述相角量测数据的相角序列进行相位变换计算新的相位差序列,计算相角斜率特征量,即角速度特征量,作为电能信息流交互数据相角特征分量;S4、采用基于密度空间聚类DBSC监测模型,将所述幅值特征分量、相角特征分量分别输入基于密度空间聚类DBSC监测模型,并进行聚类分析以监测电能信息交互设备量测值中的幅值或相角异常数据,并输出监测结果。2.根据权利要求1所述的一种基于密度空间聚类的信息流异常数据监测方法,其特征在于,步骤S2中所述长短期记忆LSTM神经网络的结构包括遗忘门、输入门、输出门和储存单元,所述遗忘门,用于电能量测数据的训练集数据输入口;所述输入门,用于电能量测数据的测试集数据输入口;所述储存单元,用于LSTM神经网络模型训练过程中的中间数据存储;所述输出门,用于训练和测试结果的输出。3.根据权利要求2所述的一种基于密度空间聚类的信息流异常数据监测方法,其特征在于,步骤S2中利用长短期记忆LSTM方法计算电能信息交互测量数据幅值特征分量的具体步骤如下:S21:将前一时刻的电能信息测量数据幅值特征分量h
t
‑1和当前时刻的待训练的输入信号x
t
输入遗忘门模块,计算得到当前时刻遗忘门的状态参数f
t
:f
t
=σ(W
f
·
[h
t
‑1,x
t
]+b
f
)其中:W
f
是遗忘门的权重系数矩阵;x
t
是待训练的输入信号,此处特指当前时刻的电压或电流采样数据;h
t
‑1是前一时刻的电能信息测量数据幅值特征分量,b
f
是遗忘门的偏项,σ是sigmoid函数,其表达式为:σ(x)=1/1+e

x
;同时,通过将x
t
数据保存到输入门得到当前时刻输入门的状态参数i
t
:i
t
=σ(W
i
·
[h
t
‑1,x
t
]+b
i
)其中:W
i
是输入门的权重系数矩阵;b
i
是输入门的偏项;S22:利用激活函数计算当前时刻的记忆储存单元状态参数S22:利用激活函数计算当前时刻的记忆储存单元状态参数其中:W
c
是长期记忆储存单元的权重系数矩阵;激活函数的表达式为tanh(x)=(e
x

e

x
)/(e
x
+e

x
);b
c
是记忆储存单元的偏项;S23:假如定义符号表示不同状态的合成,长短期记忆LSTM神经网络结合记忆储存单元状态参数和上一时刻长期记忆状态参数c
t
‑1联立求解得到当前时刻的长期记忆状态参数c
t

S24:输出门控制多个c
t
输出长短期记忆LSTM神经网络的最终输出结果h
t
,即电能信息测量数据幅值特征分量:其中:o
t
=σ(W
o
·
[h
t
‑1,x
t
]+b
o
);W
o
是输出门的权重系数矩阵;b
o
是输入门的偏项;S25:通过不断将电能信息流历史数据输入长短期记忆LSTM神经网络,得到LSTM神经网络训练模型,依次循环,迭代获得预测值将电能信息实际测量h0和预测数据用计算残差e,直至所述残差e达到预设值,得到最终的幅值特征分量h
t
;其中4.根据权利要求1所述的一种基于密度空间聚类的信息流异常数据监测方法,其特征在于,步骤S3中利用斜率特征量计算电能信息数据相角特征分量,是利用两相邻采样时刻的相角测量值做差计算其变化率,即相角的角速度,以此作为电能信息数据相角特征分量ω(t
n
):其中:为电能信息交互设备在t
n
时刻采集的相角测量值,为电能信息交互设备在t
n
‑1时刻采集的相角测量值;t
n
、t
n
‑1为两相邻采样时刻。5.根据权利要求1所述的一种基于密度空间聚类的信息流异常数据监测方法,其特征在于,步骤S4包括以下子步骤:S41:从所述幅值特征分量、相角特征分量组成的数据集中随机选择一个数据作为对象点;S42:通过检查所述数据集中每个点的Eps邻域来搜索簇,如果对象点的Eps邻域包含的点多于MinPts,则该对象点记作核心点,且创建一个以该对象点为核心对象的簇;S43:如果所选数据对象是边界点,则继续选择另一个数据作为对象点;S44:重复步骤S41至S43,迭代地聚集从这些核心对象,直到遍历所有点,最终识别出电能信息测量值中的正常数据和异常数据,被聚在核心点簇的数据为正常数据,否则为异常数据;其中:E...

【专利技术属性】
技术研发人员:王韬刘丽娜申杰李方硕李锐超罗银康吴勇王姝
申请(专利权)人:国网四川省电力公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1