一种智能电网中基于预测的虚假数据检测方法技术

技术编号:17486412 阅读:72 留言:0更新日期:2018-03-17 10:40
本发明专利技术公开了一种智能电网中基于预测的虚假数据检测方法。首先检测时间样本k+1处是否有虚假数据,将k+1时间点之前SCADA系统收集的历史数据进行预处理,包括识别并清除异常数据和补足空缺数据;接着根据处理过的观测量得出相应的状态量,并依据状态量的时空相关性,建立一阶向量自回归模型,估计模型的系数矩阵,得到k+1时间点的状态量预测值;最后使用状态量预测值得到观测量预测值并将观测量预测值与观察值做归一化残差,与阀值进行比较,达到检测虚假数据的目的。本发明专利技术利用了预测值进行检测,k+1时间点的预测值由k+1时间点之前的数据获得,与k+1时间点的观察值无关,所以在k+1时间点注入攻击,会导致残差值变大超过阀值,能有效检测相关度高的虚假数据。

A prediction based false data detection method in Smart Grid

【技术实现步骤摘要】
一种智能电网中基于预测的虚假数据检测方法
本专利技术涉及一种智能电网中基于预测的虚假数据检测方法,属于电力系统安全领域。
技术介绍
电力是文明的命脉,智能电网的最新进展可以显着提高电网的效率和可靠性。电力系统是一个复杂的系统,通过大型地理区域的输电和配电网络将发电机连接到消费者身上。然而,电网的安全可靠性并不总能得到保证,故障不管对电力生产者还是消费者来说都有着重大影响,会导致巨大的经济损失。系统监控对于确保电网的可靠运行是必要的,通过分析仪表测量和电力系统模型来最佳地估计电网状态,从而监控系统。然而获取的仪表测量也并不总是正确的,仪表损坏、恶意攻击等都可能引入污染值,目前已经开发了各种技术来检测和识别虚假数据,包括任意的非随机原因引入的虚假数据。在虚假数据的检测中,需要关注的重点是恶意注入的数据的检测。由于恶意注入的数据相关度高,所以不能被现有的检测系统识别。本专利技术利用了预测值,能很好的解决这个问题。
技术实现思路
本专利技术提供了一种智能电网中基于预测的虚假数据检测方法,该方法包括三个部分,首先是数据预处理,将SCADA(SupervisoryControlAndDataAcquisition)系统通过传感器直接收集的历史数据进行预处理,包括识别并清除异常数据和补足空缺数据;然后是数据预测,根据处理过的观测量得出相应的状态量,并依据状态量的时空相关性,建立一阶向量自回归模型,从而预测未来时刻的数据值;最后是数据检测,将得到的观测量预测值与观测量观察值做归一化残差,与阀值进行比较。本方案利用了预测值进行检测,由于时间样本k+1处的预测值没有用到该时间点的观察值,故在时间k+1处注入攻击会导致残差变大,攻击被系统检测到。为实现上述目的,本专利技术采用的技术方案包含以下步骤:步骤1:对SCADA系统收集的历史数据进行预处理,首先用与均值比较的方式识别异常数据,将异常数据看作空缺数据处理,然后使用线性插补法填充空缺数据;步骤2:使用加权最小二乘估计法通过预处理的测量数据求出状态量数据,根据多变量时间序列和短期预测的特性建立状态量的一阶向量自回归模型,求模型的系数矩阵,从而得到状态序列预测值;步骤3:利用状态量预测值计算观测量预测值并与观测量观察值做归一化残差,与阀值进行比较,从而进行虚假数据的检测。进一步,上述步骤1对数据的预处理的具体流程如下:步骤1-1:异常数据的处理:预测k+1时间点的值需要Zk-M+1,Zk-M+2,…,Zk共计M个历史时间样本,该M个序列的值是SCADA系统收集到的测量值,记{Z}=[Zk-M+1,Zk-M+2,…,Zk],Zi是多变量时间序列,i=k-M+1,k-M+2,…,k,是序列Zi的第j个变量,代表第i个时间样本第j个传感器的数据,j=1,2,…,m,m为传感器总数,令得到的Z0为序列均值,如果或者其中为均值Z0的第j项,则认为是异常数据,清除并视为空缺数据进行处理;步骤1-2:空缺数据的处理分为:首端和末端空缺数据的补全、中间单个空缺数据的补全和中间多个空缺数据的补全:步骤1-2-1:对于首端和末端空缺数据的补全,即时间序列{Z}=[Φk-M+1,Zk-M+2,…,Zk-1,Φk],这里Φk-M+1和Φk为空缺数据,Φk-M+1可按右邻的级比生成,Φk可按左邻的级比生成,级比相邻时间点的级比可以认为是相同的,所以首端数据末端数据步骤1-2-2:对于中间单个空缺数据的补全,即时间序列{Z}=[Zk-M+1,Zk-M+2,…,Zp-1,Φp,Zp+1,…,Zk],其中Φp为空缺数据,该时间序列被认为是近似平稳的,采用线性插补法进行填充,则步骤1-2-3:对于中间多个空缺数据的补全,即时间序列其中为空缺数据,若d为奇数,则所有空缺数据的中间值之前的空缺数据为之后的空缺数据为其中l=1,3,5…;若d为偶数,则空缺数据的中间值之前的数据为之后的数据为其中l为1开始的奇数。进一步,上述步骤2的具体过程如下:步骤2-1:电力网络的直流模型可以表示为Z=Hx+v,其中Z是测量向量,具体就是节点和支路中的有功功率;H是电网固有的拓扑结构,是m*n维矩阵,n是状态变量总数;x是状态向量,表示的是节点的电压相位角;v是均值为0、协方差矩阵为R的高斯测量噪声向量,对于每一个历史序列Zi,采用加权最小二乘估计法估计状态向量,最小化误差的加权平方和,得出状态估计值的近似解为R-1×Zi,从而将测量值序列[Zk-M+1,Zk-M+2,…,Zk]转化为状态值序列步骤2-2:根据多变量时间序列的特性建立状态量的向量自回归模型并考虑一步预测,则是k+1时间点的预测序列,Ak为系数矩阵,εk+1是模型误差,系数矩阵Ak的值由这M个序列估计,在长度为M的窗内,系数矩阵固定,即令则Xk,k-M+2=AkXk-1,k-M+1+e,利用最小二乘法,最小化模型误差平方和,得出进一步,上述步骤3具体包括以下步骤:求测量预测值令测量残差s=1,2,…,m,rk+1的协方差矩阵其中是的预测误差协方差矩阵,是模型的误差协方差矩阵,是k时间点的估计误差协方差矩阵,归一化测量残差rN(s)=|rk+1(s)|/σN(s),其中如果rN(s)大于阀值γ,则认为存在虚假数据,把虚假数据用相应的预测值替代;如果rN(s)小于阀值γ,则认为无虚假数据。与现有技术相比,本专利技术具有以下有益效果:1.本专利技术对传感网络中直接收集的历史数据进行了预处理,提高了历史数据的质量;建立向量自回归模型,很好的考虑了状态时间序列的时空相关性,使得之后的预测值更精确。2.对于精心设计的恶意攻击,由于其数据相关度很高,所以现用的虚假数据检测系统不能很好的进行检测。本专利技术使用预测值检测虚假数据,由于预测值是通过历史数据得出的,与k+1时间点的观察值无关,所以能有效的检测相关度高的虚假数据。附图说明图1为本专利技术的方案实施流程图。图2为本专利技术的实施场景示意图。图3为本专利技术的整体流程图。具体实施方式以下结合说明书附图对本专利技术做进一步的详细说明。本专利技术首先检测时间样本k+1处是否有虚假数据,将k+1时间点之前SCADA系统收集的历史数据进行预处理,包括识别并清除异常数据和补足空缺数据;接着根据处理过的观测量得出相应的状态量,并依据状态量的时空相关性,建立一阶向量自回归模型,估计模型的系数矩阵,得到k+1时间点的状态量预测值;最后使用状态量预测值得到观测量预测值并将观测量预测值与观察值做归一化残差,与阀值进行比较,达到检测虚假数据的目的,本专利技术的整体流程图如图3所示。如图1所示,在数据预处理结束之后,需要利用处理完的历史数据进行k+1时间点数据的预测,得到预测值之后利用预测值与k+1时间点观察值无关的特性进行虚假数据的检测。图2为实施场景的示意图,电力系统采集的数据由传感器网络获得,会存在缺失,所以首先要进行数据的预处理。基于预测的虚假数据检测方法的运作流程如下:步骤1:对SCADA系统收集的历史数据进行预处理,首先用与均值比较的方式识别异常数据,将异常数据看作空缺数据处理,然后使用线性插补法填充空缺数据。步骤1-1:异常数据的处理:预测k+1时间点的值需要Zk-M+1,Zk-M+2,…,Zk这M个历史时间样本,这M个序列的值是SCADA系统收集到的测量值。记{Z}=[本文档来自技高网...
一种智能电网中基于预测的虚假数据检测方法

【技术保护点】
一种智能电网中基于预测的虚假数据检测方法,其特征在于,所述方法包括如下步骤:步骤1:对SCADA系统收集的历史数据进行预处理,首先用与均值比较的方式识别异常数据,将异常数据看作空缺数据处理,然后使用线性插补法填充空缺数据;步骤2:使用加权最小二乘估计法通过预处理的测量数据求出状态量数据,根据多变量时间序列和短期预测的特性建立状态量的一阶向量自回归模型,求模型的系数矩阵,从而得到状态序列预测值;步骤3:利用状态量预测值计算观测量预测值并与观测量观察值做归一化残差,与阀值进行比较,从而进行虚假数据的检测。

【技术特征摘要】
1.一种智能电网中基于预测的虚假数据检测方法,其特征在于,所述方法包括如下步骤:步骤1:对SCADA系统收集的历史数据进行预处理,首先用与均值比较的方式识别异常数据,将异常数据看作空缺数据处理,然后使用线性插补法填充空缺数据;步骤2:使用加权最小二乘估计法通过预处理的测量数据求出状态量数据,根据多变量时间序列和短期预测的特性建立状态量的一阶向量自回归模型,求模型的系数矩阵,从而得到状态序列预测值;步骤3:利用状态量预测值计算观测量预测值并与观测量观察值做归一化残差,与阀值进行比较,从而进行虚假数据的检测。2.根据权利要求1所述的一种智能电网中基于预测的虚假数据检测方法,其特征在于,所述步骤1对数据的预处理的具体流程如下:步骤1-1:异常数据的处理:预测k+1时间点的值需要Zk-M+1,Zk-M+2,…,Zk共计M个历史时间样本,该M个序列的值是SCADA系统收集到的测量值,记{Z}=[Zk-M+1,Zk-M+2,…,Zk],Zi是多变量时间序列,i=k-M+1,k-M+2,…,k,是序列Zi的第j个变量,代表第i个时间样本第j个传感器的数据,j=1,2,…,m,m为传感器总数,令得到的Z0为序列均值,如果或者其中为均值Z0的第j项,则认为是异常数据,清除并视为空缺数据进行处理;步骤1-2:空缺数据的处理分为:首端和末端空缺数据的补全、中间单个空缺数据的补全和中间多个空缺数据的补全:步骤1-2-1:对于首端和末端空缺数据的补全,即时间序列{Z}=[Φk-M+1,Zk-M+2,…,Zk-1,Φk],这里Φk-M+1和Φk为空缺数据,Φk-M+1可按右邻的级比生成,Φk可按左邻的级比生成,级比相邻时间点的级比可以认为是相同的,所以首端数据末端数据步骤1-2-2:对于中间单个空缺数据的补全,即时间序列{Z}=[Zk-M+1,Zk-M+2,…,Zp-1,Φp,Zp+1,…,...

【专利技术属性】
技术研发人员:王玉峰施婉娇
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1