【技术实现步骤摘要】
一种基于强化学习的智能电网虚假数据注入攻击检测方法
本专利技术涉及智能电网领域,尤其涉及一种基于强化学习的智能电网虚假数据注入攻击检测方法。
技术介绍
智能电网是一种将信息传输通道与电力传输通道分离,从而使电网拥有更高效的电力资源配置、更强的抗干扰能力的新型电网技术,随着信息技术的深入发展,其的信息安全成为了一个重要的关注点。虚假数据注入攻击在智能电网信息攻击研究中占有重要地位,其核心思想是通过传统检测方法的漏洞,使用构造出的攻击向量来影响电网系统的状态估计,进而破坏电力系统的安全稳定运行。传统的虚假数据注入攻击检测方法为坏数据检测法。该方法仅能够检测直接虚假数据注入攻击,无法检测隐匿虚假数据注入攻击,同时由于其采用单阈值因此检测成功率一般。当前机器学习的检测方法可实现隐匿虚假数据注入攻击的检测,但需保证攻击向量远远大于噪声,缺少攻击向量比过程噪声略大的检测方法。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种基于强化学习的智能电网虚假数据注入攻击的检测方法,本专利技术使用Sarsa算法实现了虚假数据注入攻击的检测,提高了虚假数据注入攻击的检测准确率与检测速度。本专利技术的目的是通过以下技术方案来实现的:一种基于强化学习的虚假数据注入攻击检测方法,包括以下步骤:步骤一:建立电网的一般线性模型:xt=Axt-1+vt(1)yt=Hxt+wt(2)其中xt=[x1,t,…,xn,t,…,xN,t]为t时刻系统状态,xn,t表示为t时刻第n个节点上
【技术保护点】
1.一种基于强化学习的智能电网虚假数据注入攻击检测方法,其特征在于,所述方法包括以下步骤:/n步骤一:建立电网的一般线性模型,/n步骤二:虚拟攻击获得样本,/n步骤三:观察值获取,/n步骤四:使用ε贪婪策略得到t时刻检测器动作a
【技术特征摘要】
1.一种基于强化学习的智能电网虚假数据注入攻击检测方法,其特征在于,所述方法包括以下步骤:
步骤一:建立电网的一般线性模型,
步骤二:虚拟攻击获得样本,
步骤三:观察值获取,
步骤四:使用ε贪婪策略得到t时刻检测器动作at:
步骤五:使用Sarsa算法进行训练,
步骤六:重复步骤一到步骤五直到到达阶段最大检测时间T,或与中有as出现;
步骤七:重复步骤一到步骤六直到将总样本数E用尽,得到完整Qd表与Qs表;
步骤八:检测,判断系统是否受到直接虚假数据注入攻击。
2.根据权利要求1所述的基于强化学习的智能电网虚假数据注入攻击检测方法,其特征在于,
步骤一:建立电网的一般线性模型:
xt=Axt-1+vt(1)
yt=Hxt+wt(2)
其中xt=[x1,t,…,xn,t,…,xN,t]为t时刻系统状态,xn,t表示为t时刻第n个节点上的相角,N表示系统的总状态数;t时刻测量值表示为yt=[y1,t,…,ym,t,…,yM,t],ym,t表示为t时刻第m个测量仪表的检测值,M表示总测量仪表值;为状态转移矩阵,为由电网拓扑结构决定的雅克比矩阵,表示实数集;表示t时刻系统噪声,表示过程噪声的方差,其值由系统决定,IN表示N维单位矩阵;表示t时刻测量噪声,表示测量噪声的方差,其值测量设备决定,IM表示M维单位矩阵。
3.根据权利要求1所述的基于强化学习的智能电网虚假数据注入攻击检测方法,其特征在于,
步骤二:虚拟攻击获得样本:对于直接攻击可以使用式(3)获得受攻击的测量值,对于隐匿攻击可以使用式(4)获得受攻击的测量值,
式中at表示t时刻直接攻击的攻击向量,Hct表示隐匿攻击的攻击向量,由于H不会随着时间改变,因此使用ct表示隐匿攻击攻击向量,at与ct在样本训练中已知,在实际检测中未知,τ为系统受到攻击时间,表示阶跃函数,即当有t≥τ时
4.根据权利要求1所述的基于强化学习的智能电网虚假数据注入攻击检测方法,其特征在于,
步骤三:观察值获取:计算测量值yt与其估计值的残差模长,将其用作直接虚假数据注入攻击的检测,将当前检测值yt与上一时刻的检测值yt-1的残差模长作为隐匿虚假数据注入攻击的检测,使用阈值分割法对两个模值进行程度划分,分别得到直接虚假数据注入攻击即时观察值与隐匿虚假数据注入攻击即时观察值,使用滑窗法将两个即时观察值更新至观察值中,分别得到对应时间的直接虚假数据注入攻击观察值与隐匿虚假数据注入攻击观察值。
5.根据权利要求1所述的基于强化学习的智能电网虚假数据注入攻击检测方法,其特征在于,
步骤四:使用ε贪婪策略得到t时刻检测器动作at:将系统划分为两个状态,分别为sn系统未受到攻击与sa系统受到攻击,将检测器动作也分为两个状态as为算法认为系统受到攻击发出警报,ac表示算法认为系统未受到攻击不发出警报,在t时刻得到直接攻击检测观察值与隐匿攻击检测观察值使用贪婪策略基于直接虚假数据注入攻击检测的Q表Qn与隐匿虚假数据注入攻击检测的Q表Qs对检测器动作进行选择,ε贪婪策略即检测器以概率1-ε选择最优动作、以概率ε随机选择动作,ε每d步更新一次,更新公式如式(5)所示
...
【专利技术属性】
技术研发人员:吴争光,张阔,
申请(专利权)人:群智未来人工智能科技研究院无锡有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。