本发明专利技术涉及一种利用VI‑ADP算法的最优联合DoS攻击的调度方法,包括:基于Markov合作博弈得到攻击者最大程度降低分布式网络化控制系统性能的攻击策略;建立分布式网络化控制系统受到攻击过程中,攻击者的攻击策略与攻击目标达成的迭代关系;迭代关系中攻击者每步采用的攻击策略都与对应的目标函数对应,直到达成攻击目标;基于迭代关系建立VI‑ADP的调度算法模型对最优联合DoS攻击进行调度;调度算法模型中包括的评价网络以Markov合作博弈中当前时刻状态和攻击策略集合作为输入,对攻击策略进行评价;执行网络以Markov合作博弈中的下一时刻状态为输入得到逼近的攻击策略。本发明专利技术从攻击者角度出发分析分布式NCSs的安全性,并解决最优联合DoS攻击调度中高维合作博弈的计算难题。
【技术实现步骤摘要】
本专利技术属于dos攻击,具体涉及一种利用vi-adp算法的最优联合dos攻击的调度方法。
技术介绍
1、随着计算机和网络通信技术的不断发展,工业控制系统发生了巨大的变化,在此基础上,网络化控制系统(networked control systems,ncss)应运而生,并被广泛应用于医疗设备、车辆、飞行器、智能电网和智能交通等各个领域。网络化控制系统的主要特点是在控制系统中引入网络,以便通过网络连接传感器、控制器、执行器等主要功能部件。当数据包通过共享通信网络传输和交换时,ncss极易受到恶意攻击,威胁ncss的安全性。目前,主要从攻击和防御两个角度研究ncss安全性问题。研究攻击策略和方法,有助于防御者采取合适的防御手段对ncss进行有针对性的保护,是目前研究ncss安全性问题的一个重要方向。
2、拒绝服务攻击是一种比较常见的攻击类型。在实际情况中,dos攻击者的攻击能力和攻击能量是受到限制和约束的,所以可以将研究的问题转化为带有约束条件的优化问题。
技术实现思路
1、鉴于上述的分析,本专利技术旨在公开一种利用vi-adp算法的最优联合dos攻击的调度方法,从攻击者角度出发分析分布式的ncss的安全性,并解决最优联合dos攻击调度中高维合作博弈的计算难题。
2、本专利技术公开了一种利用vi-adp算法的最优联合dos攻击的调度方法,包括:
3、步骤s1、基于markov合作博弈得到攻击者最大程度降低分布式网络化控制系统性能的攻击策略;
4、步骤s2、建立分布式网络化控制系统在受到攻击过程中,攻击者的攻击策略与攻击目标达成的迭代关系;迭代关系中,攻击者每一步采用的攻击策略都与对应的目标函数对应,直到达成攻击目标;
5、步骤s3、基于迭代关系建立vi-adp的调度算法模型,对最优联合dos攻击进行调度;
6、所述调度算法模型中包括评价网络和执行网络;所述评价网络以markov合作博弈中当前时刻状态和攻击策略集合作为输入,对攻击策略进行评价;所述执行网络以markov合作博弈中的下一时刻状态为输入得到逼近的攻击策略。
7、进一步地,所述分布式网络化控制系统包括n个子系统;每个子系统均包括执行器、被控对象、传感器节点和控制器节点;
8、其中,传感器节点监测被控对象,包括传感器和卡尔曼滤波器;
9、所述传感器用于获得被控对象的观测数据,所述卡尔曼滤波器根据观测数据获得被控对象本地状态估计信息;通过无线网络向控制器节点发送包括本地的状态估计在内数据的数据包;
10、控制器节点包括估计器和控制器;
11、所述估计器收集发送的数据包解析后得到远程状态估计信息;
12、控制器根据远程状态估计信息,以最优控制为目标设计控制执行器的控制指令。
13、进一步地,所述步骤s1,包括:
14、步骤s101、攻击者根据所窃听到的系统共享信息对分布式网络化控制系统实施攻击并复现出其他攻击者的攻击序列;
15、步骤s102、以最大程度降低分布式网络化控制系统性能为目标,攻击者构建出使本身攻击策略最优的第一优化问题;
16、步骤s103、根据分布式网络化控制系统的最优反馈控制,利用分离定律,从第一优化问题中分解出与系统的误差协方差相关的变量部分,作为第二优化问题;
17、步骤s104、构建markov合作博弈模型解决第二优化问题,得到攻击者最大程度降低分布式网络化控制系统性能的攻击策略。
18、进一步地,步骤s104中,攻击策略的最优目标函数v*为:
19、
20、其中,攻击者的折扣因子向量β=[β1,β2,…,βn];表示第i个攻击者采用最优攻击策略ri*(k),除攻击者i之外采用最优攻击策略系统状态为s(k)时,攻击者获得的即时奖励;为最优攻击策略r*(k)下的状态转移概率;
21、对应的最优攻击策略为:
22、
23、其中,r(s(k),ri(k),r-i(k))为表示第i个攻击者采用攻击策略ri(k),除攻击者i之外采用攻击策略r-i(k),系统状态为s(k)时,攻击者获得的即时奖励;为攻击策略r(k)下的状态转移概率。
24、进一步地,所述步骤s2的迭代过程中,包括:
25、1)进行初始化;
26、攻击策略的目标函数的迭代初始值v(0)(·)=0;
27、迭代的初始攻击策略;
28、
29、其中,为给定k时刻状态s(k)后,第i个攻击者的初始迭代攻击策略;
30、2)一步迭代;
31、得到目标函数v(1)(s(k))为:
32、
33、其中表示当攻击策略为除攻击者i之外采用最优攻击策略系统状态为s(k)时,攻击者在k时刻获得的即时奖励;
34、3)执行迭代过程中的第l步得到对应的攻击策略和目标函数;
35、
36、
37、其中表示迭代指标,表示时间指标,其中分别表示非负整数和正整数。v(l)(s(k))是单调非减的并且是有界的,其中0≤v(l)(s(k))≤v(l+1)(s(k))≤λ;
38、当l→∞时,v(l)收敛于攻击策略的最优目标函数v*,收敛于最优攻击策略
39、进一步地,vi-adp的调度算法模型中,包括状态转移模型、执行网络模型、第一评价网络模型、第二评价网络模型;其中,
40、状态转移模型,用于根据输入的当前k时刻的系统状态s(k)和攻击策略r(k),进行状态转移预测,输出预测的下一时刻的系统状态s(k+1);
41、执行网络模型,用于根据k+1时刻的系统状态s(k+1),计算出依据当前时刻k攻击策略的即时评价函数进行调度得到的下一时刻的攻击策略
42、第一评价网络模型,用于根据输入的当前k时刻的系统状态s(k)和攻击策略r(k),计算当前k时刻第l+1次迭代产生的性能指标估计值v(l+1)(s(k)),对攻击策略进行评价,训练出评价网络权值;
43、第二评价网络模型,用于采用第l次迭代第一评价网络训练好的评价网络权值,根据输入的执行网络模型预测的下一时刻的系统状态s(k+1)和执行网络模型调度的下一时刻的攻击策略计算出k+1时刻的性能评价指标值v(l)(s(k+1)),对调度的攻击策略进行评价;
44、通过vi-adp的迭代调度,使执行网络模型计算出的攻击策略对应的性能指标估计值逼近目标最优值。
45、进一步地,第一评价网络模型和第二评价网络模型均采用三层bpnns;
46、第一评价网络模型第l次迭代的输出为
47、输入z(k)=[s(k),r(k)];分别是隐含层和输出层以及输入层和隐含层之间的加权矩阵;
48、迭代到l+1时的目标函数为:
49本文档来自技高网
...
【技术保护点】
1.一种利用VI-ADP算法的最优联合DoS攻击的调度方法,其特征在于,包括:
2.根据权利要求1所述的基于Markov合作博弈的最优DoS攻击方法,其特征在于,
3.根据权利要求2所述的利用VI-ADP算法的最优联合DoS攻击的调度方法,其特征在于,
4.根据权利要求3所述的利用VI-ADP算法的最优联合DoS攻击的调度方法,其特征在于,
5.根据权利要求4所述的利用VI-ADP算法的最优联合DoS攻击的调度方法,其特征在于,
6.根据权利要求5所述的利用VI-ADP算法的最优联合DoS攻击的调度方法,其特征在于,
7.根据权利要求6所述的利用VI-ADP算法的最优联合DoS攻击的调度方法,其特征在于,
8.根据权利要求7所述的利用VI-ADP算法的最优联合DoS攻击的调度方法,其特征在于,
9.根据权利要求6所述的利用VI-ADP算法的最优联合DoS攻击的调度方法,其特征在于,
10.根据权利要求9所述的利用VI-ADP算法的最优联合DoS攻击的调度方法,其特征在于,</p>...
【技术特征摘要】
1.一种利用vi-adp算法的最优联合dos攻击的调度方法,其特征在于,包括:
2.根据权利要求1所述的基于markov合作博弈的最优dos攻击方法,其特征在于,
3.根据权利要求2所述的利用vi-adp算法的最优联合dos攻击的调度方法,其特征在于,
4.根据权利要求3所述的利用vi-adp算法的最优联合dos攻击的调度方法,其特征在于,
5.根据权利要求4所述的利用vi-adp算法的最优联合dos攻击的调度方法,其特征在于,
6...
【专利技术属性】
技术研发人员:刘蕊蕊,郑春一,杨斌,张毅斌,
申请(专利权)人:北京京航计算通讯研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。