一种融合动态资源池调度与响应的方法及系统技术方案

技术编号:36168425 阅读:19 留言:0更新日期:2022-12-31 20:18
本发明专利技术提供了一种融合动态资源池调度与响应的方法及系统,该方法包括以下步骤:S1:根据实体防御资源特性,对实体防御资源进行轻量化处理,并添加到资源池中;S2:根据应用场景,对网络中的设备状态进行定义,并基于攻防策略生成模型建立攻防双方策略空间以及收益空间,并通过纳什均衡生成最优的防御资源调度策略;S3:利用增强学习算法,并根据经过网络威胁后网络中设备的状态,对最优防御策略进行迭代优化。本发明专利技术所提供的一种融合动态资源池调度与响应的方法及系统,构建动态安全资源池可以实现安全防御资源轻量化的灵活编排,为实现防御策略的自适应生成奠定基础。同时可以实现对网络威胁的协同防御,进而最大化提升安全防御资源的组合功效。源的组合功效。源的组合功效。

【技术实现步骤摘要】
一种融合动态资源池调度与响应的方法及系统


[0001]本专利技术涉及定义与构建、防御资源的调度编排,属于网络空间安全
,具体涉及一种融合动态资源池调度与响应的方法及系统。

技术介绍

[0002]网络技术的飞速发展使得物联网日渐接近我们的生活。针对当前网络中存在复杂繁多的网络威胁,同时智能装备集群也对多种安全防御资源动态联合抵御威胁提出了需求。由于当前安全设备硬件繁多、位置固化,无法支持安全防御功能动态部署和弹性扩展。针对物联网中存在的复杂多变的威胁,目前一般将物联网中的设备设为攻击者与防御者之间相互争夺的网络资源。进而,对攻防博弈中的网络资源竞争情况进行建模和分析。通过采用博弈论的相关思想解决了参与者的优化问题。博弈论的相关特征与网络空间中的攻防双方目标对抗、战略依赖以及不合作的特征十分相符。通过用博弈论对模拟防御中的博弈过程进行描述,可以解决最优防御策略的选择问题。通过将网络中的不同事件建模为不同的状态,并采用微分方程对网络中不同状态的演变进行描述。通过采用类高斯

赛德尔隐式有限差分方法,实现对连续时间微分方程的离散化,通过迭代获得其中的鞍点策略,实现了网络状态的数值化展示,并得到最优策略选择。
[0003]然而现有的对物联网攻击防御策略的微分对策方法分析主要面临以下三个问题:1、当前许多防御策略的研究都直接针对虚拟资源进行编排,但在实际应用场景中,由于防御设备存在不同的设计方案,导致接入节点的安全设备硬件繁多、资源实体位置固化,无法支持安全防御功能的动态部署和弹性扩展,同时也对防御策略的部署产生了影响。2、当前研究将网络状态进行了粗略的划分后,直接针对状态间的相互关系进行最优策略的求解,没有对实际场景进行全面的考虑。3、网络中的攻防双方的状态不断变化,且可能出现未知的攻击,防御策略需要实时进行调整优化,现有策略生成采用博弈论的方法,缺乏优化和自适应的过程。

技术实现思路

[0004]本专利研究针对融合动态资源池调度与响应方法,将实体的防御资源设备进行容器虚拟化,解决实体资源存在的局限性。同时构建动态资源防御池,根据不同的应用场景,对网络中的设备状态进行定义,结合博弈论的思想,构建微分方程将网络状态进行数值化。在完成初始化的基础上,我们利用纳什均衡对博弈论方程进行求解。同时,针对网络环境以及攻防状态不断变化的情况,选择采用强化学习中的Q

Learning算法探索安全防御策略自适应匹配策略,进而达到安全防御资源的最优化处理,进而实现防御收益最大化的目标。
[0005]本专利技术主要包括:融合动态资源池构建及相应防御策略调度优化模块,具体模块包括安全防御资源池的动态构建模块,防御资源调度策略生成模块和防御策略的自适应匹配优化模块。首先提出安全防御资源池的动态构建方法,包括实体资源的虚拟化,对相应软件的容器化封装。在安全防御资源池动态构建完成的基础上,构建攻防环境空间,采用博弈
论思想,通过求解使防御资源的收益最大化,达到在利用有限资源的条件下的效果最优化,同时,利用Q

learning方法在已有策略的基础上,实现防御策略的自适应生成。具体步骤如下:建立安全防御资源池,根据不同防御资源的所具有的特性,进行个性化的资源虚拟化操作,将对应的防御资源添加到资源池中,用于后续策略的生成。
[0006]建立基于博弈论的防御策略生成方法,根据实际的应用场景,构建对应的设备状态,同时建立攻防双方策略空间以及收益空间,通过利用纳什均衡的解的求解方法,得到针对当前情况下的最优防御策略布置情况。
[0007]建立防御资源自适应模块,由于攻防环境具有不断变化的特点,因此在前述研究的基础上,我们利用增强学习Q

Learning算法探索出一套安全防御策略自适应匹配策略,以达到安全防御资源效用最大化。最优安全防御收益的目标通过迭代Q值作为反馈模型来实现策略选择的自适应性,通常策略的选择会按照Q值最大的方向进行,选择过程经过连续的“安全策略

防御状态

安全策略”的迭代方式进行Q表的更新,以达到Q值最大化,实现算法收敛。
[0008]本专利技术具体的技术方案如下:第一方面,本专利技术提供了一种融合动态资源池调度与响应的方法,包括以下步骤:S1:根据实体防御资源特性,对实体防御资源进行轻量化处理,并添加到资源池中;S2:根据应用场景,对网络中的设备状态进行定义,并基于攻防策略生成模型建立攻防双方策略空间以及收益空间,并通过纳什均衡生成最优的防御资源调度策略;S3:利用增强学习算法,并根据经过网络威胁后网络中设备的状态,对最优防御策略进行迭代优化。
[0009]在一些实施例中,所述S1还包括:S11:获取实体防御资源特性;S12:对实体防御资源类别进行判断,若为软件程序,则进行容器化处理;若为非软件程序,则通过虚拟机对物力资源虚拟化;S13:将通过轻量化处理的实体防御资源添加到资源池中。
[0010]在一些实施例中,所述S2包括:S21:根据应用场景,对网络中的设备状态进行定义,包括防御状态、攻击状态、正常状态、正在遭受攻击以及瘫痪状态;S22:根据设备状态之间的转化关系,建立攻防策略生成模型,并定义为;其中代表攻击者,代表防御者,代表选取不同强度的攻击策略,代表第N种攻击策略,代表选取不同强度的防御策略,代表第N种防御策略,代表选择不同强度攻击策略的概率,代表选择第N种攻击策略的概率,代表选择不同防御策略的概率,代表选择第N种防御策略的概率,代表攻击方的收益函数,代表防御方的收
益函数,代表第i种攻击策略,代表第j种防御策略;S23:根据纳什均衡,并根据防策略生成模型,最小化系统损失为目标,计算最优防御策略。
[0011]在一些实施例中,所述S3包括:S31:设定多个防御策略,统计经过网络威胁后各个安全防御策略的防御状态,并根据防御状态是否满足防御需求,构建初始防御状态矩阵;S32:设定动作集,对防御不足的策略将进行防御资源的补充或替换,对防御过剩的资源进行防御资源缩减;S33:设定奖励函数,在动作执行后,在初始防御状态矩阵中增加奖励值,直到初始防御状态矩阵达到最大值。
[0012]第二方面,本专利技术提供了一种融合动态资源池调度与响应的系统,包括:动态资源池构建模块,用于根据实体防御资源特性,对实体防御资源进行轻量化处理,并添加到资源池中;防御策略生成模块,用于根据应用场景,对网络中的设备状态进行定义,并基于攻防策略生成模型建立攻防双方策略空间以及收益空间,并通过纳什均衡生成最优的防御资源调度策略;防御资源自适应模块,用于利用增强学习算法,并根据经过网络威胁后网络中设备的状态,对最优防御策略进行迭代优化。
[0013]在一些实施例中,所述动态资源池构建模块包括:防御资源特性获取子模块,用于获取实体防御资源特性;防御资源轻量化子模块,用于对实体防御资源类别进行判断,若为软件程序,则进行容器化处理;若为非软件程序,则通过虚拟机对物力资源虚拟化;防御资源添加子模块,用于将通过本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合动态资源池调度与响应的方法,其特征在于,包括以下步骤:S1:根据实体防御资源特性,对实体防御资源进行轻量化处理,并添加到资源池中;S2:根据应用场景,对网络中的设备状态进行定义,并基于攻防策略生成模型建立攻防双方策略空间以及收益空间,并通过纳什均衡生成最优的防御资源调度策略;S3:利用增强学习算法,并根据经过网络威胁后网络中设备的状态,对最优防御策略进行迭代优化。2.根据权利要求1所述的一种融合动态资源池调度与响应的方法,其特征在于,所述S1还包括:S11:获取实体防御资源特性;S12:对实体防御资源类别进行判断,若为软件程序,则进行容器化处理;若为非软件程序,则通过虚拟机对物力资源虚拟化;S13:将通过轻量化处理的实体防御资源添加到资源池中。3.根据权利要求2所述的一种融合动态资源池调度与响应的方法,其特征在于,所述S2包括:S21:根据应用场景,对网络中的设备状态进行定义,包括防御状态、攻击状态、正常状态、正在遭受攻击以及瘫痪状态;S22:根据设备状态之间的转化关系,建立攻防策略生成模型,并定义为;其中代表攻击者,代表防御者,代表选取不同强度的攻击策略,代表第N种攻击策略,代表选取不同强度的防御策略,代表第N种防御策略,代表选择不同强度攻击策略的概率,代表选择第N种攻击策略的概率,代表选择不同防御策略的概率,代表选择第N种防御策略的概率,代表攻击方的收益函数,代表防御方的收益函数,代表第i种攻击策略,代表第j种防御策略;S23:根据纳什均衡,并根据防策略生成模型,最小化系统损失为目标,计算最优防御策略。4.根据权利要求3所述的一种融合动态资源池调度与响应的方法,其特征在于,所述S3包括:S31:设定多个防御策略,统计经过网络威胁后各个安全防御策略的防御状态,并根据防御状态是否满足防御需求,构建初始防御状态矩阵;S32:设定动作集,对防御不足的策略将进行防御资源的补充或替换,对防御过剩的资源进行防御资源缩减;S33:设定奖励函数,在动作执行后,在初始防御状态矩阵中增加奖励值,直到初始防御状态矩阵达到最大值。5.一种融合动态资源池调度与响应的系统,其特征在于,包括:动态资源池构建模块,用于根据实体防御资源特性,对实体防御资源进行轻量化处理,
并添加到资源池中;防御策略生成模块,用于根据应用场景,对网络中的设备状态进行定义,并基于攻防策略生成模型建立攻防双方策略空间以及收益空间,并通过纳什均衡生成最优的防御资源...

【专利技术属性】
技术研发人员:陈玉强秦峰吴昊陆月明韩道岐高佳琪王成月樊明睿王秦君王大明徐文杰陆文强王占峰
申请(专利权)人:北京国信蓝盾科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1