【技术实现步骤摘要】
人类攻击者合作行为建模及制定对应防守策略的方法
本专利技术涉及一种安全防护中的人类攻击者合作行为建模及制定对应防守策略的方法,属于安全防护
技术介绍
Stackelberg安全博弈(SSG)在实际生活中的多种安全保护场景中得到应用,如美国海岸防卫,联邦空警,洛杉矶机场等。当下在防守资源有限的情况下对需要保护的目标采取的最普遍的防御方法是巡逻。巡逻者只有有限的防守资源(如人力资源等),所以他们不能在同一时间看守一片很大的地区的每个角落。此外,攻击者可以观察巡逻者的巡逻规律,并设计相应的攻击行动来避免被抓。因此,为防御机构优化防守策略有重要意义。在传统的单轮SSG中,防守者(领头者)首先安排巡逻策略,接着攻击者(跟随者)根据其对防守策略的观察来选择一个目标攻击。传统单轮SSG的主要问题在于没有考虑人类攻击者的不完全合理性,且没有充分利用过往的攻击数据优化防守策略。
技术实现思路
专利技术目的:针对现有技术中存在的问题与不足,本专利技术提供一种安全防护中的人类攻击者合作行为建模及制定对应防守策略的方法,首先,提出了一个自适应的人类行为模型,用来优化具有两个可能合作的攻击者的重复SSG中有限防守资源的分配;其次,设计了一个高效的算法来近似解决了由模型得到的非线性非凸优化问题,最终输出防守策略;最后,进行了真人模拟实验来测试本专利技术模型和方法的有效性。技术方案:一种安全防护中的人类攻击者合作行为建模及制定对应防守策略的方法,包括如下内容:(1)重复SSG中的合作机制重复合作博弈有一个防守者和两个攻击者,这两个攻击者可以选择是否合作;防守者作为博弈中的领导者, ...
【技术保护点】
一种安全防护中的人类攻击者合作行为建模及制定对应防守策略的方法,其特征在于,包括如下内容:(1)重复SSG中的合作机制博弈由多轮组成,攻击者们在博弈中需要作出两个选择:1)选择攻击的目标和2)选择是否与另一个攻击者合作。只有当两个攻击者在某次攻击中都选择合作时,一次合作关系才算建立;在合作攻击的情况下,攻击者每次攻击的收益将是两人收益和的一半;同时引入了一个额外收益∈,即当一个攻击者成功地进行了一次合作攻击时,他将得到额外收益∈;(2)不完全合理性和自适应性在重复SSG中针对人类的不完全合理性提出了一个模型;首先定义攻击者对于某个目标的倾向性。定义1:一个攻击者在第R轮中对目标i的倾向性
【技术特征摘要】
1.一种安全防护中的人类攻击者合作行为建模及制定对应防守策略的方法,其特征在于,包括如下内容:(1)重复SSG中的合作机制博弈由多轮组成,攻击者们在博弈中需要作出两个选择:1)选择攻击的目标和2)选择是否与另一个攻击者合作。只有当两个攻击者在某次攻击中都选择合作时,一次合作关系才算建立;在合作攻击的情况下,攻击者每次攻击的收益将是两人收益和的一半;同时引入了一个额外收益∈,即当一个攻击者成功地进行了一次合作攻击时,他将得到额外收益∈;(2)不完全合理性和自适应性在重复SSG中针对人类的不完全合理性提出了一个模型;首先定义攻击者对于某个目标的倾向性。定义1:一个攻击者在第R轮中对目标i的倾向性由以下等式定义:其中是和之差,表示攻击者第r轮在目标i处进行的单次攻击的平均收益,表示攻击者在第r轮进行的所有攻击的单次攻击平均收益,Qr为一个向量,其第i维为C为一个常数,Var(Qr)表示{Qr}的方差;当攻击者倾向于攻击目标i时将为正,反之将为负,攻击者在未被揭示目标的倾向性设为0。自适应主观收益函数:设置d=1/(Nr-r),其中向量ω=(ω1,ω2,ω3)为待学习参数,Nr为总轮数,r代表用来学习ω的轮次;(3)优化问题的给出结合人类行为模型以及从攻击数据中学习得到的参数,建立生成最优防守策略的优化问题;(4)计算最优策略将优化问题分解为4个子问题。通过解决子问题,并在子问题的最优解中选择全局最优解,就能解出原问题,得到防守向量x。2.如权要求1所述的一种安全防护中的人类攻击者合作行为建模及制定对应防守策略的方法,其特征在于,重复合作博弈有一个防守者和两个攻击者,这两个攻击者可以选择是否合作;防守者作为博弈中的领导者,定期布置新的防守策略,而攻击者作为跟随者,根据其对防守者布置的防守策略的观察做出攻击;这个博弈由多轮组成,所以防守者可以定期根据之前轮次中收集到的数据来修改防守策略;攻击者独立攻击或者合作攻击;在独立攻击的情况下,攻击者每次攻击的收益仅取决于该攻击者本次攻击是否成功。3.如权要求1所述的一种安全防护中的人类攻击者合作行为建模及制定对应防守策略的方法,其特征在于,通过防守者拥有的防守资源总和M来防御一个目标集合T={1,…,|T|},T由T1和T2两个不重叠子集合组成;T1表示第一个攻击者可能攻击的目标集合,T2表示第二个攻击者可能攻击的目标集合,且T1=T-T2;防守向量x,其每一维元素xi代表了防守者在每一个目标投入的防守资源,也即目标i被防守的概率。4.如权要求1所述的一种安全防护中的人类攻击者合作行为建模及制定对应防守策略的方法,其特征在于,一个攻击者在攻击目标i时的收益取决于1)这个目标是否被防守以及2)两个攻击者是否合作;当一个攻击者选择独立攻击时,他攻击未被防守的目标i的收益为攻击被防守的目标i的收益为相对地,防守者在前一种情况的收益为在后一种情况的收益为防守者的总收益为其在两个被攻击目标的收益和;以及如果两个攻击者都同意合作,他们在攻击未被防守的目标时将获得额外收益∈。5.如权要求1所述的一种安全防护中的人类攻击者合作行为建模及制定对应防守策略的方法,其特征在于,结合人类行为模型以及从攻击数据中学习得到的参数,通过等式1到等式19建立生成最优防守策略的优化问题。D=d1+d2(2)α1,α2,β∈{0,1}(3)
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。