当前位置: 首页 > 专利查询>广州大学专利>正文

多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法及装置制造方法及图纸

技术编号:41135497 阅读:32 留言:0更新日期:2024-04-30 18:06
本发明专利技术公开了一种多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法及装置,方法包括:利用流量判别模块采集外部流量数据获取实时的访问流量,筛选访问流量中的恶意流量;利用攻击预测模块提取恶意流量的攻击特征并进行分类;形成蜜罐防御智能体的观测状态,在改进的PPO‑P模型中预测防御响应策略;基于防御响应策略选择做出反应的蜜罐以及蜜罐需要做出的相应的响应动作类型;利用奖励函数对蜜罐进行奖惩处理,将奖励值不断反馈改进的PPO‑P模型;经过迭代预测后,获取最佳的防御响应策略。本发明专利技术在提高攻防交互性的基础上,对攻击者进行诱捕分析和溯源反制,能够达到更高效的欺骗防御效果。

【技术实现步骤摘要】

本专利技术属于网络安全的,具体涉及一种多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法及装置


技术介绍

1、近年来,随着网络连接的迅速扩大和安全事件的频繁发生,特别是互联网的大规模开放和金融网络的接入,网络安全问题日益突出,越来越多的企业系统受到来自入侵者的攻击威胁。随着计算机技术的高速发展,网络安全威胁越来越多,新型网络攻击技术也越来越多样化,这就要求我们不断完善现有的安全防御体系,以及加速推进新型智能网络安全防护体系的研究。

2、针对网络安全领域,不管是从研究角度还是应用角度,(深度)强化学习正在逐渐大放异彩,如2018年由日本公司mbsd研发出的一款安全漏洞检测工具deepexploit,其中利用了强化学习决策模型参与训练,提高了整体的渗透效率,达到了极高的检测率;2021年微软开源的人工智能攻防对抗模拟工具cyberbattlesim,利用强化学习的方法实现自动化内网渗透,用于研究在模拟抽象企业网络环境中自动化智能体的交互过程,为自动化网络攻防领域的研究人员提供了巨大的帮助。

3、但是整体来看,目前强化学习在自动化攻击领域本文档来自技高网...

【技术保护点】

1.多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法,其特征在于,包括下述步骤:

2.根据权利要求1所述多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法,其特征在于,所述蜜罐防御智能体包括预警型蜜罐、诱捕型蜜罐和反制型蜜罐,每种蜜罐均具有动作集合,包括{主动作,附加动作},其中主动作用于根据攻击者意图对攻击动作进行响应,从而诱导牵引攻击者以提高攻防交互性;附加动作随着蜜罐的种类发生变更,用于在与攻击者建立交互联系后的信息收集、研判及溯源;

3.根据权利要求2所述多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法,其特征在于,所述预警型蜜罐,用于通信告警,在受到攻击时...

【技术特征摘要】

1.多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法,其特征在于,包括下述步骤:

2.根据权利要求1所述多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法,其特征在于,所述蜜罐防御智能体包括预警型蜜罐、诱捕型蜜罐和反制型蜜罐,每种蜜罐均具有动作集合,包括{主动作,附加动作},其中主动作用于根据攻击者意图对攻击动作进行响应,从而诱导牵引攻击者以提高攻防交互性;附加动作随着蜜罐的种类发生变更,用于在与攻击者建立交互联系后的信息收集、研判及溯源;

3.根据权利要求2所述多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法,其特征在于,所述预警型蜜罐,用于通信告警,在受到攻击时第一时间向邻居节点通信告警攻击者相关信息;

4.根据权利要求1所述多蜜罐场景下基于强化学习高攻防交互的欺骗防御方法,其特征在于,所述策略网络包括新actor网络和旧actor网络,新actor网络在训练时连续更新策略参数,旧actor网络在新actor网络更新一定次数后,由新actor网络的策略参数赋值;策略网络根据损失函数和值函数提供的梯度,进行梯度更新,直至收敛;<...

【专利技术属性】
技术研发人员:王乐邓建宇谭灏南朱俊义徐颖慧詹如风
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1