一种基于主动探测的恶意流量防护方法及系统技术方案

技术编号:37394761 阅读:21 留言:0更新日期:2023-04-27 07:32
本发明专利技术涉及一种基于主动探测的恶意流量防护方法及系统,其方法包括:S1:攻击者输入原始流量样本到恶意流量防护模型,在黑盒攻击场景下攻击恶意流量防护模型,输出原始流量样本的标签;S2:构建替代模型,包括:生成器G和鉴别器D;提取原始流量样本的时间序列和长度序列构建具有时空特征流量样本,输入鉴别器D,输出原始流量样本的类别:恶意或良性;S3:对替代模型进行训练,使得生成器G生成对抗样本,鉴别器D识别对抗样本是恶意还是良性;S4:将对抗样本输入恶意流量防护模型,如果输出对抗样本的类别不正确,则重复执行步骤S2~S4,直到防护模型无法识别生成的对抗样本。本发明专利技术提供的方法可有效检测恶意行为,提高防护模型的鲁棒性。提高防护模型的鲁棒性。提高防护模型的鲁棒性。

【技术实现步骤摘要】
一种基于主动探测的恶意流量防护方法及系统


[0001]本专利技术涉及网络安全
,具体涉及一种基于主动探测的恶意流量防护方法及系统。

技术介绍

[0002]恶意流量防护模型是网络管理和网络安全中必不可少的技术。传统的基于规则的检测方法用于识别已知的恶意流量,但它们不适应不断变化的攻击模式。近年来,机器学习尤其是深度学习算法推动了恶意流量检测的发展。通常,会提取网络流量特征,并基于机器学习算法离线训练检测模型。然后将训练好的模型部署用于在线恶意流量检测。基于机器学习的模型可以根据时空流量特征准确识别恶意流量,相对于传统基于规则的检测方法,具有更强的泛化性。
[0003]尽管基于机器学习的模型具有很好的检测能力,但机器学习仍有一些缺点。一些研究人员已经证明,基于机器学习的模型极易受到对抗样本攻击。在计算机视觉中,Szegedy首先提出了对抗样本的概念。他们发现原始图像上的小扰动会误导机器学习系统对图像进行错误分类。近年来,关于对抗样本攻击的研究越来越多,许多学者生成对抗样本来评估机器学习模型,进而提高模型的鲁棒性。攻击者可以通过向恶意样本中添加精心制造的微小扰动,即可实现对机器学习模型的欺骗。但是防御方也可以提前生成对抗样本,并重训练防护模型,以抵御对抗样本的攻击。对抗样本攻击目前已经成为一项重要的机器学习稳定性测试。
[0004]实现针对恶意流量防护模型的对抗样本攻击比其他领域更具挑战性,有两个主要原因。首先,只能在特征空间中生成对抗样本来欺骗检测模型,但很难将对抗样本映射到流量空间。例如,某些统计特征(流的平均长度,每秒传输的字节数)无法映射到原始流量。其次,攻击应确保修改后的恶意流量不会破坏通信协议规则。例如,每个协议层都包含协议头和有效载荷,协议头具有固定的格式。
[0005]现有的一些针对恶意流量防护模型的对抗样本攻击已经可以检测模型的鲁棒性,但是这些方法在实际场景中存在着一些问题。首先,尽管一些攻击方法声称它们是没有先验知识的黑盒攻击,但对抗性攻击是在目标模型的知识下使用的,例如基于机器学习的模型的参数、使用的特征和训练的数据集。这些方法包含不切实际的假设,导致不真实的攻击场景。其次,一些方法通过修改交通特征来混淆基于机器学习的模型。但是,仅仅修改特征是没有意义的,特征很难映射到原始流量。最后,一些方法可以产生对抗性的恶意流量,但这种流量可能不实用。不是用的流量意味着它破坏了通信规则或失去了恶意。比如修改了TCP流量的前几个包的方向,导致三次握手失败,不符合TCP协议规则。另一个例子是Botnet流量的payload中含有大量的通讯恶意指令,如果篡改了这部分payload,将会使得恶意指令无效,Botnet流量失去其恶意性质。因此,关于对抗攻击的探测场景不实际、生成的样本不实用成为一个亟待解决的问题。

技术实现思路

[0006]为了解决上述技术问题,本专利技术提供一种基于主动探测的恶意流量防护方法及系统。
[0007]本专利技术技术解决方案为:一种基于主动探测的恶意流量防护方法,包括:
[0008]步骤S1:攻击者输入原始流量样本到恶意流量防护模型,在黑盒攻击场景下攻击所述恶意流量防护模型,输出所述原始流量样本的标签;
[0009]步骤S2:构建替代模型,包括:生成器G和鉴别器D;提取所述原始流量样本的时间序列和长度序列构建具有时空特征流量样本,输入所述鉴别器D,输出所述原始流量样本的类别:恶意或良性;
[0010]步骤S3:对所述替代模型进行训练,使得所述生成器G生成对抗样本,所述鉴别器D识别所述对抗样本是恶意的还是良性的;
[0011]步骤S4:将所述对抗样本输入所述恶意流量防护模型,如果输出所述对抗样本的类别不正确,则重复执行步骤S2~S4,直到所述恶意流量防护模型无法识别生成的所述对抗样本是恶意的还是良性的,将生成的所述对抗样本与所述原始流量样本混合后,重训练所述恶意流量防护模型。
[0012]本专利技术与现有技术相比,具有以下优点:
[0013]1、本专利技术公开了一种基于主动探测的恶意流量防护方法,所需要的先验知识较少,在无需知道防护模型的模型架构、模型参数情况下之外,也不需要知道防护模型使用的训练集、使用的特征,就可完成主动攻击探测。
[0014]2、本专利技术公开的方法基于WGAN模型设计了替代模型以及对应的损失函数。利用替代模型的生成器与鉴别器的对抗性训练,可以生成更加具有对抗性的样本,能够发现防护模型的更多漏洞;且生成的对抗样本具有实用性,生成对抗样本只需要符合通信协议规则,即可正常传输。
[0015]3、本专利技术公开的方法能够通过主动探测的方法,使用生成的对抗样本重训练防护模型,可以有效提高防护模型的鲁棒性,提高检测对抗性流量与变种恶意流量的能力。
附图说明
[0016]图1为本专利技术实施例中一种基于主动探测的恶意流量防护方法的流程图;
[0017]图2为本专利技术实施例中一种基于主动探测的恶意流量防护方法的框架示意图;
[0018]图3为本专利技术实施例中9种防护模型在使用Random攻击、DIGFuPas攻击和本专利技术方法生成对抗样本攻击后的检测率;
[0019]图4为本专利技术实施例中一种基于主动探测的恶意流量防护系统的结构框图。
具体实施方式
[0020]本专利技术提供了一种基于主动探测的恶意流量防护方法,有效检测变种恶意流量、对抗样本流量等恶意行为,提高了防护模型的鲁棒性。
[0021]为了使本专利技术的目的、技术方案及优点更加清楚,以下通过具体实施,并结合附图,对本专利技术进一步详细说明。
[0022]实施例一
[0023]如图1所示,本专利技术实施例提供的一种基于主动探测的恶意流量防护方法,包括下述步骤:
[0024]步骤S1:攻击者输入原始流量样本到恶意流量防护模型,在黑盒攻击场景下攻击恶意流量防护模型,输出原始流量样本的标签;
[0025]步骤S2:构建替代模型,包括:生成器G和鉴别器D;提取原始流量样本的时间序列和长度序列构建具有时空特征流量样本,输入鉴别器D,输出原始流量样本的类别:恶意或良性;
[0026]步骤S3:对替代模型进行训练,使得生成器G生成对抗样本,鉴别器D识别对抗样本是恶意的还是良性的;
[0027]步骤S4:将对抗样本输入恶意流量防护模型,如果输出对抗样本的类别不正确,则重复执行步骤S2~S4,直到恶意流量防护模型无法识别生成的对抗样本是恶意的还是良性的,将生成的对抗样本与原始流量样本混合后,重训练恶意流量防护模型。
[0028]在一个实施例中,上述步骤S1:攻击者输入原始流量样本到恶意流量防护模型,在黑盒攻击场景下攻击恶意流量防护模型,输出原始流量样本的标签,具体包括:
[0029]由于攻击者不知道作为目标模型的恶意流量防护模型及其参数,因此,攻击者输入原始流量样本到恶意流量防护模型,盲目地向恶意流量防护模型进行黑盒攻击。而且攻击者不知道目标模型使用的训练集。因此,所使用的恶意流量很有可能是与训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于主动探测的恶意流量防护方法,其特征在于,包括:步骤S1:攻击者输入原始流量样本到恶意流量防护模型,在黑盒攻击场景下攻击所述恶意流量防护模型,输出所述原始流量样本的标签;步骤S2:构建替代模型,包括:生成器G和鉴别器D;提取所述原始流量样本的时间序列和长度序列构建具有时空特征流量样本,输入所述鉴别器D,输出所述原始流量样本的类别:恶意或良性;步骤S3:对所述替代模型进行训练,使得所述生成器G生成对抗样本,所述鉴别器D识别所述对抗样本是恶意的还是良性的;步骤S4:将所述对抗样本输入所述恶意流量防护模型,如果输出所述对抗样本的类别不正确,则重复执行步骤S2~S4,直到所述恶意流量防护模型无法识别生成的所述对抗样本是恶意的还是良性的,将生成的所述对抗样本与所述原始流量样本混合后,重训练所述恶意流量防护模型。2.根据权利要求1所述的基于主动探测的恶意流量防护方法,其特征在于,所述步骤S2:构建替代模型,包括:生成器G和鉴别器D;提取所述原始流量样本的时间序列和长度序列构建具有时空特征流量样本,输入所述鉴别器D,输出所述原始流量样本的类别:恶意或良性,具体包括:步骤S21:基于所述原始流量样本的时间序列和长度序列作构建具有时空特征流量样本;步骤S22:基于WGAN模型构建替代模型,包括生成器G和鉴别器D;将所述具有时空特征流量样本输入所述鉴别器D,输出为其类别:恶意或良性;同时,构建所述鉴别器D的损失函数L
D
用于训练鉴别器D:其中,表示恶意样本,x表示良性样本,x
mal
表示恶意样本集合,x
ben
表示良性样本集合;D(
·
)表示鉴别器。3.根据权利要求2所述的基于主动探测的恶意流量防护方法,其特征在于,所述步骤S3:对所述替代模型进行训练,使得所述生成器G生成对抗样本,所述鉴别器D识别所述对抗样本是恶意的还是良性的,具体包括:步骤S31:将随机序列seed输入所述生成器G,输出恶意样本,在加...

【专利技术属性】
技术研发人员:成振语桑亚飞孙裴帅
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1