利用多种特征流形向量的入侵检测系统对抗样本防御方法技术方案

技术编号:37971323 阅读:7 留言:0更新日期:2023-06-30 09:46
本发明专利技术涉及利用多种特征流形向量的入侵检测系统对抗样本防御方法,属于计算机与信息科学领域。本发明专利技术首先对网络流量样本提取多种特征:利用径向神经网络计算样本类别预测概率,基于注意力机制计算样本特征权重并提取高权重特征,计算样本特征间相关度并提出随机递归式特征消除算法选择高相关度特征;其次,将多种特征映射为低维流形向量,并分别与良性、恶意流量样本流形向量计算相似度;最后,依据流形相似度利用降噪自编码器生成重构特征后的流量样本,再通过入侵检测系统进行判别。本发明专利技术基于多种特征流形相似度对样本特征进行重构,降低了特征中对抗性扰动对检测精度的影响,提升了入侵检测系统对对抗样本的防御能力。力。力。

【技术实现步骤摘要】
利用多种特征流形向量的入侵检测系统对抗样本防御方法


[0001]本专利技术涉及利用多种特征流形向量的入侵检测系统对抗样本防御方法,属于计算机与信息科学领域。

技术介绍

[0002]入侵检测是一种基于网络流量分析的主动防御方案,通过对捕捉到的数据包进行特征取证匹配以鉴别网络攻击行为。基于机器学习和深度学习的入侵检测算法能够实现对网络流量的自动化建模、识别,提升入侵检测的效率和质量。然而,机器学习和深度学习算法的引入也带来了新的挑战。自2013年Szegedy等人首次针对深度神经网络提出了对抗样本概念后,相继有学者提出了更多的对抗样本生成方法,如FGSM、BIM、PGD、C&W、GAN等。在入侵检测领域中,对抗样本生成方法用于制作恶意流量对抗样本,使得基于机器学习和深度学习的入侵检测模型将其误分类为良性流量,从而达到规避入侵检测系统、隐蔽恶意攻击行为的目的,严重威胁信息系统安全。因此,研究一种有效的流量对抗样本防御方法对保障入侵检测系统的有效性、维护信息系统安全具有重要的理论意义和现实价值。
[0003]按照防御过程中面向对象不同,可以将近几年通用对抗样本防御方法分为改进模型架构的方法和基于数据增强的方法。
[0004]1.改进模型架构的方法
[0005]改进模型架构的方法从架构优化层面考虑。在入侵检测模型基础之上,构建额外的对抗样本分类器识别对抗样本,并采用集成投票方式共同决策样本恶意类别,以降低对抗样本欺骗成功率。此类方法关注于提升模型架构的分类容错性能,但并不能有效限制对抗性扰动对入侵检测精度的影响,这不仅会产生额外的模型开销,还无法从根源上制约有效对抗样本的生成及其对入侵检测系统的欺骗。
[0006]2.基于数据增强的方法
[0007]基于数据增强的方法从样本数据层面考虑。利用已知对抗样本生成方法生成大量对抗样本用于增强样本数据集,训练得到一个决策边界平滑、对抗扰动鲁棒性强的入侵检测模型。此类方法关注于增强数据的多元性,但并未考虑对抗样本的底层原理,缺少对良性样本与恶意样本间差异性的分析,导致模型无法抵御未知攻击且在高隐蔽扰动识别中性能不佳。
[0008]综上所述,针对现有改进模型架构方法缺少对对抗性扰动的限制和基于数据增强方法难以有效挖掘放大样本差异导致对对抗样本防御效果差的问题,本专利技术提出一种利用多种特征流形向量的入侵检测系统对抗样本防御方法。

技术实现思路

[0009]本专利技术的目的是为了满足基于机器学习和深度学习的入侵检测系统的对抗样本防御需求,改善现有改进模型架构防御方法缺少对对抗性扰动限制的问题,弥补基于数据增强方法难以有效挖掘放大良性样本与恶意样本差异的缺陷。
[0010]本专利技术的设计原理为:首先,对输入流量样本进行特征预处理;其次,对预处理后样本提取多种特征;然后,将提取到的多种特征映射为低维流形向量,再分别与良性样本和恶意样本计算流形相似度并输出当前样本相似类别;最后将预处理后样本输入到相似类别对应生成模型进行重构以放大特征差异,并对其作逆处理后输出到入侵检测系统进行流量判别。
[0011]本专利技术的技术方案是通过以下步骤进行实现的:
[0012]步骤1,对输入网络流量样本进行特征预处理。
[0013]步骤1.1,提取网络流量样本中非功能性特征。
[0014]步骤1.2,对非数值特征进行编码,对数值特征进行归一化。
[0015]步骤2,对步骤1预处理后网络流量样本提取多种特征。
[0016]步骤2.1,利用径向神经网络构建样本类别预测概率计算网络,计算流量样本的类别预测概率并作为软标签特征。
[0017]步骤2.2,基于注意力机制构建特征权重计算网络,计算每一个特征对模型决策的权重,筛选高权重特征并作为高贡献度特征。
[0018]步骤2.3,计算样本特征间相关度,结合提出的随机递归式特征消除算法构建表征能力计算网络,筛选高相关度特征并作为高表征特征。
[0019]步骤3,将提取到的多种特征映射为低维流形向量,并与良性样本流形向量、恶意样本流形向量进行相似度计算,判断相似类别。
[0020]步骤3.1,利用训练好的降噪自编码器模型的编码器分别对提取到的多种特征进行低维流形映射。
[0021]步骤3.2,根据良性样本和恶意样本的多种特征平均流形向量,分别对当前样本对应多种特征低维流形向量计算良性流形相似度和恶意流形相似度,并比较二者数值判断相似类别。
[0022]步骤4,将特征预处理后样本输入到相似类别对应重构模进行重构,以强化样本数据分布特征、放大样本差异,并对所有重构样本进行单聚类,选取聚类中心点作逆处理作为最优重构样本。
[0023]步骤4.1,将步骤1处理后的特征样本,输入到相似类别对应良性样本生成模型或恶意样本生成模型以强化样本数据分布特征、放大样本差异,重构输出50个样本。
[0024]步骤4.2,计算50个重构样本与重构前样本之间的差异值,并将差异值与样本原特征向量组合,根据组合后向量进行样本单聚类,选择聚类中心点作为最终最优重构样本。
[0025]步骤4.3,对最优重构样本进行逆处理后输出。
[0026]步骤5,入侵检测系统对最优重构流量样本进行行为分类,输出分类结果为良性流量或恶意流量。
[0027]有益效果
[0028]相比于改进模型架构的方法,本专利技术不依赖额外的模型开销提升入侵检测系统的流量分类容错率,而是通过多种特征提取降低对抗样本逃逸率。对流量样本提取多种特征能够有效消除冗余特征干扰,并使得模型关注于易添加对抗性扰动的特征,限制了对抗性扰动影响,提升了制作能够有效逃逸入侵检测系统的流量对抗样本的难度,从而降低流量对抗样本攻击成功率。
[0029]相比于基于数据增强的方法,本专利技术关注于样本特征差异放大,通过流形相似度计算和特征重构提升入侵检测系统的分类准确率。对多种特征进行流形相似度计算并对良性、恶意样本特征进行重构,能够更好地凸显二者间的特征分布差异,使得入侵检测系统能够更好地捕捉良性样本与恶意样本之间差异性,有效提升入侵检测系统对对抗样本的防御能力。
附图说明
[0030]图1为利用多种特征流形向量的入侵检测系统对抗样本防御方法框架图。
[0031]图2为样本类别预测概率计算过程原理图。
[0032]图3为高权重特征提取过程原理图。
[0033]图4为高相关度特征提取过程原理图。
[0034]图5为特征权重向量的计算原理图。
[0035]图6为低维流形映射原理图。
具体实施方式
[0036]为了更好的说明本专利技术的目的和优点,下面结合实例对本专利技术方法的实施方式作进一步详细的说明。
[0037]具体的流程为:
[0038]步骤1,对输入流量样本进行特征预处理。
[0039]步骤1.1步骤1,对输入流量样本进行特征筛选预处理,提取流量样本中不影响流量底层属性的非功能性特征。从以下几个维度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.利用多种特征流形向量的入侵检测系统对抗样本防御方法,其特征在于所属方法包括如下步骤:步骤1,对输入的网络流量样本进行特征预处理,提取非功能性特征,对非数值特征进行编码,对数值特征进行归一化;步骤2,对特征预处理后流量样本提取多种特征;步骤3,分别对步骤2中提取到的特征,进行低维流形映射,并与良性样本流形向量、恶意样本流形向量进行相似度计算,判断相似类别;步骤4,将特征预处理后样本输入相似类别对应生成模型进行重构,以强化样本数据分布特征、放大样本差异,并对所有重构样本进行聚类,取聚类中心点作逆处理作为最优重构样本;步骤5,入侵检测系统对最优重构流量样本进行分类,输出分类结果为良性流量或恶意流量。2.根据权利要求1所述的利用多种特征流形向量的入侵检测系统对抗样本防御方法,其特征在于:步骤2中对流量样本提取了多种特征,包括高贡献度特征、高表征特征和软标签特征。3.根据权利要求1所述的利用多种特征流形向量的入侵检测系统对抗样本防御方法,其特征在于:步骤2中构建了表征能力计算网络,首先计算每个特征与其他特征的Person相关性系数,并按数值大小排序提取前20个特征形成特征矩阵,再利用随机递归式特征消除算法对矩阵中每维特征向量进行最优组合选择。4.根据权利要求1所述的利用多种特征流形向量的入侵检测系统对抗样本防御方法,其特征在于:步骤2中提出了随机递归式特征消除算法,对输入特征矩阵中第i个向量执行如下过程:首先根据设置的随机种子在0到20范围内初始化随机值m、在0到0.6范围内初始化最优准确率acc
best
,对应最优特征组合为r
best
=null;其次从r
x
中提取前m个特征组成新特征子集s
m
训练一个深度神经网络,并记录训练过程准确率acc
i
,若acc<...

【专利技术属性】
技术研发人员:罗森林邵思源潘丽敏巩锟沈宇辉王琛
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1