一种基于DNA计算的智能攻击检测方法及系统技术方案

技术编号:35858271 阅读:13 留言:0更新日期:2022-12-07 10:46
本发明专利技术公开了一种基于DNA计算的智能攻击检测方法及系统,本发明专利技术包括将流量特征编码为碱基组成DNA序列,并随机初始化若干条DNA序列组成父代种群P,从父代种群P中随机选择N条DNA序列作为子代种群S;对子代种群S进行DNA生化反应后与父代种群P合并得到种群Q;针对种群Q中的各条DNA序列计算分类性能指标作为各条DNA序列的适应度;根据适应度对种群Q中所有DNA序列基于非支配排序算法进行排序,选择新的父代种群P;若迭代次数Gen等于设定最大迭代次数GenMax或各条DNA序列的适应度不再变化后根据适应度从父代种群P中选择最优的DNA序列,然后解码碱基为流量特征得到最优特征子集。本发明专利技术既能提升各分类精度而解决不平衡问题,又能降低特征维度而筛选出最优子集以提升检测速率。速率。速率。

【技术实现步骤摘要】
一种基于DNA计算的智能攻击检测方法及系统


[0001]本专利技术涉及网络安全技术,具体涉及一种基于DNA计算的智能攻击检测方法及系统。

技术介绍

[0002]近几年,DDoS攻击、APT攻击以及数据窃取等入侵手段层出不穷,瘫痪了各种网络以及互联设备,造成了全球范围内的网络安全事件频发,成为个人、组织乃至国家安全的噩梦。因此,建立一个攻击检测系统并有效的识别出各种网络攻击行为,在当今网络安全中变得尤为重要。但是,随着网络流量爆发式增长,网络异常流量愈发的具有复杂性、隐蔽性和多样性等特点,造成了传统的攻击检测系统的失效。为了应对这种趋势,研究者们基于粗糙集理论、机器学习和深度学习等方法研究出许多的攻击检测方法。例如:基于粗糙集理论等传统的检测方法有着在数据不完整的情况下,仍能检测到网络攻击的优点。基于机器学习的方法有着能够通过不断学习积累经验优化分类器性能的能力,是相比传统检测方法更好的解决方案。而深度学习可以学习到训练数据内在的规律和表示层次,然后通过构建隐藏层组建的非线性网络结构具有效率更高、根据问题自动建立模型和不局限于某个固定的问题优点。
[0003]目前,这些最新的检测方法仅仅针对网络攻击的整体检测精度和特征降维而忽略了特征子集优化和检测不平衡两个问题。例如,随着网络流量的大幅度增长,其所包含的特征信息也随之增多,但这些信息中却也夹杂着更多的噪声和冗余信息。同时这些噪声和冗余信息与有用信息有着千丝万缕的联系,这不仅增加了攻击检测的计算复杂度、时间消耗,还导致特征降维时删除了有用信息却保留了部分噪声和冗余信息,给攻击检测技术带来了严重的挑战。同时,现有的检测数据集中因部分攻击类型的样本收集难度较大而导致其实例数较少,普遍存在着数据不平衡等问题。但是以往的特征选择方法往往偏向于实例数较多的标签和特征之间的相互影响,忽略了实例数较少的标签与特征之间的关联性,这种状况加剧了检测不平衡。
[0004]在类别不平衡的数据集中,多数类由正常样本和频繁攻击样本组成,少数类由不频繁的罕见攻击样本组成。通过这种数据集训练的检测系统往往会对少数攻击类别给出误差较大的检测结果,从而严重影响检测分类系统的鲁棒性。
[0005]为了解决数据不平衡带来的问题,许多研究尝试从数据层面改变类别样本的分布解决不平衡问题。例如,数据层面的第一种方法是通过人工合成少数类样本来达到类别平衡。典型地,可采用插值、过采样、编码器等数据增强方法实现了数据集的平衡并且取得了较好的实验结果。第二种方法是通过人工删除多数类样本以达到类别平衡。典型地,Liu等人提出了一种新的困难集采样技术算法,使用Kmeans算法对困难集合中的多数样本进行压缩,以减少多数类而达到类别平衡。但是人工合成样本容易产生模型过拟合的问题,而人工删除样本容易导致多数类样本的重要信息丢失。为了解决数据层面的这些问题,Bedi等人通过改变分类算法,从算法层面使得检测系统更着重于少数类从而达到检测平衡,提出了
一种基于Siam神经网络的新型入Siam检测系统。该系统能够检测到NSL

KDD数据集中实例数较少的R2L和U2R攻击而无需使用传统的类别平衡技术。虽然通过更看重少数类样本能够有效的避免数据层面的过拟合和丢失信息,但对于少类较多的多分类问题仍然有部分类别无法检测到,同时无法保证多数类精度的问题。
[0006]DNA计算是一个崭新的研究领域,Adleman教授于1994年以DNA分子为计算介质成功地解决了7个顶点的有向哈密尔顿路问题,成为DNA计算发展的里程碑。DNA计算是基于生物DNA编码和进化机制的一类仿生优化算法,对解决复杂的组合优化问题非常有效,其最大优点是充分利用DNA分子具有海量存储能力以及生化反应的巨大并行性。文献ZangW,RenL,ZhangW,etal.Acloudmodel

basedDNAgeneticalgorithmfornumericaloptimizationproblems.FutureGenerationComputerSystems,2018,81:465

477.利用DNA计算通过模拟DNA的编码方式取代传统进化算法的0、1编码,实验表明DNA计算具有种群多样性丰富、收敛速度快等特点。Jatoth等人(JatothC,GangadharanGR,BuyyaR.Optimalfitnessawarecloudservicecompositionusinganadaptivegenotypesevolutionbasedgeneticalgorithm.FutureGenerationComputerSystems,2019,94:185

198.)提出利用生物分子的各种生化反应来完成DNA计算过程,并且用DNA编码表示系统携带的信息,模拟DNA分子的各种操作以发现和处理信息,同时在进化过程中不断获取和更新信息。Shukla(ShuklaA,PandeyHM,MehrotraD.Comparativereviewofselectiontechniquesingeneticalgorithm.2015internationalconferenceonfuturistictrendsoncomputationalanalysisandknowledgemanagement(ABLAZE).IEEE,2015:515

519.)表明DNA计算方法既可以充分发挥开创性DNA计算的思想,又可以解决诸如自动控制、模式识别、决策问题、机器学习等工程领域中广泛存在的各种复杂优化问题。基于DNA计算的优化算法是相比遗传算法更进一步的发展,容纳了常规遗传算法都有智能、可以自组织和自学习、都是对参数构成的编码种群进行进化、都是利用随机操作指导着向最优化方向前进的搜索等特点。DNA计算相比普通遗传算法具有以下若干优点:(1)DNA编码使得种群所包含的信息更加丰富,并且具有更强的多样性表达能力,用较短长度的DNA链就能表达更复杂的知识。(2)DNA计算通过引入分子水平操作极大的扩展了优化方法,使得优化算法的收敛速度更快,也能避免早熟问题。(3)染色体长度可变的特点,使得DNA计算更容易完成插入和删除碱基序列的操作,更加适合于优化复杂知识。

技术实现思路

[0007]本专利技术要解决的技术问题:针对现有技术的上述问题,提供一种基于DNA计算的智能攻击检测方法及系统,本专利技术通过将流量特征表达为DNA序列以利用DNA生化反应来生成新的流量特征,丰富了流量特征种群的多样性,并利用分类性能指标作为各条DNA序列的适应度来实现基于非支配排序算法的排序,有效的解决了非支配排序等算法进行特征优化时的早熟问题,加快了收敛速度,使得本专利技术既能提升各分类精度而解决不平衡问题,又能降低特征维度而筛选出最优子集以提升检测速率。
[0008]为了解决上述技术问题,本专利技术采用的技术方案为:
[0009]一种基于DNA计算的智能攻击检测方法,包括:
[0010]S1,将流量特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于DNA计算的智能攻击检测方法,其特征在于,包括:S1,将流量特征编码为碱基组成DNA序列,并随机初始化若干条DNA序列组成父代种群P,所述父代种群P中的个体为一条DNA序列,所述DNA序列由固定长度的碱基构成,每一个碱基用于表示一个流量特征的状态且服从{0,1,2,3}分布;初始化迭代次数Gen;S2,从父代种群P中随机选择N条DNA序列作为子代种群S;S3,对子代种群S中的DNA序列进行DNA生化反应;S4,将父代种群P、子代种群S合并得到种群Q;S5,针对种群Q中的各条DNA序列,将碱基解码为流量特征后得到特征子集,基于特征子集进行攻击分类检测,得到相应的分类性能指标作为各条DNA序列的适应度;S6,根据适应度对种群Q中所有DNA序列基于非支配排序算法进行排序,根据排序的结果选择指定数量的DNA序列构成新的父代种群P;S7,判断迭代次数Gen等于设定最大迭代次数GenMax或各条DNA序列的适应度不再变化是否成立,若不成立则将迭代次数Gen加1并跳转步骤S2;否则,根据适应度从新的父代种群P中选择最优DNA序列,解码为流量特征作为最优特征子集。2.根据权利要求1所述的基于DNA计算的智能攻击检测方法,其特征在于,步骤S3包括:首先针对子代种群S中的各条DNA序列,将碱基解码为流量特征得到特征子集,基于特征子集进行攻击分类检测,并计算特征子集的分类性能指标;然后基于分类性能指标对子代种群S中的DNA序列进行DNA生化反应,其中DNA生化反应包括不同DNA序列之间的交叉、同一DNA序列内部的变异以及同一DNA序列内部的倒序中的部分或者全部。3.根据权利要求2所述的基于DNA计算的智能攻击检测方法,其特征在于,所述不同DNA序列之间的交叉包括:步骤1,随机选择多对DNA序列;步骤2,在多对DNA序列中遍历选择一对DNA序列作为当前DNA序列对;步骤3,判断当前DNA序列对的距离D大于设定值d是否成立,若成立则跳转步骤1;否则,跳转继续往下执行;步骤4,根据分类性能指标计算交叉概率Pm,并生成随机数Pr,若条件Pr<Pm成立,则为当前DNA序列对执行碱基换位;否则为当前DNA序列对执行碱基翻转;其中,根据分类性能指标计算交叉概率Pm的函数表达式为:上式中,K1和K2为常数参数,K1和K2的取值范围为[0,p],p为流量特征的维度;f
max
为子代种群S中所有DNA序列对应的最优的分类性能指标,f

为当前DNA序列对交叉后的平均分类性能指标,f
avg
为子代种群S中所有DNA序列对应的平均分类性能指标;其中f

为针对当前DNA序列对交叉后的得到的两个DNA序列,将碱基解码为流量特征得到特征子集基于特征子集进行攻击分类检测,并计算两个特征子集的分类性能指标的平均值后得到;步骤5,判断DNA序列是否遍历完毕,若尚未遍历完毕则跳转步骤2;否则判定不同DNA序列之间的交叉完成。4.根据权利要求2所述的基于DNA计算的智能攻击检测方法,其特征在于,所述同一DNA序列内部的变异包括:首先以变异概率Pc选取DNA序列,然...

【专利技术属性】
技术研发人员:曾增日赵宝康彭伟
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1