一种邻域形态空间人工免疫检测器多源生成算法制造技术

技术编号:20797833 阅读:26 留言:0更新日期:2019-04-06 11:27
本发明专利技术提出了一种邻域形态空间人工免疫检测器多源生成算法,属于人工智能免疫系统技术领域。所述邻域形态空间人工免疫检测器多源生成算法使用邻域形态空间,并改进邻域否定选择算法,引入混沌理论和遗传算法而形成的一种检测器多源生成算法,从而解决实值形态空间下检测器各个算法存在的问题。

A Multi-source Generation Algorithm for Neighborhood Morphological Space Artificial Immune Detector

The invention provides a multi-source generation algorithm of neighborhood morphological space artificial immune detector, which belongs to the technical field of artificial intelligence immune system. The neighborhood morphological space artificial immune detector multi-source generation algorithm uses neighborhood morphological space, improves neighborhood negative selection algorithm, introduces chaos theory and genetic algorithm to form a detector multi-source generation algorithm, so as to solve the problems of detector algorithms in real-valued morphological space.

【技术实现步骤摘要】
一种邻域形态空间人工免疫检测器多源生成算法
本专利技术涉及一种邻域形态空间人工免疫检测器多源生成算法,属于人工智能免疫系统

技术介绍
异常检测建立正常行为的模式轮廓,若当前活动违反其规则则被视为异常。人工免疫系统是人工智能技术的重要分支之一,它是一种模仿生物免疫系统功能的一种智能方法,被广泛应用于异常检测、数据挖掘、机器学习等多个领域。检测器是其核心集合,其生成、优化和检测操作决定了应用效果。目前,人工免疫系统通常把问题域转换到实值形态空间下,然而传统的基于实值形态空间的检测器各个算法存在着很多问题。其中,以检测器的数量或者统计推断作为算法结束条件会造成检测器的冗余、检测器覆盖率低造成的“黑洞”问题。同时,实值形态空间下的样本匹配策略主要是依据Euclidean距离或Manhattan距离,而映射复杂环境特征的实值检测器维数较高,会造成“维数灾难”问题,检测器各个算法的时空代价急剧增长,从而使系统检测性能急剧下降。
技术实现思路
本专利技术为了解决现有技术中“黑洞”问题和“维度灾难”问题,提出了一种邻域形态空间人工免疫检测器多源生成算法,所采取的技术方案如下:一种邻域形态空间人工免疫检测器多源生成算法,所述生成方法包括:步骤一、将样本进行标准化预处理;步骤二、设定参数,所述参数包括:成熟检测器最大规模Nd,训练阈值ρ,邻域划分步长step、算法结束条件的空间覆盖率p和遗传算法最大进化代数T;步骤三、根据所述邻域划分步长step划分领域形态空间,将自体样本映射到邻域形态空间,并确定样本中每维属性的边界和样本在每维属性下的步长;步骤四:利用系统随机函数n;然后,根据所述随机数确定候选检测器生成源;所述候选检测器生成源包括随机、混沌映射和遗传算法;步骤五、利用所述候选检测器生成源生成候选检测器;步骤六:进行亲和力计算,获得亲和力计算结果,结合所述亲和力计算结果通过邻域形态空间下的否定选择对候选检测器进行亲和力耐受训练,通过亲和力计算结果进行亲和力耐受训练,如果亲和力小于训练阈值ρ,则说明候选检测器通过了亲和力耐受训练,并将所述候选检测器加入到成熟检测器集合,并计算所述候选检测器的空间覆盖率p;否则,则说明候选检测器没有通过亲和力耐受训练,然后返回到步骤二,重复步骤二至步骤五的执行内容,直至和力小于训练阈值ρ,所述候选检测器通过亲和力耐受训练;步骤七:使用MonteCarlo方法估计检测器覆盖率,如果没有达到空间覆盖率p或者生成检测器数量小于成熟检测器最大规模Nd,则重复步骤二至步骤六的执行内容直至检测器覆盖率达到空间覆盖率p或者生成检测器数量不小于成熟检测器最大规模Nd;否则算法结束。进一步地,步骤一中根据预处理模型对样本进行标准化预处理,所述预处理模型为:其中,X为样本,X*为预处理后样本max(X)为所在维度取值的最大值;min(X)为所在维度取值的最小值。进一步地,步骤三所述邻域形态空间是集合[0,1]n的离散拓扑空间的一个子集,将[0,1]n划分成多个互不相交的邻域;在邻域形态空间上的样本表示为s=[s1,s2,…,sn]T(2)其中,n为空间维度,si(i=1,2,…,n)为所述样本在第i维上的划分编码值,si=(si(j-1),sij),si(j-1))和sij为所述样本在第i维上的上下界,且满足j∈[0,mi],si0=0,mi为第i维划分的邻域个数;在邻域形态空间中每一个邻域都是一个超立方体,人工免疫自体和检测器的表示均为邻域超立方体形式。进一步地,步骤四中利用混沌映射产生的混沌序列如下:其中,n=1,2,…,N。进一步地,步骤四所述根据所述随机数确定候选检测器生成源的规则为:当随机数n=0时,采用随机的方式作为生成源生成候选检测器;当随机数n=1时,采用混沌映射的方式作为生成源生成候选检测器;当随机数n=2时,采用遗传算法的方式作为生成源生成候选检测器。进一步地,步骤六所述亲和力计算的过程包括:第一步、通过Manhattan距离进行单维亲和力计算,获得单维亲和力;第二步、利用邻域匹配Hamming距离统计单维匹配个数;第三步、将统计获得的单维匹配结果与设定的训练阈值进行比较,判定单维匹配结果与设定的训练阈值是否匹配。进一步地,步骤六所述亲和力计算规则如下:将基于Minkowski距离的匹配方法与基于Hamming距离的匹配方法进行结合,设X[x1,x2,…,xn]T和Y[y1,y2,…,yn]T为待匹配样本,其邻域匹配度NNS(X,Y)为:进一步地,利用步骤四所述遗传算法作为生成源生成候选检测器的过程包括:第1步、对初始群体N进行初始化,设定初始进化代数t=0;第2步、计算群体N中每个个体的适应度,获得每个个体的适应度值;第3步、选择适应度最高的个体按交叉概率方式进行交叉处理,获得交叉结果;第4步、将第3步获得的交叉结果按照变异概率方式进行变异,获得变异结果;第5步、判断所述变异结果是否满足终止条件,其中,所述终止条件是当前进化代数t等于设定的最大进化代数T;如果变异结果满足终止条件,则完成候选检测器的生成;如果变异结果不满足终止条件,则t=t+1,重复第2步至第4步的执行内容,对所述群体N重新开始遗传算法操作,直至变异结果满足终止条件。本专利技术有益效果:本专利技术提出的邻域形态空间人工免疫检测器多源生成算法通过将属性相似的数据映射到同一块邻域形态空间可使样本规模大幅度减少,从而大幅度减少计算量,同时采用设计的邻域形态空间匹配规则进行亲和力计算和判定,不仅进一步减少计算量,而且可以有效避免“维数灾难”问题。然后,基于此改进邻域形态空间下检测器生成机制,使用三种数据源使候选检测器的构造更快、更具有靶向性、更全面,从而使生成的检测器具有更好的分布性,提高检测器的生成效率和检测性能,从而解决实值形态空间下存在的各种问题。改进后的算法在检测性能、效率和稳定性等方面表现出了很好的水平。附图说明图1为本专利技术所述邻域形态空间人工免疫检测器多源生成算法流程图;图2为本专利技术所述遗传算法流程图;图3为本专利技术所述所述邻域形态空间人工免疫检测器多源生成算法的性能检测试验结果数据图。具体实施方式下面结合具体实施例对本专利技术做进一步说明,但本专利技术不受实施例的限制。实施例1:一种邻域形态空间人工免疫检测器多源生成算法,所述生成方法包括:步骤一、将样本进行标准化预处理;步骤二、设定参数,所述参数包括:成熟检测器最大规模Nd,训练阈值ρ,邻域划分步长step和算法结束条件的空间覆盖率p,遗传算法最大进化代数T;步骤三、根据所述邻域划分步长step划分领域形态空间,将自体样本映射到邻域形态空间,并确定样本中每维属性的边界和样本在每维属性下的步长;其中,邻域形态空间是本算法的数学基础,其数学模型基于离散拓扑空间理论形成的。步骤四:利用系统随机函数生成随机数n;然后,根据所述随机数确定候选检测器生成源;所述候选检测器生成源包括随机、混沌映射和遗传算法;步骤五、利用所述候选检测器生成源生成候选检测器;步骤六:进行亲和力计算,获得亲和力计算结果,结合所述亲和力计算结果通过邻域形态空间下的否定选择对候选检测器进行亲和力耐受训练,通过亲和力计算结果进行亲和力耐受训练,如果亲和力小于训练阈值ρ,则说明候选检测器通过了亲和力耐受训练,并本文档来自技高网...

【技术保护点】
1.一种邻域形态空间人工免疫检测器多源生成算法,其特征在于,所述生成方法包括:步骤一、将样本进行标准化预处理;步骤二、设定参数,所述参数包括:成熟检测器最大规模Nd,训练阈值ρ,邻域划分步长step、算法结束条件的空间覆盖率p和遗传算法最大进化代数T;步骤三、根据所述邻域划分步长step划分领域形态空间,将自体样本映射到邻域形态空间,并确定样本中每维属性的边界和样本在每维属性下的步长;步骤四:利用系统随机函数生成随机数n;然后,根据所述随机数确定候选检测器生成源;所述候选检测器生成源包括随机、混沌映射和遗传算法;步骤五、利用所述候选检测器生成源生成候选检测器;步骤六:进行亲和力计算,获得亲和力计算结果,结合所述亲和力计算结果通过邻域形态空间下的否定选择对候选检测器进行亲和力耐受训练,通过亲和力计算结果进行亲和力耐受训练,如果亲和力小于训练阈值ρ,则说明候选检测器通过了亲和力耐受训练,并将所述候选检测器加入到成熟检测器集合,并计算所述候选检测器的空间覆盖率p;否则,则说明候选检测器没有通过亲和力耐受训练,然后返回到步骤二,重复步骤二至步骤五的执行内容,直至和力小于训练阈值ρ,所述候选检测器通过亲和力耐受训练;步骤七:使用Monte Carlo方法估计检测器覆盖率,如果没有达到空间覆盖率p或者生成检测器数量小于成熟检测器最大规模Nd,则重复步骤二至步骤六的执行内容直至检测器覆盖率达到空间覆盖率p或者生成检测器数量不小于成熟检测器最大规模Nd;否则算法结束。...

【技术特征摘要】
1.一种邻域形态空间人工免疫检测器多源生成算法,其特征在于,所述生成方法包括:步骤一、将样本进行标准化预处理;步骤二、设定参数,所述参数包括:成熟检测器最大规模Nd,训练阈值ρ,邻域划分步长step、算法结束条件的空间覆盖率p和遗传算法最大进化代数T;步骤三、根据所述邻域划分步长step划分领域形态空间,将自体样本映射到邻域形态空间,并确定样本中每维属性的边界和样本在每维属性下的步长;步骤四:利用系统随机函数生成随机数n;然后,根据所述随机数确定候选检测器生成源;所述候选检测器生成源包括随机、混沌映射和遗传算法;步骤五、利用所述候选检测器生成源生成候选检测器;步骤六:进行亲和力计算,获得亲和力计算结果,结合所述亲和力计算结果通过邻域形态空间下的否定选择对候选检测器进行亲和力耐受训练,通过亲和力计算结果进行亲和力耐受训练,如果亲和力小于训练阈值ρ,则说明候选检测器通过了亲和力耐受训练,并将所述候选检测器加入到成熟检测器集合,并计算所述候选检测器的空间覆盖率p;否则,则说明候选检测器没有通过亲和力耐受训练,然后返回到步骤二,重复步骤二至步骤五的执行内容,直至和力小于训练阈值ρ,所述候选检测器通过亲和力耐受训练;步骤七:使用MonteCarlo方法估计检测器覆盖率,如果没有达到空间覆盖率p或者生成检测器数量小于成熟检测器最大规模Nd,则重复步骤二至步骤六的执行内容直至检测器覆盖率达到空间覆盖率p或者生成检测器数量不小于成熟检测器最大规模Nd;否则算法结束。2.根据权利要求1所述邻域形态空间人工免疫检测器多源生成方法,其特征在于,步骤一中根据预处理模型对样本进行标准化预处理,所述预处理模型为:其中,X为样本,X*为预处理后样本max(X)为所在维度取值的最大值;min(X)为所在维度取值的最小值。3.根据权利要求1所述邻域形态空间人工免疫检测器多源生成方法,其特征在于,步骤三所述邻域形态空间是集合[0,1]n的离散拓扑空间的一个子集,将[0,1]n划分成多个互不相交的邻域;在邻域形态空间上的样本表示为s=[s1,s2,…,sn]T(2)其中,n为空间维度,si(i=1,2,…,n)为所述样本在第i维上的划分编码值,si=(si(j-1),sij),si(j-1))和sij为所述样本在第i维上...

【专利技术属性】
技术研发人员:席亮姚之钰赵一霖张凤斌
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1