一种基于改进蜜獾算法的物联网设备识别特征提取与选择方法技术

技术编号:36538748 阅读:24 留言:0更新日期:2023-02-01 16:31
本发明专利技术公开了一种基于改进蜜獾算法的物联网设备识别特征提取与选择方法,包括:步骤一、从物联网环境网关中捕获流量数据,提取物联网流量特征数据;步骤二、对提取到的特征数据进行标准化预处理;步骤三、构建多目标联合特征选择的目标函数,利用目标函数评价特征子集;步骤四、通过改进的蜜獾算法求解特征子集,输出最优特征子集。能够从真实物联网流量环境中提取出特征进行选择分类,能够有效降低特征子集的维数,提高物联网设备分类效率,减少分类器的计算开销,减少运行时间。减少运行时间。减少运行时间。

【技术实现步骤摘要】
一种基于改进蜜獾算法的物联网设备识别特征提取与选择方法


[0001]本专利技术涉及一种基于改进蜜獾算法的物联网设备识别特征提取与选择方法,属于物联网设备识别领域。

技术介绍

[0002]随着物联网规模的飞速增长,各种网络安全问题也变得复杂多样化,攻击者们能够利用一种设备型号的漏洞危害成千上万个相同类型设备。除此之外,由于物联网设备通常配置更低的计算资源,所以比一般的计算机更加脆弱,更容易遭受大规模的网络攻击。而设备识别是检测与预防这些安全问题的一个重要手段。近年来,有关物联网设备识别系统的研究不断被提出,它们通常基于机器学习的方法从网络流量中提取特征并选择一部分特征进行分类工作,然而在这个过程中,特征提取和特征选择往往是许多研究的短板和难点,又因为网络流量特征的高维度特点,因此,开发一种用于设备识别的特征提取和特征选择方法,可以有效克服上述技术中的缺陷,更有利于物联网设备识别研究的发展。

技术实现思路

[0003]本专利技术设计开发了一种基于改进蜜獾算法的物联网设备识别特征提取与选择方法,能够从真实物联网流量环境中提取出特征进行选择分类,能够有效降低特征子集的维数,提高物联网设备分类效率,减少分类器的计算开销,减少运行时间。
[0004]本专利技术提供的技术方案为:
[0005]一种基于改进蜜獾算法的物联网设备识别特征提取与选择方法,包括:
[0006]步骤一、从物联网环境网关中捕获流量数据,提取物联网流量特征数据;
[0007]步骤二、对提取到的特征数据进行标准化预处理;
[0008]步骤三、构建多目标联合特征选择的目标函数,利用目标函数评价特征子集;
[0009]步骤四、通过改进的蜜獾算法求解特征子集,输出最优特征子集。
[0010]优选的是,所述步骤二中,所述特征数据进行标准化公式为:
[0011][0012]其中,y
i,j
为第i条数据的第j个特征值,y
max
为第j个特征的最大值,y
min
为第j个特征的最小值。
[0013]优选的是,所述步骤三中目标函数的公式为:
[0014][0015][0016]其中,fitness为适应度,ACC为当前模型在测试集上表现的准确率,num_feat为当
前搜索个体选择的特征数,max_feat为特征总数,TP为被分类器预测为正样本的样本数目,TN为被分类器预测为负样本事实上为负样本的样本数目,FN为被分类器预测为负样本事实上为正样本的样本数目。
[0017]优选的是,所述步骤四包括:
[0018]步骤1、通过Sine混沌映射和种群过滤机制进行种群初始化;
[0019]步骤2、引入一种子种群机制,将当前种群划为两个子种群,并分别选出每个子种群的最优解,分别定义为当前算法的最优解和次优解,以最优解和次优解分别引导两个种群进行位置更新;
[0020]步骤3、对种群内个体的离散解空间的位置向量进行二进制映射;
[0021]步骤4、合并子种群,输出最优特征组合;
[0022]当迭代次数不满足终止条件时,则重复步骤2

4。
[0023]优选的是,所述步骤1包括:
[0024]使用Sine混沌映射生成2倍个体数量的初始种群X
origin
,Sine混沌映射公式包括:
[0025]h
i+1
=μ
×
sin(π
×
h
i
);
[0026]X
i
=lb
i
+h
i
×
(ub
i
+lb
i
);
[0027]式中,h
i
为生成的第i个混沌数,μ为常数,为0.99,lb
i
为第i个解的下限,ub
i
为第i个解的上限,X
i
为生成第i个初始解;
[0028]通过目标函数计算种群中个体的适应度并排序;
[0029]取X
origin
的前一半个体组成种群X。
[0030]优选的是,所述步骤2包括:
[0031]更新气味强度因子I
[0032][0033]S=(X
m

X
m+1
)2;
[0034]d
m
=X
best

X
m

[0035]式中,I
m
为猎物对第m个蜜獾个体的气味强度,S为集中强度,d
m
为猎物与第m个蜜獾的距离;
[0036]进行位置更新,
[0037][0038]式中,X
new
为位置更新后的解,X
best
为目前为止该种群的最优解,F为方向向量,取

1或1,β为蜜獾获取食物的能力,数值为6,I为气味强度因子,d
i
为猎物与第i个蜜獾个体的距离,α为平衡因子,r3、r4、r5分别是[0,1]上的随机数,Levy(λ)为L
é
vy分布生成的随机步长,X
A
、X
B
分别为当前种群中两个随机的解。
[0039]优选的是,所述生成服从L
é
vy分布的随机步长的方法包括:
[0040][0041]式中,S为生成的随机步长,u~N(0,σ2),v~N(0,1),u为服从数学期望为0,方差为
σ2的正态分布,v为服从数学期望μ=0,方差σ=1的标准正态分布,η为常数,取1.5;
[0042][0043]式中,Γ()为伽玛函数,η为常数,取1.5。
[0044]优选的是,所述步骤3包括:
[0045]对种群内个体的离散解空间的位置向量进行二进制映射,映射函数为:
[0046][0047]式中,x
binary
为二进制化后的解,x为连续空间上的解,thres为阈值,取0.5。
[0048]本专利技术所述的有益效果:
[0049]本专利技术提出的一种物联网设备识别的特征提取和特征分类方法,能够从真实物联网流量环境中提取出特征进行选择分类,不必依靠过去现有的数据集,提取出的数据集能达到95%的分类准确率。所述的用于物联网设备识别特征选择的改进蜜獾算法性能超过原算法,并且优于其他同类算法,准确率及适应度值均有所提高,能够有效降低特征子集的维数,减少分类器的计算开销,减少运行时间,在物联网设备识别领域有着广泛的应用前景。
附图说明
[0050]图1为本专利技术所述的基于改进蜜獾算法的物联网设备识别特征提取与选择方法流程图。
[0051]图2为本专利技术所述的改进二进制蜜獾算法求解最优特征子集的流程图。
具体实施方式
[0052]下面结合附图对本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进蜜獾算法的物联网设备识别特征提取与选择方法,其特征在于,包括:步骤一、从物联网环境网关中捕获流量数据,提取物联网流量特征数据;步骤二、对提取到的特征数据进行标准化预处理;步骤三、构建多目标联合特征选择的目标函数,利用目标函数评价特征子集;步骤四、通过改进的蜜獾算法求解特征子集,输出最优特征子集。2.根据权利要求1所述的基于改进蜜獾算法的物联网设备识别特征提取与选择方法,其特征在于,所述步骤二中,所述特征数据进行标准化公式为:其中,y
i,j
为第i条数据的第j个特征值,y
max
为第j个特征的最大值,y
min
为第j个特征的最小值。3.根据权利要求2所述的基于改进蜜獾算法的物联网设备识别特征提取与选择方法,其特征在于,所述步骤三中目标函数的公式为:其特征在于,所述步骤三中目标函数的公式为:其中,fitness为适应度,ACC为当前模型在测试集上表现的准确率,num_feat为当前搜索个体选择的特征数,max_feat为特征总数,TP为被分类器预测为正样本的样本数目,TN为被分类器预测为负样本事实上为负样本的样本数目,FN为被分类器预测为负样本事实上为正样本的样本数目。4.根据权利要求3所述的基于改进蜜獾算法的物联网设备识别特征提取与选择方法,其特征在于,所述步骤四包括:步骤1、通过Sine混沌映射和种群过滤机制进行种群初始化;步骤2、引入一种子种群机制,将当前种群划为两个子种群,并分别选出每个子种群的最优解,分别定义为当前算法的最优解和次优解,以最优解和次优解分别引导两个种群进行位置更新;步骤3、对种群内个体的离散解空间的位置向量进行二进制映射;步骤4、合并子种群,输出最优特征组合;当迭代次数不满足终止条件时,则重复步骤2

4。5.根据权利要求4所述的基于改进蜜獾算法的物联网设备识别特征提取与选择方法,其特征在于,所述步骤1包括:使用Sine混沌映射生成2倍个体数量的初始种群X
origin
,Sine混沌映射公式包括:h
i+1
=μ
×
sin(π
×
h
i
);X
i
=lb
i
+h
i
×
(ub
i
+...

【专利技术属性】
技术研发人员:康辉王渤雄李家辉李洪娟
申请(专利权)人:吉林大学深圳研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1