一种用于流量分类的神经网络架构自动搜索方法及装置制造方法及图纸

技术编号:35499242 阅读:14 留言:0更新日期:2022-11-09 14:07
本发明专利技术涉及信息技术领域,具体涉及一种用于流量分类的神经网络架构自动搜索方法及装置。该方法及装置获取网络流量数据样本,将数据样本进行预处理并转成二维矩阵形式的流量数据集;将流量数据集分别划分成训练集、验证集和测试集;在流量数据集划分后,构建神经网络架构的搜索空间的可选操作;基于搜索空间的可选操作,搜索最优的神经网络架构;其中包括,搜索最优的Cell结构,重复搜索堆叠相同的Cell结构,将搜索的Cell结构形成整个神经网络架构。本发明专利技术能够通过给定的候选操作自动地搜索出最优的神经网络结构,而无需人工的参与。而无需人工的参与。而无需人工的参与。

【技术实现步骤摘要】
一种用于流量分类的神经网络架构自动搜索方法及装置


[0001]本专利技术涉及信息
,具体而言,涉及一种用于流量分类的神经网络架构自动搜索方法及装置。

技术介绍

[0002]网络流量分类技术是网络领域中一个重要的研究问题,它在入侵检测、网络异常检测和QoS保证中都起到非常关键的作用。深度神经网络作为近年来一种非常有前途的技术,已经在流量分类领域中取得了很好的效果。然而,目前的深度神经网络均需要人工设计,难以适应不同的流量分类任务,这些不同的流量分类任务可能存在不同的侧重点,且不同企业中的流量模式也各不相同,为每个任务单独设计一套适用的神经网络架构是非常高成本的。
[0003]传统的流量分类技术是基于端口号和深度包检测的,这种方法基于预先设定的规则来对待分类流量进行匹配,从而将其划分到已知的流量模式中。基于机器学习的方法使得流量分类技术能更加智能地去识别其内在的模式,这类方法一般先需要对网络流量进行特征化处理,将其转变为一组流量特征向量,然后结合常用的机器学习方法,如SVM、随机森林、KNN等进行分类。深度神经网络的出现使得端到端的流量分类成为可能,这类方法不强制要求事先将网络流量特征化,也可以将原始的网络数据进行简单编码后输送到神经网络中。神经网络先将这些编码映射到一组高维向量,然后对其进行卷积、池化、递归计算等操作,从而提取出隐藏特征。一般而言为了加强学习到的特征表达,会加深网络的层数,这就是“深度神经网络”的由来。在多层的特征提取操作后,一般会在最后结合线性层和Softmax层来进行分类。
[0004]传统的流量分类技术基于端口号和深度包检测,这类方法很容易被端口欺骗、流量加密等技术所绕过。基于机器学习的方法需要先对网络流量进行特征化,然而这需要非常大量的专家先验知识,且人工设计出来的特征不一定能保证有代表性和全面性。深度学习方法虽然可以降低专家知识的门槛,然而设计有效的神经网络架构本身就是一件有挑战性的事情。另外,要找出哪一种神经网络架构最适合当前的任务,需要大量的实验和重设计,这需要耗费巨大的人力物力。

技术实现思路

[0005]本专利技术实施例提供了一种用于流量分类的神经网络架构自动搜索方法及装置,目的在于实现自动的神经网络架构的搜索。
[0006]根据本专利技术的一实施例,提供了一种用于流量分类的神经网络架构自动搜索方法,包括以下步骤:
[0007]获取网络流量数据样本,将数据样本进行预处理并转成二维矩阵形式的流量数据集;
[0008]将流量数据集分别划分成训练集、验证集和测试集;
[0009]在流量数据集划分后,构建神经网络架构的搜索空间的可选操作;
[0010]基于搜索空间的可选操作,搜索最优的神经网络架构;其中包括,搜索最优的Cell结构,重复搜索堆叠相同的Cell结构,将搜索的Cell结构形成整个神经网络架构。
[0011]进一步地,方法还包括:
[0012]在每个Cell的输出位置加上空间注意力和通道注意力;
[0013]保存搜索出来的Cell架构参数,并使用训练集和验证集合并成的新训练集进行重新训练Cell架构。
[0014]进一步地,在获取网络流量数据样本,将数据样本进行预处理并转成二维矩阵形式的流量数据集中包括:
[0015]步骤一:在网络流粒度进行数据提取;
[0016]步骤二:在数据包粒度进行数据提取;
[0017]步骤三:将在网络流粒度提取数据和在数据包粒度提取的数据沿通道维度进行拼接组成张量;
[0018]步骤四:对所有网络流进行上述第一步至第三步的操作,构建格式化的流量数据集。
[0019]进一步地,在将流量数据集分别划分成训练集、验证集和测试集中包括:
[0020]训练集、验证集及测试集中含有相同比例的各类别流量;其中,
[0021]训练集用于更新该结构中的网络权重参数;
[0022]验证集用于搜索最佳的网络结构参数;
[0023]测试集用于在搜索完成后使用训练集加验证集进行重新训练、并在测试集上评测最终结果。
[0024]进一步地,构建搜索空间的可选操作中包括:限定搜索神经网络架构空间的范围。
[0025]进一步地,神经网络架构的搜索空间的可选操作为设置为:3x3深度可分离卷积、5x5深度可分离卷积、3x3空洞卷积、5x5空洞卷积、3x3最大化池化及3x3平均池化。
[0026]进一步地,在基于搜索空间的可选操作,搜索最优的神经网络架构中包括:
[0027]步骤一:构建超网;其中,在超网中扩展八条边的操作,且每条边有不同的权重;
[0028]步骤二:在验证集损失上使用梯度下降法更新神经网络架构参数;
[0029]步骤三:在训练集损失上使用梯度下降法更新操作权重参数;
[0030]步骤四:重复步骤二、步骤三直至神经网络架构训练完成;
[0031]步骤五:训练完成后,保留节点权重最大的那条边。
[0032]进一步地,在每个Cell的输出位置加上空间注意力和通道注意力中包括:
[0033]步骤一:通过对搜索出的Cell结构的输出后面加入通道注意力进行处理,得到通道注意力权重;
[0034]步骤二:通过对搜索出的Cell结构的输出后面加入空间注意力进行处理,得到空间注意力权重;
[0035]步骤三:将得到的通道注意力权重和空间注意力权重进行矩阵乘法,得到注意力加权的新输出。
[0036]根据本专利技术的另一实施例,提供了一种用于流量分类的神经网络架构自动搜索装置,装置包括:
[0037]数据转换模块:用于获取网络流量数据样本,将数据样本进行预处理并转成二维矩阵形式的流量数据集;
[0038]数据分成模块:用于将流量数据集分别划分成训练集、验证集和测试集;
[0039]可选操作构建模块:用于在流量数据集划分后,构建神经网络架构的搜索空间的可选操作;
[0040]搜索最优网络架构模块:用于基于搜索空间的可选操作,搜索最优的神经网络架构;其中包括,搜索最优的Cell结构,重复搜索堆叠相同的Cell结构,将搜索的Cell结构形成整个神经网络架构。
[0041]进一步地,装置还包括:
[0042]注意力加入模块:用于在每个Cell的输出位置加上空间注意力和通道注意力;
[0043]重新训练模块:用于保存搜索出来的Cell架构参数,并使用训练集和验证集合并成的新训练集进行重新训练Cell架构。
[0044]本专利技术实施例中的用于流量分类的神经网络架构自动搜索方法及装置,获取网络流量数据样本,将数据样本进行预处理并转成二维矩阵形式的流量数据集;将流量数据集分别划分成训练集、验证集和测试集;在流量数据集划分后,构建神经网络架构的搜索空间的可选操作;基于搜索空间的可选操作,搜索最优的神经网络架构;其中包括,搜索最优的Cell结构,重复搜索堆叠相同的Cell结构,将搜索的Cell结构形成整个神经网络架构。本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于流量分类的神经网络架构自动搜索方法,其特征在于,包括以下步骤:获取网络流量数据样本,将所述数据样本进行预处理并转成二维矩阵形式的流量数据集;将所述流量数据集分别划分成训练集、验证集和测试集;在所述流量数据集划分后,构建神经网络架构的搜索空间的可选操作;基于所述搜索空间的可选操作,搜索最优的神经网络架构;其中包括,搜索最优的Cell结构,重复搜索堆叠相同的Cell结构,将搜索的Cell结构形成整个神经网络架构。2.根据权利要求1所述的用于流量分类的神经网络架构自动搜索方法,其特征在于,所述方法还包括:在每个Cell的输出位置加上空间注意力和通道注意力;保存搜索出来的Cell架构参数,并使用所述训练集和所述验证集合并成的新训练集进行重新训练Cell架构。3.根据权利要求2所述的用于流量分类的神经网络架构自动搜索方法,其特征在于,在获取网络流量数据样本,将所述数据样本进行预处理并转成二维矩阵形式的流量数据集中包括:步骤一:在网络流粒度进行数据提取;步骤二:在数据包粒度进行数据提取;步骤三:将在网络流粒度提取数据和在数据包粒度提取的数据沿通道维度进行拼接组成张量;步骤四:对所有网络流进行上述第一步至第三步的操作,构建格式化的流量数据集。4.根据权利要求2所述的用于流量分类的神经网络架构自动搜索方法,其特征在于,在将所述流量数据集分别划分成训练集、验证集和测试集中包括:所述训练集、验证集及测试集中含有相同比例的各类别流量;其中,所述训练集用于更新该结构中的网络权重参数;所述验证集用于搜索最佳的网络结构参数;所述测试集用于在搜索完成后使用训练集加验证集进行重新训练、并在测试集上评测最终结果。5.根据权利要求2所述的用于流量分类的神经网络架构自动搜索方法,其特征在于,所述构建搜索空间的可选操作中包括:限定搜索神经网络架构空间的范围。6.根据权利要求5所述的用于流量分类的神经网络架构自动搜索方法,其特征在于,所述神经网络架构的搜索空间的可选操作为设置为:3x3深度可分离卷积、5x5深度可分离卷积、3x...

【专利技术属性】
技术研发人员:林鹏叶可江须成忠
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1