一种用于流量分类的神经网络架构自动搜索方法及装置制造方法及图纸

技术编号：35499242 阅读：14 留言：0更新日期：2022-11-09 14:07

本发明专利技术涉及信息技术领域，具体涉及一种用于流量分类的神经网络架构自动搜索方法及装置。该方法及装置获取网络流量数据样本，将数据样本进行预处理并转成二维矩阵形式的流量数据集；将流量数据集分别划分成训练集、验证集和测试集；在流量数据集划分后，构建神经网络架构的搜索空间的可选操作；基于搜索空间的可选操作，搜索最优的神经网络架构；其中包括，搜索最优的Cell结构，重复搜索堆叠相同的Cell结构，将搜索的Cell结构形成整个神经网络架构。本发明专利技术能够通过给定的候选操作自动地搜索出最优的神经网络结构，而无需人工的参与。而无需人工的参与。而无需人工的参与。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于流量分类的神经网络架构自动搜索方法及装置

[0001]本专利技术涉及信息
，具体而言，涉及一种用于流量分类的神经网络架构自动搜索方法及装置。

技术介绍

[0002]网络流量分类技术是网络领域中一个重要的研究问题，它在入侵检测、网络异常检测和QoS保证中都起到非常关键的作用。深度神经网络作为近年来一种非常有前途的技术，已经在流量分类领域中取得了很好的效果。然而，目前的深度神经网络均需要人工设计，难以适应不同的流量分类任务，这些不同的流量分类任务可能存在不同的侧重点，且不同企业中的流量模式也各不相同，为每个任务单独设计一套适用的神经网络架构是非常高成本的。
[0003]传统的流量分类技术是基于端口号和深度包检测的，这种方法基于预先设定的规则来对待分类流量进行匹配，从而将其划分到已知的流量模式中。基于机器学习的方法使得流量分类技术能更加智能地去识别其内在的模式，这类方法一般先需要对网络流量进行特征化处理，将其转变为一组流量特征向量，然后结合常用的机器学习方法，如SVM、随机森林、KNN等进行分类。深度神经网络的出现使得端到端的流量分类成为可能，这类方法不强制要求事先将网络流量特征化，也可以将原始的网络数据进行简单编码后输送到神经网络中。神经网络先将这些编码映射到一组高维向量，然后对其进行卷积、池化、递归计算等操作，从而提取出隐藏特征。一般而言为了加强学习到的特征表达，会加深网络的层数，这就是“深度神经网络”的由来。在多层的特征提取操作后，一般会在最后结合线性层和Softmax层来进行分类。
[...

【技术保护点】

【技术特征摘要】
1.一种用于流量分类的神经网络架构自动搜索方法，其特征在于，包括以下步骤：获取网络流量数据样本，将所述数据样本进行预处理并转成二维矩阵形式的流量数据集；将所述流量数据集分别划分成训练集、验证集和测试集；在所述流量数据集划分后，构建神经网络架构的搜索空间的可选操作；基于所述搜索空间的可选操作，搜索最优的神经网络架构；其中包括，搜索最优的Cell结构，重复搜索堆叠相同的Cell结构，将搜索的Cell结构形成整个神经网络架构。2.根据权利要求1所述的用于流量分类的神经网络架构自动搜索方法，其特征在于，所述方法还包括：在每个Cell的输出位置加上空间注意力和通道注意力；保存搜索出来的Cell架构参数，并使用所述训练集和所述验证集合并成的新训练集进行重新训练Cell架构。3.根据权利要求2所述的用于流量分类的神经网络架构自动搜索方法，其特征在于，在获取网络流量数据样本，将所述数据样本进行预处理并转成二维矩阵形式的流量数据集中包括：步骤一:在网络流粒度进行数据提取；步骤二:在数据包粒度进行数据提取；步骤三：将在网络流粒度提取数据和在数据包粒度提取的数据沿通道维度进行拼接组成张量；步骤四：对所有网络流进行上述第一步至第三步的操作，构建格式化的流量数据集。4.根据权利要求2所述的用于流量分类的神经网络架构自动搜索方法，其特征在于，在将所述流量数据集分别划分成训练集、验证集和测试集中包括：所述训练集、验证集及测试集中含有相同比例的各类别流量；其中，所述训练集用于更新该结构中的网络权重参数；所述验证集用于搜索最佳的网络结构参数；所述测试集用于在搜索完成后使用训练集加验证集进行重新训练、并在测试集上评测最终结果。5.根据权利要求2所述的用于流量分类的神经网络架构自动搜索方法，其特征在于，所述构建搜索空间的可选操作中包括：限定搜索神经网络架构空间的范围。6.根据权利要求5所述的用于流量分类的神经网络架构自动搜索方法，其特征在于，所述神经网络架构的搜索空间的可选操作为设置为：3x3深度可分离卷积、5x5深度可分离卷积、3x...

【专利技术属性】
技术研发人员：林鹏，叶可江，须成忠，
申请(专利权)人：中国科学院深圳先进技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人