一种基于图神经网络的包粒度网络流量分类方法技术

技术编号：35863378 阅读：21 留言：0更新日期：2022-12-07 10:54

本发明专利技术公开了一种基于图神经网络的包粒度网络流量分类方法，包括如下步骤：S1、数据包图构建：将数据包内的字节作为节点，字节与字节间的相关信息作为边，来将数据包转换为一个无向图，得到数据包图；S2、表征学习：利用两层图卷积网络学习所述数据包图中每个节点的表征，并将这些节点的表征进行聚合，得到所述数据包图的表征；S3、分类：将所述数据包图的表征送入分类层，输出网络流量分类结果。本发明专利技术将数据包转换为图像图后，利用图神经网络强大的处理复杂图的能力来分析数据包结构，更好地学习数据包图的表征，有助于显著提升网络流量分类效果和分类准确率。类效果和分类准确率。类效果和分类准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图神经网络的包粒度网络流量分类方法

[0001]本专利技术涉及计算机网络与电子信息
，具体涉及一种基于图神经网络的包粒度网络流量分类方法。

技术介绍

[0002]互联网和信息技术是当今世界科学技术研究中发展最为快速的技术之一。我国自接入国际互联网以来，在短短二十多年内，经历了从国际跟跑到国际并跑，再到未来可期的国际领跑三大跨越，取得的巨大成就有目共睹。截至到2018年6月，我国的网民人数已经达到8.02亿，互联网普及率达57.7％，发展速度可谓惊人。互联网技术因其方便快捷，移动性好，价格低廉等特点，正在改变着人们的生活方式。小到聊天、购物、娱乐，大到航天航空、武器导弹都离不开互联网。互联网的飞速发展推动了全球化的生产和生活方式的深刻变革。随着网络理论技术的发展、网络硬件性能的不断增强，整个互联网的流量规模也在不断地增加。人民生活水平的提高推动着网络应用技术的进一步发展，促使网络供应商不断地提升网络服务的水平。如今，现代互联网的流量的多样性和复杂性远远超出了当初底层互联网架构者的想象。
[0003]网络流量是记录和反映网络活动及运营情况的重要载体。随着互联网的高速发展，为了满足互联网用户的多样化需求，各种新的网络服务层出不穷，导致网络流量无论是在数量还是种类上都不断增加。这些新型应用扩大了互联网的应用规模，提供了更丰富的网络服务。但是其采用的应用协议特征也有别于传统的应用类型，变得更加复杂和多样化，给网络流量的管理和规划造成了极大的冲击。
[0004]网络流量分类是指按照网络的应用类型(比...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的包粒度网络流量分类方法，其特征在于，包括如下步骤：S1、数据包图构建：将数据包内的字节作为节点，字节与字节间的相关信息作为边，来将数据包转换为一个无向图，得到数据包图；S2、表征学习：利用两层图卷积网络学习所述数据包图中每个节点的表征，并将这些节点的表征进行聚合，得到所述数据包图的表征；S3、分类：将所述数据包图的表征送入分类层，输出网络流量分类结果。2.如权利要求1所述的基于图神经网络的包粒度网络流量分类方法，其特征在于，在步骤S1之前，还包括对数据包进行预处理的步骤S01～S04：S01、只保留有效载荷的数据包；S02、去掉数据包的以太网报头和剩余的IP、传输报头和上层的有效载荷；S03、对于大于110字节的报文，保留前110字节，丢弃其余的字节；S04、匿名化源IP地址和目的IP地址以及端口。3.如权利要求1所述的基于图神经网络的包粒度网络流量分类方法，其特征在于，在步骤S1中，用点互信息来表征字节与字节间的相关信息。4.如权利要求3所述的基于图神经网络的包粒度网络流量分类方法，其特征在于，步骤S1中，通过求解数据包内任意两个字节之间的点互信息，来在点互信息为正值的节点之间构建边。5.如权利要求4所述的基于图神经网络的包粒度网络流量分类方法，其特征在于，数据包内的任意两个字节a与b之间的点互信息PMI(a,b)采用如下方式计算：方式计算：方式计算：方式计算：其中，#W为数据包字节序列中滑动窗口的总数，#W(a)是包含字节a的窗口数，#W(b)是包含字节b的窗口数，#W(a,b)是字节a与b同时出现的窗口数。6.如权利要求1所述的基于图神经网络的包粒度网络流量分类方法，其特征在于，步骤S2中，利用两层图卷积网络学习所述数据包图中每个节点的表征，节点表征的更新公式为：其中，矩阵是新学习到的节点表征；矩阵其中D为数据包图的邻接矩阵，为数据包图的度矩阵；矩阵H∈R
n
×
256
表示字节节点的初始表征；均为参数矩阵；k1和k2分别是W
(0)
和W
(1)
的列维度；n为节点个数；R为实数。7.如权利要求1所述的基于图神经网络的包粒度网络流量分类方法，其特征在于，步骤
S2中，采用均值法、注意力机制法或长短期记忆网络法来对所述数据包图中所有节点的表征进行聚合。8.如权利要求7所述的基于图神经网络的包粒度网络流量分类方法，其...

【专利技术属性】
技术研发人员：胡光武，毛科龙，但唐仁，廖龙，延霞，刘云霞，
申请(专利权)人：深圳信息职业技术学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人