【技术实现步骤摘要】
一种基于联邦学习的流量分类方法及系统
本专利技术涉及互联网技术和人工智能
,尤其涉及一种基于联邦学习的流量分类方法。
技术介绍
随着互联网的发展,网络流量的爆炸增长与有限的网络带宽的矛盾日益突出。流量分类是高性能网络协议和应用设计的基础,是网络运营管理、网络流量调度和网络发展规划的前提,也是提升网络管理水平、改善服务质量(QoS)的基础,它可以通过对不同流量进行优先级排序帮助互联网服务提供商(ISP)向其服务用户提供不同标准的QoS服务。流量分类技术主要分为三类。第一种是基于端口号进行流量分类。然而,随着动态端口、端口混淆、NAT等技术的发展,它的准确性越发降低。第二种是基于有效负载检测(DPI)进行流量分类,通过在数据包中查找模式或关键字确定流量类型。当今互联网的加密通信量急剧攀升,而加密数据的伪随机格式几乎不包含任何识别网络流量的关键字特征,因此基于有效载荷的分类方法也面临着失效的风险。第三种方法是基于流量统计的分类方法。这些方法通过统计行为模式、会话窗口大小、时间序列等属性或使用数据包包头作为特征,并运用经典机器 ...
【技术保护点】
1.一种基于联邦学习的流量分类系统,通过传递梯度信息实现分类模型,其特征在于,由流量采集标记模块、特征提取处理模块、联邦深度分类器组成,/n所述流量采集标记模块被配置为:基于端口与应用类型映射表对数据报文进行标记分类;/n所述特征提取处理模块被配置为:进行数据包分组、数据预处理和合并上传操作,所述合并上传为上传数据集至联邦学习客户端;/n所述联邦深度分类器被配置为:/n训练初始化:确定参与训练的客户端与服务器,客户端间进行加密后的数据特征对齐,服务器将CNN模型框架及公钥分发给客户端;/n梯度训练:客户端将本地的数据输入至本地CNN模型中进行训练得到梯度,然后将梯度加密上传 ...
【技术特征摘要】
1.一种基于联邦学习的流量分类系统,通过传递梯度信息实现分类模型,其特征在于,由流量采集标记模块、特征提取处理模块、联邦深度分类器组成,
所述流量采集标记模块被配置为:基于端口与应用类型映射表对数据报文进行标记分类;
所述特征提取处理模块被配置为:进行数据包分组、数据预处理和合并上传操作,所述合并上传为上传数据集至联邦学习客户端;
所述联邦深度分类器被配置为:
训练初始化:确定参与训练的客户端与服务器,客户端间进行加密后的数据特征对齐,服务器将CNN模型框架及公钥分发给客户端;
梯度训练:客户端将本地的数据输入至本地CNN模型中进行训练得到梯度,然后将梯度加密上传至服务器;
模型确定:服务器对收到的所有用户的梯度数据进行聚合,得到联合CNN模型参数;客户端根据所述联合CNN模型参数更新各自的模型,计算模型对流量进行分类的准确率,判断准确率的提升是否均小于预设的阈值,若是,则得到最终的CNN模型。
2.根据权利要求1所述的基于联邦学习的流量分类系统,其特征在于,
所述应用类型映射表的建立方法是:客户端捕捉本地流量,通过端口查找对应进程,建立本地端口与应用类型映射表。
3.如权利要求1所述的基于联邦学习的流量分类系统,其特征在于,
所述对数据包分组为:对数据包进行分组,按照时间顺序提取前16个数据包的包头;
所述数据预处理为:将数据包各个字节解释为0-255的整数,对各个干扰字段置0,进行匿名化处理;
所述合并上传时,将处理后的前16个数据包的包头合并作为一项数据,以数据包的标签作为数据的标签,上传至联邦学习客户端。
4.如权利要求3所述的基于联邦学习的流量分类系统,其特征在于,对数据包进行分组时,以(源地址、源端口号、目的地址、目的端口号、协议)五元组作为标识,对在客户端与服务器之间双向流动的数据包进行分组。
5.如权利要求3所述的基于联邦学习的流量分类系统,其特征在于,所属干扰字段包括Mac地址、IP地址、端口、报头校验和。
6.如权利要求1所述的基于联邦学习的流量分类系统,其特征在于,所述将本地的数据输入至本地CNN模型中,是先将本地的数据转换为16*54的矩阵,再作为图...
【专利技术属性】
技术研发人员:祝旭峰,束妮娜,王怀习,李旺宗,马祖发,王晨,黄郡,吴一尘,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。