【技术实现步骤摘要】
一种加密流量的服务与应用分类方法及系统
本专利技术提出了一种加密流量的服务与应用分类方法,它提出了一种新型的流量二次切分机制,同时结合胶囊神经网络(CapsNet)实现加密流量的有效分类,本专利技术涵盖原始流量的转换、基于CapsNet的模型训练、加密流量的分类,属于网络安全与计算机科学的交叉
技术介绍
近年来,随着互联网技术与信息科学技术的不断发展,网络流量呈爆发式增长。根据思科发布的可视化网络指数预测报告,在公共和私有网络上传送的IP流量数据,包括托管IP流量、消费者生成的移动数据流量以及互联网流量,2017年全球平均每月产生122EB(1EB=220TB)的流量数据,而到2022年全球IP流量将增加两倍,达到每月396EB。与此同时,随着网民对网络世界的需求不断发生变化,使得各种新型业务层出不穷。这些新型业务给网民带来便利的同时,也增加了网络的异构性与复杂性,这给网络安全带来了前所未有的挑战。在网络安全方面,近年来网络安全已经成为互联网所面临的核心问题之一,信息泄露、非法入侵、DDoS攻击等恶意网络行为越来越影响用户对互联网的使用,并且随着技术的发 ...
【技术保护点】
1.一种加密流量的服务与应用分类方法,其步骤包括:1)按照会话粒度将待处理的连续流量切分为多个会话流量;2)对处理后的各会话流量按照数据包粒度进行切分,将每一会话流量切分为多个流量组,每一流量组中的数据包个数不超过设定的最大值;3)将各流量组的大小进行统一,然后将每一流量组转换为一流量矩阵,并将流量矩阵及其标签封装为IDX流量文件;4)用上述IDX流量文件训练CapsNet模型,得到具有自动特征选择能力的识别模型;5)对于一待识别加密流量,对其进行划分并转换为流量矩阵然后输入到该识别模型,得到该待识别流量所属的服务类型和应用类别。
【技术特征摘要】
1.一种加密流量的服务与应用分类方法,其步骤包括:1)按照会话粒度将待处理的连续流量切分为多个会话流量;2)对处理后的各会话流量按照数据包粒度进行切分,将每一会话流量切分为多个流量组,每一流量组中的数据包个数不超过设定的最大值;3)将各流量组的大小进行统一,然后将每一流量组转换为一流量矩阵,并将流量矩阵及其标签封装为IDX流量文件;4)用上述IDX流量文件训练CapsNet模型,得到具有自动特征选择能力的识别模型;5)对于一待识别加密流量,对其进行划分并转换为流量矩阵然后输入到该识别模型,得到该待识别流量所属的服务类型和应用类别。2.如权利要求1所述的方法,其特征在于,第i个会话流量Si中的第j个流量组为Gij;其中Gij={p1=(x1,b1,t1),...,pm=(xm,bm,tm)}、m是Gij中的数据包数量,C是设定的数据包最大数量,会话流量Si中第i个数据包pi=(xi,bi,ti),xi是第i个数据包的五元组,bi是第i个数据包的字节长度,ti是第i个数据包的开始时间,|Si|为会话流量Si中的数据包总数。3.如权利要求2所述的方法,其特征在于,其中,Lsample表示存储流量组的文件字节长度,Lheader表示存储流量组的文件的文件头字节长度,Lpacket表示数据包的字节长度。4.如权利要求1所述的方法,其特征在于,对每一会话流量进行数据清洗,删除Mac地址和IP地址;然后进行步骤2)。5.如权利要求1所述的方法,其特征在于,将流量组转换为流量矩阵的方法为:将流量组的一维流量编码顺序转换成二维的流量矩阵;其中统一大小的流量组为784字节,转换后的流量矩阵为28*28的流量矩阵。6.如权利要求1所述的方法,其特征在于,用IDX流量文件训练CapsNet模型的方法为:首先利用第一卷...
【专利技术属性】
技术研发人员:崔苏苏,卢志刚,姜波,徐健锋,刘松,崔泽林,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。