一种加密流量的服务与应用分类方法及系统技术方案

技术编号：22471150 阅读：60 留言：0更新日期：2019-11-06 12:57

本发明专利技术公开了一种加密流量的服务与应用分类方法及系统。本方法为：1)按照会话粒度将待处理的连续流量切分为多个会话流量；2)对处理后的各会话流量按照数据包粒度进行切分，将每一会话流量切分为多个流量组，每一流量组中的数据包个数不超过设定的最大值；3)将各流量组的大小进行统一，然后将每一流量组转换为一流量矩阵，并将流量矩阵及其标签封装为IDX流量文件；4)用上述IDX流量文件训练CapsNet模型，得到具有自动特征选择能力的识别模型；5)对于一待识别加密流量，对其进行划分并转换为流量矩阵然后输入到该识别模型，得到该待识别流量所属的服务类型和应用类别。本发明专利技术可对加密流量进行有效分类。

A service and application classification method and system for encrypted traffic

全部详细技术资料下载

【技术实现步骤摘要】
一种加密流量的服务与应用分类方法及系统
本专利技术提出了一种加密流量的服务与应用分类方法，它提出了一种新型的流量二次切分机制，同时结合胶囊神经网络(CapsNet)实现加密流量的有效分类，本专利技术涵盖原始流量的转换、基于CapsNet的模型训练、加密流量的分类，属于网络安全与计算机科学的交叉

技术介绍
近年来，随着互联网技术与信息科学技术的不断发展，网络流量呈爆发式增长。根据思科发布的可视化网络指数预测报告，在公共和私有网络上传送的IP流量数据，包括托管IP流量、消费者生成的移动数据流量以及互联网流量，2017年全球平均每月产生122EB(1EB＝220TB)的流量数据，而到2022年全球IP流量将增加两倍，达到每月396EB。与此同时，随着网民对网络世界的需求不断发生变化，使得各种新型业务层出不穷。这些新型业务给网民带来便利的同时，也增加了网络的异构性与复杂性，这给网络安全带来了前所未有的挑战。在网络安全方面，近年来网络安全已经成为互联网所面临的核心问题之一，信息泄露、非法入侵、DDoS攻击等恶意网络行为越来越影响用户对互联网的使用，并且随着技术的发...

【技术保护点】
1.一种加密流量的服务与应用分类方法，其步骤包括：1)按照会话粒度将待处理的连续流量切分为多个会话流量；2)对处理后的各会话流量按照数据包粒度进行切分，将每一会话流量切分为多个流量组，每一流量组中的数据包个数不超过设定的最大值；3)将各流量组的大小进行统一，然后将每一流量组转换为一流量矩阵，并将流量矩阵及其标签封装为IDX流量文件；4)用上述IDX流量文件训练CapsNet模型，得到具有自动特征选择能力的识别模型；5)对于一待识别加密流量，对其进行划分并转换为流量矩阵然后输入到该识别模型，得到该待识别流量所属的服务类型和应用类别。

【技术特征摘要】
1.一种加密流量的服务与应用分类方法，其步骤包括：1)按照会话粒度将待处理的连续流量切分为多个会话流量；2)对处理后的各会话流量按照数据包粒度进行切分，将每一会话流量切分为多个流量组，每一流量组中的数据包个数不超过设定的最大值；3)将各流量组的大小进行统一，然后将每一流量组转换为一流量矩阵，并将流量矩阵及其标签封装为IDX流量文件；4)用上述IDX流量文件训练CapsNet模型，得到具有自动特征选择能力的识别模型；5)对于一待识别加密流量，对其进行划分并转换为流量矩阵然后输入到该识别模型，得到该待识别流量所属的服务类型和应用类别。2.如权利要求1所述的方法，其特征在于，第i个会话流量Si中的第j个流量组为Gij；其中Gij＝{p1＝(x1,b1,t1),...,pm＝(xm,bm,tm)}、m是Gij中的数据包数量，C是设定的数据包最大数量，会话流量Si中第i个数据包pi＝(xi,bi,ti)，xi是第i个数据包的五元组，bi是第i个数据包的字节长度，ti是第i个数据包的开始时间，|Si|为会话流量Si中的数据包总数。3.如权利要求2所述的方法，其特征在于，其中，Lsample表示存储流量组的文件字节长度，Lheader表示存储流量组的文件的文件头字节长度，Lpacket表示数据包的字节长度。4.如权利要求1所述的方法，其特征在于，对每一会话流量进行数据清洗，删除Mac地址和IP地址；然后进行步骤2)。5.如权利要求1所述的方法，其特征在于，将流量组转换为流量矩阵的方法为：将流量组的一维流量编码顺序转换成二维的流量矩阵；其中统一大小的流量组为784字节，转换后的流量矩阵为28*28的流量矩阵。6.如权利要求1所述的方法，其特征在于，用IDX流量文件训练CapsNet模型的方法为：首先利用第一卷...

【专利技术属性】
技术研发人员：崔苏苏，卢志刚，姜波，徐健锋，刘松，崔泽林，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人