The invention provides an encryption traffic classification method based on end-to-end sequential network. The main idea is to start from the sequence characteristics of encryption traffic and retain the characteristics of information for a period of time by means of cyclic neural network, so as to dig in-depth effective context information from the encrypted traffic sequence, and to enhance the generation characteristics by combining supervised classification and unsupervised reconstruction mechanism. Distinguishability. The invention also provides a computer device which can execute a computer program that executes the steps described in the method of the invention. The invention also provides a computer program storage device, which executes the steps described in the method of the invention. The method and device provided by the invention have the advantages of automatic learning, integrated learning, key information retention and generalization, etc.
【技术实现步骤摘要】
一种基于端到端序列网络的加密流量分类方法
:本专利技术属于网络安全
,涉及一种网络流量分类方法,尤其涉及一种基于端到端序列网络的加密流量分类方法。
技术介绍
:网络流量分类一直是网络管理和网络空间安全面临的重要任务。网络管理方面,为保证网络的服务质量和用户的上网体验,大量复杂的流量需要按需分类,进而采用不同的优先级策略进行处理。在网络空间安全方面,入侵检测是保证用户上网安全的关键步骤,在被动流经的网络流量中,恶意网络流量需要从用户合法网络流量中识别并过滤。近几年,为保护用户的通讯隐私,加密技术逐渐用于网络通信中,这使得大量应用采用加密通讯,致使加密流量迅猛增加。面对海量并且不断增长的加密流量,传统的基于规则的方法不能对其有效识别和分类。其主要原因在于,经过加密算法和加密因子的随机化处理后,通讯内容被加密成为随机化的密文,并且根据密码学原理,密文难以在短时间内被破解,因此无法利用基于载荷的方法进行匹配识别。而加密流量在给用户带来安全通讯的同时,也给许多不法分子带来可乘之机,这使得网络监管部门难以有效识别和处理。因此,如何分类加密流量成为研究热点,也引起了学术界和工业界的广泛关注。目前针对加密流量分类问题,方法大致可分为2类:1、基于统计属性结合传统机器学习算法:尽管加密流量负载不能被有效解密,但是可以利用加密流量中握手阶段的明文字段和流量的统计属性帮助进行分类。目前加密流量可以使用到的信息可以分为3个大的层面:1)加密流量的底层原始信息:包括原始数据流中源/目的端口、单向/双向通信的包数,单向/双向通信的字节数及流的持续时间等。2)包层面的信息:包括如 ...
【技术保护点】
1.一种基于端到端序列网络的加密流量分类方法,其步骤包括:1)、采集带标签的加密流量,得到每个加密流的序列信息以及对应的标签数据;2)、将得到的序列信息中的每个元素进行多维嵌入,生成该序列信息的嵌入矩阵;3)、将嵌入矩阵输入通过GRU构建的双向编码结构中,并进行多层堆叠编码;4)、串联多层堆叠编码结果形成该序列信息的编码特征表示向量;5)、将编码特征表示向量输入GRU构建的多层堆叠的双向解码结构中,解码得到解码特征表示向量,分类后与序列信息进行拟合,得到重构损失函数L1;6)、将编码特征表示向量和解码特征表示向量合并作为最终特征向量,分类后与标签数据拟合,得到分类损失函数L2;7)、对L=L1+L2进行最小化处理,迭代形成稳定L后得到流序列网络分类模型F;8)、提取待分类的加密流量的序列信息,通过上述流序列网络分类模型F进行分类。
【技术特征摘要】
1.一种基于端到端序列网络的加密流量分类方法,其步骤包括:1)、采集带标签的加密流量,得到每个加密流的序列信息以及对应的标签数据;2)、将得到的序列信息中的每个元素进行多维嵌入,生成该序列信息的嵌入矩阵;3)、将嵌入矩阵输入通过GRU构建的双向编码结构中,并进行多层堆叠编码;4)、串联多层堆叠编码结果形成该序列信息的编码特征表示向量;5)、将编码特征表示向量输入GRU构建的多层堆叠的双向解码结构中,解码得到解码特征表示向量,分类后与序列信息进行拟合,得到重构损失函数L1;6)、将编码特征表示向量和解码特征表示向量合并作为最终特征向量,分类后与标签数据拟合,得到分类损失函数L2;7)、对L=L1+L2进行最小化处理,迭代形成稳定L后得到流序列网络分类模型F;8)、提取待分类的加密流量的序列信息,通过上述流序列网络分类模型F进行分类。2.如权利要求1所述的基于端到端序列网络的加密流量分类方法,其特征在于,所述序列信息转换为可计算的数值形式。3.如权利要求1或者2所述的...
【专利技术属性】
技术研发人员:杨青娅,李镇,郭莉,刘畅,管洋洋,李真真,熊刚,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。