一种加密流量分类方法及服务器、计算机可读存储介质技术

技术编号:19352401 阅读:197 留言:0更新日期:2018-11-07 17:35
本发明专利技术公开了一种加密流量分类方法及服务器、计算机可读存储介质。本方法包括训练阶段和分类阶段,其中训练阶段:获取加密应用的加密流量并标注,得到一训练集合;从该训练集合中分别提取每一加密应用的message type序列并统一转化为对应的编码序列,并根据应用的包长度序列计算该应用的代表长度序列;利用每一应用的编码序列构建Message type马尔科夫转移矩阵,根据代表长度序列构建长度马尔科夫转移矩阵;将编码序列、代表长度序列分别输入对应转移矩阵,生成对应应用的加密流量的指纹;将各指纹输入分类模型中训练,得到分类模型;分类阶段:对于将要分类的数据流,将该数据流的指纹输入训练后的分类模型中进行分类。

【技术实现步骤摘要】
一种加密流量分类方法及服务器、计算机可读存储介质
本专利技术涉及一种基于多维属性马尔科夫概率指纹的加密流量分类方法及服务器、计算机可读存储介质,属于计算机网络

技术介绍
随着信息技术和网络通讯不断发展,网络流量的规模急剧增长。为了更好的保证合法用户的上网安全,海量网络流量数据需要被合理的处理和分析,这无疑为网络管理和异常检测带来了巨大的挑战。网络流量分类作为网络流量分析和检测的第一步至关重要,因此也吸引了学术界和工业界的广泛关注。目前网络流量分类方法主要分为3大类:1)基于端口匹配的流量分类方法,2)基于数据包载荷匹配的流量分类方法(也被称作深度报文解析),3)基于统计属性的流量分类方法。传统的流量分类方法更侧重于方法1)和2),主要针对流量中的特征字段或者特征域进行正则匹配,从而进行流量识别(例如P2P流量识别等)。这两种方法也被称作基于规则匹配的流量分类方法。然而随着人们对于网络隐私和通讯安全需求的不断加剧,网络中的加密流量(例如SSL/TLS加密流量)在总流量中的占比逐渐增多。不同于传统的明文流量如HTTP流量,加密流量将用户的通讯数据利用加密算法和随机数进行随机化处本文档来自技高网...

【技术保护点】
1.一种加密流量分类方法,其步骤包括:训练阶段:(1)选取多种加密应用,对于选取的每一加密应用,获取该加密应用的加密流量并标注,得到一训练集合;(2)从该训练集合中分别提取每一所述加密应用的属性;其中,所述属性包括加密应用的message type序列和包长度序列,message type序列为消息类型序列;然后将各所述message type序列统一转化为对应的编码序列,并根据每一包长度序列计算对应加密应用的代表长度序列;(3)针对每个所述加密应用,利用该加密应用对应的所述编码序列构建Message type马尔科夫转移矩阵并放入模型池中,根据该加密应用的所述代表长度序列构建长度马尔科夫转移...

【技术特征摘要】
1.一种加密流量分类方法,其步骤包括:训练阶段:(1)选取多种加密应用,对于选取的每一加密应用,获取该加密应用的加密流量并标注,得到一训练集合;(2)从该训练集合中分别提取每一所述加密应用的属性;其中,所述属性包括加密应用的messagetype序列和包长度序列,messagetype序列为消息类型序列;然后将各所述messagetype序列统一转化为对应的编码序列,并根据每一包长度序列计算对应加密应用的代表长度序列;(3)针对每个所述加密应用,利用该加密应用对应的所述编码序列构建Messagetype马尔科夫转移矩阵并放入模型池中,根据该加密应用的所述代表长度序列构建长度马尔科夫转移矩阵并放入模型池中;(4)将加密应用的所述编码序列分别输入所述模型池中每一messagetype马尔科夫转移矩阵矩阵、将加密应用的所述代表长度序列分别输入所述模型池中每一长度马尔科夫转移矩阵,根据输出结果生成对应加密应用的加密流量的指纹;(5)将得到的各所述指纹输入分类模型中进行训练,得到对所选加密应用的加密流量进行分类的分类模型;分类阶段:对于将要分类的数据流,根据该数据流的编码序列和代表长度序列生成该数据流的指纹,并输入训练后的分类模型中进行分类。2.如权利要求1所述的方法,其特征在于,将各所述messagetype序列统一转化为对应的编码序列的方法为:统计所有所述messagetype序列中出现的messagetype字段的个数,并对出现的messagetype字段进行编码,不同messagetype字段具有不同编码;然后将各...

【专利技术属性】
技术研发人员:李镇曹自刚熊刚刘畅
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1