【技术实现步骤摘要】
一种HTTPS终端类型分类方法及装置
本专利技术涉及网络通信领域,特别涉及一种HTTPS终端类型分类及装置。
技术介绍
HTTPS终端类型分类是指在客户端和服务端通信时,对通信产生的HTTPS流量进行分析,得到客户端的终端类型。本专利技术主要考虑以下三大类别的终端类型:操作系统类型(如OSX、Windows和Ubuntu等)、浏览器类型(如Firefox、Safari等)、应用类型(如微信、微博、百度、淘宝和爱奇艺等)。本专利技术以(操作系统类型,浏览器类型,应用类型)三元组的形式定义终端类型。本专利技术进行HTTPS终端类型分类的基本对象是一个HTTPS流量会话。会话(Session)是客户端和服务端通信的过程,会话的建立是以客户端向服务端发送第一个请求数据包开始,以客户端断开连接或服务端会话超时结束。本专利技术的主要工作是在客户端和服务端通信过程中抓取HTTPS流量数据包;然后,将这些数据包按照源IP、目的IP地址划分成不同的会话;接着,从HTTPS流量会话中提取特征并训练终端类型分类模型;最后,在测试场景下将新 ...
【技术保护点】
1.一种HTTPS终端类型分类方法,其特征在于,包括:/n构造数据集;/n从HTTPS流量会话中提取流统计特征和密码套件列表;其中,所述流统计特征包括包长度、包到达时间间隔、拥塞窗口大小、包中标记字段和包数目中的一种或多种;/n构造终端类型分类模型;其中,所述终端类型分类模型包括MLP模型和注意力模块;/n利用所述流统计特征和密码套件列表对所述终端类型分类模型进行训练;/n对训练后的所述终端类型分类模型进行剪枝;/n使用剪枝后的终端类型分类模型对HTTPS终端类型进行分类。/n
【技术特征摘要】
1.一种HTTPS终端类型分类方法,其特征在于,包括:
构造数据集;
从HTTPS流量会话中提取流统计特征和密码套件列表;其中,所述流统计特征包括包长度、包到达时间间隔、拥塞窗口大小、包中标记字段和包数目中的一种或多种;
构造终端类型分类模型;其中,所述终端类型分类模型包括MLP模型和注意力模块;
利用所述流统计特征和密码套件列表对所述终端类型分类模型进行训练;
对训练后的所述终端类型分类模型进行剪枝;
使用剪枝后的终端类型分类模型对HTTPS终端类型进行分类。
2.根据权利要求1所述的HTTPS终端类型分类方法,其特征在于,所述构造数据集进一步包括:
统计跟踪标签的应用类型相关的网址;
重复打开浏览器、登陆网址、关闭浏览器,同时在客户端和服务端通信时,抓取数据包并形成数据流。
3.根据权利要1所述的HTTPS终端类型分类方法,其特征在于,所述的从HTTPS流量会话中提取流统计特征,进一步包括:
将HTTPS会话中的所有数据包构成一个总流,将总流划分成上行流和下行流;其中,客户端发出的所有数据包构成上行流、客户端收到的所有数据包构成下行流;
对原始统计特征,分别计算总流、上行流和下行流的统计特征。
4.根据权利要求1所述的HTTPS终端类型分类方法,其特征在于,所述的从HTTPS流量会话中提取密码套件列表,进一步包括:
将每一种密码套件作为一维特征,构造一个多维的特征向量来代表密码套件列表特征,某一维取值为1代表客户端密码套件列表中包含该密码套件,取值为0则代表不包含。
5.根据权利要求1所述的HTTPS终端类型分类方法,其特征在于,所述构造终端类型分类模型,进一步包括:
将所述终端类型分类模型的输入经过特征提取后得到的原始特征向量;
将所述原始特征向量输入注意力模块,所述注意力模块输出一组代表着不同特征权重的第一特征向量;
将所述第一特征向量和原始特征向量进行点乘,得到增加注意力机制的第二特征向量;
将所述增加注意力机制的第二特征向量输入MLP模型,将MLP模型输出层的输出和真实标签进行比较,从而计算Loss、反向传播梯度以及更新整个模型的参数。
6.根据权利要求5所述的HTTPS终端类型分类方法,其特征在于,在所述将所述终端类型分类模型的输入经过特征提取后得到的原始特征向量...
【专利技术属性】
技术研发人员:刁祖龙,张广兴,谢高岗,李彦彪,李振宇,马傲,武庆华,潘恒,
申请(专利权)人:网络通信与安全紫金山实验室,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。