【技术实现步骤摘要】
基于Meek传输插件的自适应混淆方法、系统及计算机存储介质
本专利技术属于Tor匿名通信技术,具体涉及一种基于Meek传输插件的自适应混淆方法、系统及计算机存储介质。
技术介绍
Tor是目前应用最为广泛的匿名通信系统。为了抵御流量分析和网络监管,Tor引入了多种传输插件对其流量进行混淆。Meek作为Tor的一种传输插件,采用域名前置技术,它把Tor的流量伪装成访问云服务(如微软云)平台的流量,实质是提供了一种特殊的隧道,那么针对包头域名的识别成为了不可能,能够绕过恶意攻击者的阻拦,一般的恶意攻击者只能观察到网络数据包,例如传入/传出数据包上的编号,每个网络数据包的PS、IPT以及数据包方向(PD),从而能有效地抵御流量分析攻击,成功建立与Tor网桥的连接。但基于Meek伪装的Tor流量目前有被相关研究通过机器学习成功识别,具体的,恶意攻击者收集端口进出的所有类型流量,通过提取它们的数据包特征成功识别了Tor流量,这使得其安全性受到了质疑,传统的混淆方法采用的大多是相对固定的模式进行流量伪装,且其应用后的系统性
【技术保护点】
1.一种基于Meek传输插件的自适应混淆方法,其特征在于:依次包括以下步骤:/n(1)、使用流量采集器在用户端流量发送端口拦截用户行为产生的n种用户行为流量,所述用户行为流量包括基于Meek插件的Tor流量,然后分别收集n种用户行为流量各自的前m个数据包集合;/n(2)、将步骤(1)所得数据包集合输入至包特征提取工具,使用包特征提取工具提取用户行为流量的数据包特征及对应的概率分布;/n(3)、针对步骤(1)所提取的用户行为流量进行目标流量选择,即:采用流特征提取工具提取流特征向量,并对流特征向量进行标准化处理并进行PCA降维,然后通过K-means聚类算法,从全部用户行为流 ...
【技术特征摘要】
1.一种基于Meek传输插件的自适应混淆方法,其特征在于:依次包括以下步骤:
(1)、使用流量采集器在用户端流量发送端口拦截用户行为产生的n种用户行为流量,所述用户行为流量包括基于Meek插件的Tor流量,然后分别收集n种用户行为流量各自的前m个数据包集合;
(2)、将步骤(1)所得数据包集合输入至包特征提取工具,使用包特征提取工具提取用户行为流量的数据包特征及对应的概率分布;
(3)、针对步骤(1)所提取的用户行为流量进行目标流量选择,即:采用流特征提取工具提取流特征向量,并对流特征向量进行标准化处理并进行PCA降维,然后通过K-means聚类算法,从全部用户行为流量中获得用以混淆Meek流量的初始目标流量集合L;
(4)、通过模拟混淆器内置的最优目标流量选择法分析选出初始目标流量集合L中基于数据包特征层面的最优目标流量,并采用非线性规划方法在不同的混淆模式下进行模拟混淆,生成基于不同模式与数据包特征的变形实施表,然后通过分类器评估获得最优变形策略以及对应的变形实施表;
(5)、针对步骤(3)所获得的最优变形策略和变形实施表,将后续缓存的Meek流量进行实际变形,并将混淆成功后的Meek流量通过网络转发设备发送至云服务器,转发后到达Tor网桥实现Tor匿名传输;
(6)、重复步骤(1)至步骤(3),根据系统自动更新最优目标流量,实现动态混淆,模糊变形模式;同时,重复步骤(4)至步骤(5),提高Meek流量不可观测性以及保持变形的低开销且维持通信效率。
2.根据权利要求1所述的基于Meek传输插件的自适应混淆方法,其特征在于:所述步骤(2)中数据包特征提取时,提取范围覆盖步骤(1)提取的所有用户行为流量的完整流量序列,数据包特征提取数据包大小PS、数据包间隔时间IPT和数据包方向PD,并提取数据包大小PS和数据包间隔时间IPT对应的概率分布。
3.根据权利要求1所述的基于Meek传输插件的自适应混淆方法,其特征在于:所述步骤(3)中流特征提取时,TCP流以相同的源与目标套接字划分,UDP流则以超时300秒划分,每条流提取28维流特征向量;然后通过肘部法则获得K值,再进行K-means聚类,统计Meek流量特征向量比重最大的聚类中心,并分析其余非Meek流量特征向量在该聚类中心范围内的比重,获得与Meek流量模式相似的流量集合,即初始目标流量集合L;
其中,流特征向量包括28维与数据包特征较强关联的流特征,作为K-mean聚类算法的输入参数。
4.根据权利要求1所述的基于Meek传输插件的自适应混淆方法,其特征在于:所述步骤(4)中使用包特征提取工具提取初始目标流量集合L的数据包特征及对应的概率分布,将提取到的数据包特征输入至最优目标流量选择法,计算初始目标流量集合L中的流量与Meek流量的相似度,获得最优目标流量;将其数据包特征及对应的概率分布结合限定的三个约束条件来计算非线性规划的目标函数f(T),最小化不同混淆模式下的变形策略tji,进而生成基于不同模式与数据包特征的变形实施表,并通过训练好的分类器识别混淆结果,分析对于不同变形策略的识别结果以及产生的开销,并将最优策略生成的变形实施表;
其中,i、j分别表示输入的Meek流量与目标流量的数据包特征序列;
X=(x1,x2,…,xn)T、Y=(y1,y2,…,yn)T分别表示i、j对应的概率分布;
三个约束条件依次为:
目标函数为:
xi为Meek流量的数据包特征i对应的出现概率;tji为Meek流量数据包特征i变为最优目标流量数据包特征j的概率;
上述目标函数中定义两部分度量标准,分别为混淆开销与混淆前后流量不可观测性,并给出两部分度量标准的超参数α,β∈[0,1],其中超参数取值为小数点后一位,其中当α>β时为低开销模式,反之为高匿名模式,通过系统自适应或用户需求设定,遍历超参数,得到对应的变形策略。
5.根据权利要求4所述的基于Meek传输插件的自适应混淆方法,其特征在于:所述最优目标流量选择法根据用户需求给出的偏好选项,分析流量在特定的两种数据包特征层面上的相似度,然后选出最优目标流量,具体方法为:
将初始目标流量集合L中的每种用户行为流量标签及流...
【专利技术属性】
技术研发人员:王良民,谢皓曜,殷尚男,黄龙霞,赵蕙,冯丽,陈向益,
申请(专利权)人:江苏大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。