基于格拉姆角场变换的Tor用户访问网站识别方法及系统技术方案

技术编号:34030649 阅读:39 留言:0更新日期:2022-07-06 11:02
本发明专利技术属于匿名通信系统Tor技术领域,特别涉及一种基于格拉姆角场变换的Tor用户访问网站识别方法及系统,该方法首先提取用户访问网站时产生的流量数据包中的信元特征序列,然后通过格拉姆角场变换将一维信元特征序列转换成二维特征序列矩阵;其次利用符号聚合近似(SAX)对二维特征序列矩阵进行降维和符号化表示,降低分类过程中的时间和空间消耗,最后使用现有基于CNN的二维矩阵深度学习模型利用深度学习技术学习所有生成的二维特征序列矩阵,完成对用户访问流量的识别分类,进而识别出用户所访问的网站。本发明专利技术提出的GDF方法尤其在采用防御措施以及洋葱服务的场景下,网站指纹识别准确率明显优于现有方法。识别准确率明显优于现有方法。识别准确率明显优于现有方法。

Recognition method and system of tor user visiting website based on gram angle field transformation

【技术实现步骤摘要】
基于格拉姆角场变换的Tor用户访问网站识别方法及系统


[0001]本专利技术属于匿名通信系统Tor
,特别涉及一种基于格拉姆角场变换的Tor用户访问网站识别方法及系统。

技术介绍

[0002]随着互联网的日益发展,人们越来越重视对个人隐私的保护,对匿名通信的需求也越来越高。Tor作为目前最受欢迎的匿名通信系统,每天为超过200 million的用户提供匿名通信服务。Tor在建立链路的过程中,需要随机选择三个中继。如果有敌对者在数据传输的过程中截取数据包,所获数据包的源地址和目的地址会根据其被截获的地点而变化。另外,传输的数据均进行了多重加密,想要破解数据内容是十分困难的。因此,敌对者很难通过Tor获取用户访问的有效信息。但是以前的工作证明,网站指纹攻击(Website Fingerprint,WF)能够降低Tor的匿名性,将用户以及其访问的网站关联起来。由于每个网站的架构不同,用户在访问不同网站时流量差异很大。用户在加载图片以及音频等大型文件时,流量会出现较大的突发。另外,网页内容也会影响整个数据流的数据包数量。在WF攻击中,执法者首先需本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于格拉姆角场变换的Tor用户访问网站识别方法,其特征在于,包含以下步骤:构造一个执法者感兴趣的受监控网站集合;循环访问受监控网站集合中的元素,在访问过程中捕获流量数据包;提取所收集流量数据包中的数据发送方向信息,对于每一条流量实例,生成一个由数据发送方向构成的信元特征序列;对每一条流量实例所对应的信元特征序列进行格拉姆角场变换,将其转换成二维特征序列矩阵;利用符号聚合近似对二维特征序列矩阵进行降维处理;将每个流量实例所对应的经过降维处理后的二维特征序列矩阵以及网站标签进行对应,将所有流量实例整合,分别生成数据集和标签集存储于数据库中;由于数据集的输入是二维矩阵,因此选择合适的二维矩阵深度学习模型,并且预设模型参数;从数据库中提取数据集和标签集构成训练集训练二维矩阵深度学习模型的参数,通过训练选择出最佳参数;监听受监控用户,提取其访问过程中的流量数据包,将其进行按照训练集的数据处理方法处理未知流量,获取未知流量的二维特征序列矩阵;使用训练后的二维矩阵深度学习模型对未知流量的二维特征序列矩阵进行分类,通过分类结果所示的标签来判别未知流量所属网站。2.根据权利要求1所述的基于格拉姆角场变换的Tor用户访问网站识别方法,其特征在于,提取信元特征序列包括:将流量数据包的原始信元序列映射到[+1,

1]的值域中,规定数据流入执法者的方向为“+1”,数据流出执法者的方向为
“‑
1”,通过此方法提取信元特征序列。3.根据权利要求1所述的基于格拉姆角场变换的Tor用户访问网站识别方法,其特征在于,对每一条流量实例所对应的信元特征序列进行格拉姆角场变换,将其转换成二维特征序列矩阵,包括:对于一维信元特征序列X={x1,x2,

,x
n
},首先将每个信元值缩放到[

1,1]或者[0,1]的值域中,如公式(1)和公式(2)所示:的值域中,如公式(1)和公式(2)所示:将信元特征序列缩放后,将其转换到极坐标系下表示,用角的余弦值表示信元数值,用时间戳t表示半径r,如公式(3)所示:将信元特征序列缩放到不同的值域,所对应的角度范围也不同,如果值域的范围为[

1,1],则对应的角范围为[0,π],如果值域的范围为[0,1],则对应的角范围为[0,π/2];将信元特征序列转换到极坐标系后,通过三角函数的和/差来评估信元特征序列在不
同时间间隔内的时间相关性,格拉姆角和场GASF和格拉姆角差场GADF的定义如公式(4)和公式(5)所示:公式(5)所示:其中,I是单位行向量,是缩放后的信元特征序列,是的转置矩阵;假设一维信元特征序列X长度为n,那么GASF和GADF分别能够通过列向量与行向量相乘的方式把信元特征序列转换成n
×
n矩阵。4...

【专利技术属性】
技术研发人员:罗向阳孙玉宸王菡马照瑞李玲玲刘粉林
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1