【技术实现步骤摘要】
一种网站指纹识别防御方法、系统、装置及存储介质
[0001]本专利技术涉及计算机网络
,尤其涉及一种网站指纹识别防御方法、系统、装置及存储介质。
技术介绍
[0002]随着网络技术的快速发展,越来越多的人利用互联网进行日常工作和娱乐生活,但是网络在给大家带来生活便利的同时,个人的隐私信息很容易被黑客进行窃取和攻击,实施伪造和诈骗等犯罪活动,对用户人身财产安全等造成威胁。现今Tor网络是当前广泛使用的匿名通信网络,利用多跳代理机制的加密手段对用户IP地址和访问内容等隐私数据进行保护。然而,这种高度匿名网络被一些违法人员使用进行电信网络诈骗等犯罪活动。他们利用网站指纹(Website
‑
fingerprinting,WF)攻击来分析匿名网络用户所访问的网站,通过收集用户访问的流量,提取流量特征进行分析,使用机器学习和深度学习等技术训练分类模型识别出用户正在访问的网站类型,对用户的隐私信息和网络安全造成了巨大的威胁。
[0003]为了抵御网站指纹攻击,对访问用户的隐私进行有效保护,降低个人隐私泄露的 ...
【技术保护点】
【技术特征摘要】
1.一种网站指纹识别防御方法,其特征在于,包括:获取对象访问网站的流量数据和随机噪音,根据所述流量数据确定流量序列和网站类别标签;将所述网站类别标签和所述随机噪音输入到训练好的生成器,生成满足预设分布要求的扰动序列;所述预设分布包括高斯分布;根据所述扰动序列和所述流量序列生成通信序列。2.根据权利要求1所述的方法,其特征在于,所述生成器通过以下步骤训练得到:确定高斯分布序列的第一均值和第一方差,并根据所述第一均值和所述第一方差确定高斯分布序列;获取对象访问网站的流量样本数据,根据所述流量样本数据确定流量样本序列和网站类别样本标签,将网站类别样本标签和随机样本噪音输入到生成器,得到扰动样本序列;计算所述高斯分布序列与所述扰动样本序列的匹配度;根据扰动样本序列和流量样本序列生成通信样本序列,根据所述通信样本序列计算网站类别样本标签的置信度;根据所述匹配度和所述置信度确定损失值,根据所述损失值对生成器的参数进行调整,直至满足训练停止条件,得到训练好的生成器,所述训练停止条件包括所述损失值满足预设要求。3.根据权利要求2所述的方法,其特征在于,所述根据所述匹配度和所述置信度确定损失值,具体包括:确定所述匹配度的第一权重系数以及所述置信度的第二权重系数;计算所述匹配度与所述第一权重系数的第一乘积、以及所述置信度与所述第二权重系数的第二乘积,将所述第一乘积和所述第二乘积之和确定为损失值。4.根据权利要求1所述的方法,其特征在于,所述根据所述流量数据确定流量序列,具体包括:根据所述流量数据确定方向特征信息和数据包大小;获取流量序列的预设长度,根据所述方向特征信息和所述数据包大小生成预设长度的流量序列。5.根据权利要求4所述的方法,其特征在于,根据所述方向特征信息和所述数据包大小生成预设长度的流量序列,具体包括:依次将同一网站类别标签的方向特征信息相同的数据包进行累加,得到流量序列中的元素;当同一网站类别标签的数据包处理...
【专利技术属性】
技术研发人员:刘海政,蔡骋,李少君,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。