一种基于身份行为混淆的抗网络追踪隐私保护方法及系统技术方案

技术编号:23512945 阅读:29 留言:0更新日期:2020-03-18 00:12
本发明专利技术公开了一种基于身份行为混淆的抗网络追踪隐私保护方法及系统。本方法为:1)为用户构建多个虚拟身份;2)行为拆分模块依次对用户真实行为链中发送的每一web服务操作请求分配一对应的虚拟身份;3)身份切换模块将该用户身份切换到当前分配的虚拟身份并执行所分配的web服务操作请求;并且行为生成模块为当前虚拟身份生成虚拟行为;所述虚拟行为是指模拟真实用户并未执行过的行为,向web服务发送虚拟请求,使虚拟身份的行为链完整;4)为该用户所分配的多个虚拟身份分别将返回结果反馈给结果融合模块进行融合,然后将融合结果返回给该用户所在的客户端。本发明专利技术使用多个身份进行访问,有效保护了用户隐私信息。

An anti tracking privacy protection method and system based on identity behavior confusion

【技术实现步骤摘要】
一种基于身份行为混淆的抗网络追踪隐私保护方法及系统
本专利技术属于网络空间安全与隐私保护领域,尤其涉及一种基于身份行为混淆的抗网络追踪隐私保护方法及系统。
技术介绍
随着互联网服务的蓬勃发展,用户的在线行为越来越多。各种web服务更加关注用户的在线行为,从而提供更准确的推荐和广告。无论用户是否登录网站,web服务总是识别用户并记录用户的行为。基于这些用户的身份和行为数据,web服务可以构建强大的广告服务。虽然推荐或广告可以给人们的网络生活带来一些便利,但它们也给用户的隐私带来了一定的威胁。首先身份服务方并不完全可靠,每年都有多起数据泄露事件,导致用户的个人身份信息泄露。同时,随着分析技术的发展,对手也可以通过大数据分析、轨迹分析和定向广告等方法利用连续的行为数据对用户的隐私属性信息,如性别、年龄、职业等进行推断。一般的防御方法主要有主动的针对用户行为本身的隐藏,和被动的针对身份服务商对用户个人信息的存储和使用方面的规定来保护用户个人身份信息。针对身份服务商对用户个人信息的存储和使用方面的保护技术,包括差分隐私、K匿名、泛化等去标识化技术。去标识化技术的核心方法是降低数据中的个人信息区分度,断开数据和个人信息主体的关联,即使数据泄露,也很难将数据描述的实体与真实用户关联起来。这种方法身份服务方依旧会获得用户的全量信息,再基于身份服务商的自主性和技术完备性进行保护,依靠第三方监管,该方法属于被动的保护方式。针对用户行为本身的隐藏,即主动的保护方法有:(1)主动修改用户行为记录,如修改用户对某个电影的评分或使用本地差分隐私技术对用户行为记录加噪声;(2)减少对用户历史信息的获取,如使用用户关联信息来进行推荐或删除部分用户行为记录,由于用户行为记录储存在服务器中,一旦发出难以修改,这两种方法仅能从理论分析,无法应用到真实场景中;(3)完全匿名的方法,比如使用TorBrowser等代理浏览器对个人行为进行隐藏,一方面会影响服务的可用性,另一方面,这些具备匿名功能的代理会被一些监管部门发现甚至禁止,很难兼顾用户对网络服务的开放性和安全性的要求。
技术实现思路
根据上述发展现状,本专利技术的目的在于提出一种基于身份行为混淆的抗网络追踪隐私保护方法及系统。本专利技术将行为序列进行拆分,使用多个身份进行访问,将各个身份的推荐结果进行融合,实现服务方只能对每个身份获取部分用户信息,无法使用全量信息进行隐私信息的推测。融合后的结果反馈给用户保持了一定的可用性。为了达到上述目的,本专利技术采用了以下方案:一种基于身份行为混淆的抗网络追踪隐私保护方法,其步骤包括:1)为用户构建多个虚拟身份;2)行为拆分模块依次对用户真实行为链中发送的每一web服务操作请求分配一对应的虚拟身份;3)身份切换模块将该用户身份切换到当前分配的虚拟身份并执行所分配的web服务操作请求;并且行为生成模块为当前虚拟身份生成虚拟行为;所述虚拟行为是指模拟真实用户并未执行过的行为,向web服务发送虚拟请求,使虚拟身份的行为链完整;4)为该用户所分配的多个虚拟身份分别将返回结果反馈给结果融合模块进行融合,然后将融合结果返回给该用户所在的客户端。进一步的,用户的客户端通过请求多个cookie或构造不同的浏览器指纹为该用户构建多个虚拟身份;所述身份切换模块通过切换cookie或浏览器指纹将用户身份切换到当前分配的虚拟身份。进一步的,客户端将用户请求中的cookie删除或替换为虚拟cookie,以生成该用户的虚拟身份;所述虚拟cookie是使用该用户请求目标服务时收集的web服务器真实发放的cookie。进一步的,所述客户端维护一虚拟身份列表,虚拟身份列表中记录信息包括虚拟身份、该虚拟身份访问的目标服务的相应关键字以及标识信息。进一步的,所述行为生成模块根据训练集选择与分配给当前虚拟身份执行的真实行为相似的未执行过的行为作为当前虚拟身份的虚拟行为。进一步的,所述行为拆分模块为每一web服务操作请求分配一对应的虚拟身份的方法为:所述行为拆分模块根据训练集为每个web服务操作请求计算出一个向量表示,并根据每个虚拟身份已有的行为计算出一个整体的向量;然后将当前web服务操作请求的向量与各虚拟身份的向量进行相似度计算,然后将当前web服务操作请求分配给最大相似度值对应的虚拟身份。进一步的,所述返回结果包括精确结果和推荐结果;所述准确结果是正常使用web服务不产生隐私信息的请求结果,所述结果融合模块将准确结果直接返回给用户;所述推荐结果是服务方根据用户历史行为提供的一个有序的物品列表。进一步的,所述结果融合模块采用启发式方法对返回的推荐结果进行融合,首先选择所有执行真实用户行为的虚拟身份,然后按照所选虚拟身份拥有的真实行为记录数量倒序对推荐结果进行排列,再以返回次序为优先级或以频率为优先级对虚拟身份返回的推荐结果进行融合。一种基于身份行为混淆的抗网络追踪隐私保护系统,其特征在于,包括行为拆分模块、身份切换模块、行为生成模块和结果融合模块;其中,所述行为拆分模块,用于依次对用户真实行为链中发送的每一web服务操作请求分配一对应的虚拟身份;其中该用户具有多个虚拟身份;所述身份切换模块,用于将该用户身份切换到当前分配的虚拟身份并执行所分配的web服务操作请求;所述行为生成模块,用于为当前虚拟身份生成虚拟行为;所述虚拟行为是指模拟真实用户并未执行过的行为,向web服务发送虚拟请求,使虚拟身份的行为链完整;所述结果融合模块,用于对各虚拟身份的返回结果进行融合,然后将融合结果返回给该用户的客户端。本专利技术还提供了一种客户端,其特征在于,包括行为拆分模块、身份切换模块、行为生成模块和结果融合模块;其中,所述行为拆分模块,用于依次对用户真实行为链中发送的每一web服务操作请求分配一对应的虚拟身份;其中该用户具有多个虚拟身份;所述身份切换模块,用于将该用户身份切换到当前分配的虚拟身份并执行所分配的web服务操作请求;所述行为生成模块,用于为当前虚拟身份生成虚拟行为;所述虚拟行为是指模拟真实用户并未执行过的行为,向web服务发送虚拟请求,使虚拟身份的行为链完整;所述结果融合模块,用于对各虚拟身份的返回结果进行融合,然后将融合结果返回给该用户。在用户没有登录网站的场景中,目前几乎所有web服务都使用cookie或浏览器指纹来识别一个用户。为保护用户隐私,本专利技术在客户端通过请求多个cookie及构造不同的浏览器指纹为用户构建看起来真实的假身份(即虚拟身份),并通过切换cookie和浏览器指纹来使用该用户的不同假身份请求web服务。本专利技术主要分为四个模块,分别是行为拆分、身份切换、行为生成、结果融合。行为拆分模块依次对用户真实行为链中发送的每一web服务操作请求分配一对应的虚拟身份,身份切换模块在当前行为执行前为用户切换身份并重新执行,同时行为生成模块选取并加入一些与真实行为相似的假的行为,使假身份的行为链看起来完整真实。在用户已经登录网站的场景中,本专利技术只在真实行本文档来自技高网
...

【技术保护点】
1.一种基于身份行为混淆的抗网络追踪隐私保护方法,其步骤包括:/n1)为用户构建多个虚拟身份;/n2)行为拆分模块依次对用户真实行为链中发送的每一web服务操作请求分配一对应的虚拟身份;/n3)身份切换模块将该用户身份切换到当前分配的虚拟身份并执行所分配的web服务操作请求;并且行为生成模块为当前虚拟身份生成虚拟行为;所述虚拟行为是指模拟真实用户并未执行过的行为,向web服务发送虚拟请求,使虚拟身份的行为链完整;/n4)为该用户所分配的多个虚拟身份分别将返回结果反馈给结果融合模块进行融合,然后将融合结果返回给该用户所在的客户端。/n

【技术特征摘要】
1.一种基于身份行为混淆的抗网络追踪隐私保护方法,其步骤包括:
1)为用户构建多个虚拟身份;
2)行为拆分模块依次对用户真实行为链中发送的每一web服务操作请求分配一对应的虚拟身份;
3)身份切换模块将该用户身份切换到当前分配的虚拟身份并执行所分配的web服务操作请求;并且行为生成模块为当前虚拟身份生成虚拟行为;所述虚拟行为是指模拟真实用户并未执行过的行为,向web服务发送虚拟请求,使虚拟身份的行为链完整;
4)为该用户所分配的多个虚拟身份分别将返回结果反馈给结果融合模块进行融合,然后将融合结果返回给该用户所在的客户端。


2.如权利要求1所述的方法,其特征在于,用户的客户端通过请求多个cookie或构造不同的浏览器指纹为该用户构建多个虚拟身份;所述身份切换模块通过切换cookie或浏览器指纹将用户身份切换到当前分配的虚拟身份。


3.如权利要求2所述的方法,其特征在于,客户端将用户请求中的cookie删除或替换为虚拟cookie,以生成该用户的虚拟身份;所述虚拟cookie是使用该用户请求目标服务时收集的web服务器真实发放的cookie。


4.如权利要求1所述的方法,其特征在于,所述客户端维护一虚拟身份列表,虚拟身份列表中记录信息包括虚拟身份、该虚拟身份访问的目标服务的相应关键字以及标识信息。


5.如权利要求1所述的方法,其特征在于,所述行为生成模块根据训练集选择与分配给当前虚拟身份执行的真实行为相似的未执行过的行为作为当前虚拟身份的虚拟行为。


6.如权利要求1所述的方法,其特征在于,所述行为拆分模块为每一web服务操作请求分配一对应的虚拟身份的方法为:所述行为拆分模块根据训练集为每个web服务操作请求计算出一个向量表示,并根据每个虚拟身份已有的行为计算出一个整体的向量;然后将当前web服务操作请求的向量与各虚拟身份的向量进行相似度计算,然后将当前web服务操作请求分配给最大相似度值对应的虚拟身份。

【专利技术属性】
技术研发人员:彭佳李敏张逸飞高能
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1