一种追踪隐私信息泄露的方法技术

技术编号:3951985 阅读:220 留言:0更新日期:2012-04-11 18:40
一种追踪隐私信息泄露的方法,属于计算机网络安全领域,用于网络环境中隐私信息泄露的追踪。本发明专利技术的目的是提供一种追踪隐私信息泄露的方法。针对Web服务站点泄露用户隐私信息给第三方后,用户经常收到带有广告性质的垃圾邮件的问题。本发明专利技术采用一个分析中心,当用户收到垃圾邮件以后向分析中心举报垃圾邮件,通过分析中心的分析方法找到隐私信息泄露的网站,告知用户。使用本发明专利技术的方法可以追踪到泄露用户隐私信息的网站,使得用户可以改变对隐私信息泄露站点的信任或交互模式,甚至诉诸于法律,从而达到对用户隐私信息的保护。

【技术实现步骤摘要】

本专利技术涉及一种在网络环境下,追踪隐私信息泄露的方法。本专利技术成果可以用于 互联网中隐私信息泄露的追踪,属于计算机网络安全领域。
技术介绍
Web技术的发展和广泛应用为用户共享信息和使用各种服务提供了方便,但是由 此带来了隐私信息保护的问题。用户在享用Web站点提供的服务之前,往往需要在站点注 册,注册过程中站点一般要求用户提交一些包含个人隐私的信息,如用户名、电子邮箱地址 等。隐私信息包含个人的敏感信息,如果被泄露会造成个人名誉损失、经济损失和精神伤 害。虽然站点一般都声称不会泄露用户的隐私信息,但是有的站点为了其商业利益而将用 户隐私信息泄露给第三方。之后,用户会经常收到一些广告性质的垃圾邮件。 现有的针对Web服务的隐私信息保护方法通过一些技术手段或者站点的隐私策 略来对用户隐私信息进行保护,但是存在以下的缺点第一,现有的技术方法如使用匿名 技术在一定程度上阻断了用户隐私信息与其身份之间的联系,但是如果用户身份信息被泄 露,用户的所有相关信息也就都泄露了。此外,由于各种因素如背景信息等的存在,使得匿 名破解非常容易。第二,现有隐私策略和隐私保护方法虽然能够对隐私信息进行一定的保 护,但是一旦站点违背隐私策略,用户的隐私信息还是会被泄露出去。
技术实现思路
本专利技术的目的是提供,针对Web服务站点泄露用户 隐私信息给第三方后,用户经常收到带有广告性质的垃圾邮件的问题。使用本专利技术的方法 可以追踪到泄露用户隐私信息的网站,使得用户可以改变对隐私信息泄露站点的信任或交 互模式,甚至诉诸于法律,从而达到对用户隐私信息的保护。本专利技术采用一个分析中心,当用户收到垃圾邮件以后向分析中心举报垃圾邮件, 并告知分析中心最近注册过的网站的信息,如果分析不成功,则分析中心要求用户进一步 提交最近交互过的网站的信息。其中,“最近”在实际应用中可以具体确定实际期限,如两 周、一个月等,在此不做特殊规定。分析中心根据分析算法对泄露用户隐私信息的网站进行 分析和追踪,并将结果告知用户。本专利技术的应用框架结构如图1所示。站点泄露的用户的 隐私信息分为两类一是注册信息(其中可能包括用户名、电子邮件地址、兴趣等),二是 通过用户和站点的历史交互行为,站点分析出的用户行为信息。本专利技术采取如下的技术方案。追踪隐私信息泄露的方法,实现本方法的整个框架 包括用户、隐私信息泄露站点、得到用户隐私信息的第三方(以下简称第三方)和分析中 心,其中分析中心的分析算法包括邮件分类模块、站点分类模块和分析模块。追踪隐私信息泄露的方法,其特征在于,包括以下步骤1.用户收到垃圾邮件后,向分析中心举报,该分析中心为包括邮件分类模块、站点 分类模块和分析模块三个软件的服务器1. 1)用户在分析中心注册一个账号,该注册过程只需提交用户名(用户自己选定 的名称)和密码(供用户登录分析中心使用),不需提交其他任何信息,最大限度的保护用 户的隐私;1. 2)用户登录分析中心,将自己要举报的垃圾邮件和最近注册过的站点的网址提 交分析中心; 2.分析中心收到用户的举报后,做如下处理(分析流程如图3,分析流程图所 示)2. 1)调用邮件分类模块对用户举报的垃圾邮件做分类处理,邮件分类模块中使用 一个邮件分类软件对邮件进行分类处理,其实现的步骤包括2. 1. 1)删除邮件正文中出现频率很高但与邮件特征无关的词(如连接词、语气助 词等),其中“特征”是指能够把一个邮件内容与其他邮件内容区分开来的信息;2. 1.2)在词典(包括中文词典、英文词典等词典,根据邮件中出现的语言类型选 择相应的词典)的支持下,把邮件文本分成有意义的词条;2. 1.3)对2. 1.2)中切分好的有意义的词条,通过提取语义的方法确定该邮件的 类型,即该邮件是为哪一种或哪几种商品或服务做广告,用集合Ie1, e2, . . . . ej (m e (1, 2,....))表示,其中m表示一个邮件类型的总个数。比如,一个邮件为化妆品和服装作广 告,该邮件的类型表示为{e1; e2},其中el表示“化妆品”,e2表示“服装”,则m = 2。其中 “提取语义的方法”在实际应用中是采用机器学习的方法实现。2. 2)调用站点分类模块对用户提交的站点进行分类,站点分类模块中使用一个 站点分类软件对用户提交的站点进行分类处理,站点分类软件采用机器学习的方法对这 些站点(如是提供学习交流的站点或是提供电子商务服务的站点类型等)以及站点通 过和用户的交互可能收集到的用户的信息进行分类,分类结果记为站点类型,用集合Ic1, C2,....cj (ne (1,2,....))表示,其中η表示站点类型的总个数。比如,一个销售电子产 品的电子商务网站类型表示为Ic1, C2, c3},其中C1表示“手机”,C2表示“电脑”,C3表示“移 动硬盘”,则η = 3。2. 3)调用分析模块分析泄露用户隐私信息的网站,分析模块中使用一个分析软件 来分析泄露用户隐私信息的网站,其实现步骤包括2.3.1)把一个时间区间之内的(如一个小时之内、一天之内等,实际应用中可以 根据具体情况而确定)、垃圾邮件内容相同的每一条用户举报,表示成一个举报条目,其中 举报条目包括用户提交的站点名称、该站点的类型、垃圾邮件的类型。将这些垃圾邮件内容 相同的举报条目组织成一个表,记为分析表,如图2所示;2. 3. 2)扫描分析表中的每一个举报条目,如果举报条目满足以下的条件ei g (Cl, c2,....cn) (ei e (ei,e2,· · · · em),m e (1,2,····),i e (1,2,· · · · m)),即经过分析的垃圾 邮件的类型不属于注册站点的类型,则删除该站点。这是因为,垃圾邮件类型不属于站点类 型,表示站点不能获得用户与垃圾邮件广告目的相关的信息,因此将其删除。其中,“属于” 表示包含与被包含的关系;2. 3. 3)扫描分析表,记录每个站点出现的频率,按照出现频率的高低对注册站点 排序,记录在一张排序表中;2.3.4)对于排序表,记录前ρ个站点,删除后q个的站点(其中P、q的取值根据举报的总数选定);2.3.5)在下一个时间区间之内接收垃圾邮件内容相同的用户举报,重复 2. 3. 1)-2. 3. 4),直到对于内容相同的垃圾邮件,不再接收到用户举报或超过设定的时间门 限(如8个小时、两天等,根据实际应用选择时间门限);2. 3. 6)对于2. 3. 5)形成的每个排序表中记录的前ρ个站点,取前t个(t为整数, 且t < ρ)作为隐私泄露候选站点,记为{k1; k2, .... kx} (1 e (1,2,....)),其中1表示选 择的隐私泄露候选站点的总个数。如果一共有Hr为大于0的整数)张排序表,则隐私泄 露站点的候选者数量是rXt。其中的t的具体取值根据排序表的情况选定,在此不做特殊 要求;2. 4)对于候选的隐私泄露站点{k1; k2,.... Ic1) (1 e (1,2,....)),分析中心对这 些站点用不同的邮箱分别进行注册和交互,如果在注册和交互之后,测试邮箱很快开始收 到垃圾邮件,则确定该站点为泄露用户隐私信息的网站,转向3. 1)。如果对于所有的候选站 点进行测试注册后,测试邮箱没有收到垃圾邮件本文档来自技高网...

【技术保护点】
一种追踪隐私信息泄露的方法,其特征在于,包括以下步骤:1.)用户收到垃圾邮件后,向分析中心举报,该分析中心为包括邮件分类模块、站点分类模块和分析模块三个软件的服务器:1.1)用户在分析中心注册一个账号,该注册过程只需提交一个自己选定的用户名和供用户登录分析中心使用的密码;1.2)用户登录分析中心,将自己要举报的垃圾邮件和最近注册过的站点的网址提交分析中心;2.)分析中心收到用户的举报后,做如下处理:2.1)调用邮件分类模块对用户举报的垃圾邮件做分类处理,邮件分类模块中使用一个[l]}(l∈(1,2,....)),l是选择的隐私泄露候选站点的总个数;如果一共有r张排序表,r为大于0的整数,则隐私泄露站点的候选者数量是r×t;2.4)对于候选的隐私泄露站点{k↓[1],k↓[2],....k↓[l]}(l∈(1,2,....)),分析中心对这些站点用不同的邮箱分别进行注册和交互,如果在注册和交互之后,测试邮箱很快开始收到垃圾邮件,则确定该站点为泄露用户隐私信息的网站,转向3.1);如果对于所有的候选站点进行测试注册后,测试邮箱没有收到垃圾邮件,则转向2.5);2.5)分析中心要求用户把最近交互的站点和最近注册的站点一起提交到分析中心,做2.1)-2.4),如果成功转向3.1),否则分析失败转向3.2);3.)分析中心告知用户分析结果,其中包括:3.1)成功找到泄露用户隐私信息的网站;3.2)分析失败。邮件分类软件对邮件进行分类处理,其实现的步骤包括:2.1.1)删除邮件正文中出现频率很高但与邮件特征无关的词,特征是能够把一个邮件内容与其他邮件内容区分开来的信息;2.1.2)在词典的支持下,把邮件文本分成有意义的词条;2.1.3)对2.1.2)中切分好的有意义的词条,通过提取语义的方法确定该邮件的类型,用集合{e↓[1],e↓[2],....e↓[m]}(m∈(1,2,....))表示,m表示一个邮件类型的总个数;;2.2)调用站点分类模块对用户提交的站点进行分类,站点分类模块中使用一个站点分类软件对用户提交的站点进行分类处理;站点分类软件对这些站点以及站点通过和用户的交互可能收集到的用户的信息进行分类,分类结果记为站点类型,用集合{c↓[1],c↓[2],....c↓[n]}(n∈(1,2,....))表示,n是站点类型的总个数;2.3)调用分析模块分析泄露用户隐私信息的网站,分析模块中使用一个分析软件来分析泄露用...

【技术特征摘要】

【专利技术属性】
技术研发人员:何泾沙高枫吴旭
申请(专利权)人:北京工业大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1