用于Web跟踪器分类和缓解的系统和方法技术方案

技术编号:36616646 阅读:21 留言:0更新日期:2023-02-15 00:23
本文描述的实施例针对以隐私保护的方式智能地分类Web跟踪器并缓解这样的Web跟踪器的影响。当用户浏览Web并遇到各种Web站点时,跟踪器相关度量被确定。这些度量被模糊以保护用户的隐私。经模糊的度量被提供作为对机器学习模型的输入,该机器学习模型被配置为输出用于与由用户访问的Web站点相关联的Web跟踪器的分类。取决于分类,Web跟踪器的影响通过对Web跟踪器设置限制来缓解。针对特定Web跟踪器的限制可以基于用户针对跟踪器的相关联Web站点的用户参与度的水平而放宽。通过这样做,对于对用户而言相对重要的Web站点,与跟踪预防相关联的兼容性风险被缓解。相关联的兼容性风险被缓解。相关联的兼容性风险被缓解。

【技术实现步骤摘要】
【国外来华专利技术】用于Web跟踪器分类和缓解的系统和方法

技术介绍

[0001]Web跟踪器是已知的在用户浏览的同时收集用户的数据的代码片段,通常记录它并使用它来将用户与个性化广告对准。当今的各种浏览器都支持跟踪预防实现,以保护用户免受Web上已知跟踪器的侵害。这是通过限制跟踪器对基于浏览器的存储(诸如cookie)的访问来实现的,防止它们存储用于跨Web跟踪用户的每用户标识符。虽然这样的保护有助于保护用户隐私,但它们可能会触发与跟踪实体的军备竞赛。这些跟踪器可能会尝试各种方法,通过改变域名或使用国际市场中的本地交付点来破坏跟踪预防系统,以避免被发现。此外,存储访问限制还可能引起与期望这样的跟踪器以不受限制的存储访问操作的站点的兼容性问题。

技术实现思路

[0002]本
技术实现思路
被提供以以简化形式介绍概念的选择,这些概念将在下面的具体实施方式中进一步描述。本
技术实现思路
并非旨在标识所要求保护的主题的关键特征或基本特征,也不旨在用于限制所要求保护的主题的范围。
[0003]方法、系统、装置和计算机可读存储介质被描述用于以隐私保护方式对Web跟踪器进行智能分类并缓解这样的Web跟踪器的影响。当用户浏览Web并遇到各种Web站点时,跟踪器相关的度量针对这些Web站点被确定。这些度量被模糊以保护用户的隐私。度量通过使用动态和不可知的数量两者将度量缩放(scale)到用户的浏览历史来模糊。经模糊的度量被提供作为对机器学习模型的输入,该机器学习模型被配置为输出与由用户访问的Web站点相关联的Web跟踪器的分类。取决于分类,Web跟踪器的影响被缓解。例如,Web跟踪器的网络和/或存储请求可能会受到限制。针对特定Web跟踪器的限制可能会基于用户关于跟踪器的相关联Web站点的用户参与度的水平而放宽。例如,如果用户参与度的水平相对较高,则对Web跟踪器的限制被放宽。通过这样做,对于对用户相对重要的Web站点,与跟踪预防相关联的兼容性风险被缓解。
[0004]下面参照附图详细描述实施例的其他特征和优点,以及各种实施例的结构和操作。注意,方法和系统不限于本文描述的特定实施例。这些实施例在本文中仅出于说明性目的而呈现。基于本文包含的教导,其他实施例对于(多个)相关领域的技术人员将是明显的。
附图说明
[0005]并入本文并形成说明书的一部分的附图说明了本申请的实施例,并与说明书一起进一步用于解释实施例的原理,并使相关领域的技术人员能够做出并使用实施例。
[0006]图1示出了根据示例实施例的用于对Web跟踪器进行分类并缓解经分类的Web跟踪器的影响的系统的框图。
[0007]图2示出了根据示例实施例的用于对Web跟踪器进行分类的系统的框图。
[0008]图3示出了根据示例实施例的用于分类和缓解Web跟踪器的影响的方法的流程图。
[0009]图4示出了根据示例实施例的用于生成机器学习模型的方法的流程图。
[0010]图5示出了根据示例实施例的用于生成机器学习模型的系统的框图。
[0011]图6示出了根据示例实施例的用于缓解Web跟踪器的影响的系统的框图。
[0012]图7示出了根据示例实施例的用于缓解Web跟踪器的影响的方法的流程图。
[0013]图8是其中可以实现实施例的示例性用户设备的框图。
[0014]图9是可以用于实现各种实施例的示例基于处理器的计算机系统的框图。
[0015]本文描述的实施例的特征和优点将在结合附图时从以下阐述的具体实施方式中变得更加明显,其中相似的附图标记自始至终标识对应的元素。在附图中,相似的附图标记通常指示相同的、功能相似的和/或结构相似的元素。元素首次出现的附图由对应附图标记中最左边的(多个)数字指示。
具体实施方式
[0016]I.介绍
[0017]以下具体实施方式公开了许多示例实施例。本专利申请的范围不限于公开的实施例,还包括公开的实施例的组合,以及对公开的实施例的修改。
[0018]在说明书中对“一个(one)实施例”、“一个(an)实施例”、“一个示例实施例”等的引用指示所描述的实施例可以包括特定的特征、结构或特性,但是每个实施例都可以不一定包括特定的特征、结构或特性。此外,这些短语不一定指相同的实施例。此外,当结合实施例描述特定特征、结构或特性时,认为在本领域技术人员的知识范围内实现与其他实施例结合的这种特征、结构或特性,无论是否明确描述。
[0019]在讨论中,除非另有说明,形容词如“基本上”和“大约”修饰本公开实施例的一个或多个特征的条件或关系特性,应理解为表示条件或特性被定义在对于其预期应用的实施例的操作可接受的公差范围内。
[0020]许多示例性实施例描述如下。注意,本文提供的任何章节/小节标题并非旨在限制。贯穿本文档描述了实施例,并且任何类型的实施例可以包括在任何章节/小节下。此外,在任何章节/小节中公开的实施例可以以任何方式与在相同章节/小节和/或不同章节/小节中描述的任何其他实施例相组合。
[0021]II.示例实施例
[0022]本文描述的实施例针对以隐私保护方式对Web跟踪器进行智能分类并缓解这样的Web跟踪器的影响。当用户浏览Web并遇到各种Web站点时,跟踪器相关的度量针对这些Web站点被确定。这些度量被模糊以保护用户的隐私。度量通过使用动态和不可知的数量两者将度量缩放到用户的浏览历史被模糊。经模糊的度量被提供作为对机器学习模型的输入,该机器学习模型被配置为输出用于与由用户访问的Web站点相关联的Web跟踪器的分类。取决于分类,Web跟踪器的影响被缓解。例如,Web跟踪器的网络和/或存储请求可能会受到限制。针对特定Web跟踪器的限制可能会基于用户关于跟踪器的相关联Web站点的用户参与度的水平而放宽。例如,如果用户参与度的水平相对较高,则对Web跟踪器的限制被放宽。通过这样做,对于对用户相对重要的Web站点,与跟踪预防相关联的兼容性风险被缓解。
[0023]为了在使用期间提高准确性、隐私性并减少计算负载,机器学习模型使用通过爬取大量网站的样本来收集的相同可缩放度量(或信号)被训练。这些样本以相同的方式缩放,使用随着样本大小按比例放大的相同未知量。训练决策使用已知跟踪器的足够大的基
准真相列表来通知应该被分类的跟踪模式。
[0024]跟踪器的分类以可缩放的方式发生,可以随着用户浏览模式和行为在用户组之间以及随时间两者不同而动态地为用户自定制。分类还以保护隐私的方式进行,以确保在存在查看分类的侧信道攻击时,关于用户的浏览模式的潜在敏感信号受到保护而不被公开。
[0025]前述技术有利地缩放到各种用户浏览模式,更准确地检测各种较新的未知跟踪器,并通过防止个人或私人信息的逆向工程来保护用户的隐私。未能保护用户的数据遭受将用户的浏览历史记录泄露给恶意实体的风险。为了进一步增强隐私,当用于分类(但不是训练)时,少量随机噪声可能被引入经模糊的度量,以确保不可知的数量不能被逆向工程。
[0026]此外,根据本文描述的缓解技术,某些跟踪器可能会选择性地本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于分类和缓解Web跟踪器的影响的方法,包括:确定与由浏览器应用访问的Web站点相关联的跟踪器相关的度量;至少基于所述用户的浏览器历史来模糊所述跟踪器相关的度量;提供经模糊的所述度量作为对机器学习模型的输入,所述机器学习模型基于经模糊的所述度量输出与所述Web站点相关联的Web跟踪器的分类;以及至少基于所述分类确定要针对所述Web跟踪器被执行的缓解。2.根据权利要求1所述的方法,其中所述跟踪器相关的度量包括以下至少一项:针对所述Web站点被加载的一个或多个(的类型;所述一个或多个资源针对所述Web站点被加载的频率;或者所述浏览器应用被重定向到的一个或多个统一资源定位符。3.根据权利要求1所述的方法,其中模糊所述跟踪器相关的度量还包括:基于所述用户的所述浏览器历史和随机生成的噪声模糊所述跟踪器相关的度量。4.根据权利要求1所述的方法,其中所述缓解包括:限制由所述Web跟踪器对所述浏览器应用在其上执行的计算设备的存储装置的访问。5.根据权利要求4所述的方法,还包括:确定针对所述Web站点的用户参与度得分;确定所述用户参与度得分超过预定阈值;以及响应于确定所述用户参与度得分超过所述预定阈值,不限制由所述Web跟踪器对所述计算设备的所述存储装置的访问。6.根据权利要求5所述的方法,其中所述用户参与度得分至少基于以下一项或多项:所述Web站点由所述用户使用所述浏览器应用访问的次数;由所述用户使用所述浏览器应用在所述Web站点上花费的时间;用户使用所述浏览器应用经由所述Web站点提供用户输入的次数;或者自从所述用户使用所述浏览器应用访问所述Web站点以来的持续时间。7.根据权利要求5所述的方法,还包括:确定由所述浏览器应用访问的第二Web站点与第一Web站点和相同的组织相关联;以及不限制由所述第二Web站点的Web跟踪器对所述计算设备的所述存储装置的访问。8.根据权利要求1所述的方法,其中所述机器学习模型通过以下被生成:针对多个第二Web站点中的每个第二Web站点:将与所述第二Web站点相关联的跟踪器相关的度量作为训练数据提供给机器学习算法,与第二Web站点相关联的所述跟踪器相关的度量基于所述多个第二Web站点被模糊;以及提供来自多个标签的标签,所述标签指定来自多个Web跟踪器的Web跟踪器,所述Web跟踪器对应于与所...

【专利技术属性】
技术研发人员:B
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1