防网页追踪方法、装置、设备及存储介质制造方法及图纸

技术编号:35546993 阅读:16 留言:0更新日期:2022-11-12 15:25
本发明专利技术涉及互联网技术领域,公开了一种防网页追踪方法、装置、设备及存储介质,所述防网页追踪方法包括以下步骤:在检测到网页组件发送的网页请求时,判断所述网页请求是否为第三方请求;在所述网页请求为所述第三方请求时,判断所述网页请求是否含有网页追踪信息;在所述网页请求含有所述网页追踪信息时,对所述网页请求采取对应的拦截措施。通过根据属于第三方请求的网页请求对应的源代码或源代码的隐藏代码中来判断网页请求是否含有网页追踪信息,以提高对网页请求是否含有网页追踪信息的判断精准度,并在所述网页请求含有网页追踪信息时,对含有网页追踪信息的网页请求采取对应的拦截措施,以有效防止网页追踪现象的发生,提高互联网安全性。提高互联网安全性。提高互联网安全性。

【技术实现步骤摘要】
防网页追踪方法、装置、设备及存储介质


[0001]本专利技术涉及互联网
,尤其涉及一种防网页追踪方法、装置、设备及存储介质。

技术介绍

[0002]随着互联网技术的发展,浏览器成为网站的主要入口,网络追踪器是通过内嵌在网站的相关网页中的隐藏代码对用户行为进行追踪,这些隐藏代码会记录用户访问的网站信息、网页交互信息、在线购物搜索记录、视频浏览记录,甚至可能获取到用户的健康状况、政治背景、教育背景等个人隐私信息。当网络跟踪器出现在多个网站时,就可以将各个网站的信息进行汇总,构建完整的用户画像,通过用户画像对用户进行精准的广告投放,或者共享、出售给第三方公司,对互联网安全造成了颇大威胁。因此,如何有效防止网页追踪现象的发生,提高互联网安全性,成为一个亟待解决的问题。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供了一种防网页追踪方法、装置、设备及存储介质,旨在解决如何有效防止网页追踪现象的发生,提高互联网安全性的技术问题。
[0005]为实现上述目的,本专利技术提供了一种防网页追踪方法,所述方法包括以下步骤:
[0006]在检测到网页组件发送的网页请求时,判断所述网页请求是否为第三方请求;
[0007]在所述网页请求为所述第三方请求时,判断所述网页请求是否含有网页追踪信息;
[0008]在所述网页请求含有所述网页追踪信息时,对所述网页请求采取对应的拦截措施。
>[0009]可选地,所述在所述网页请求为所述第三方请求时,判断所述网页请求是否含有网页追踪信息的步骤,具体包括:
[0010]在所述网页请求为所述第三方请求时,获取所述网页请求对应的源代码;
[0011]判断所述源代码中是否含有隐藏代码;
[0012]在所述源代码中含有所述隐藏代码时,根据所述隐藏代码判断所述网页请求是否含有网页追踪信息。
[0013]可选地,所述判断所述源代码中是否含有隐藏代码的步骤,具体包括:
[0014]在虚拟环境中运行所述源代码,并逐条监控所述源代码执行的进程信息;
[0015]根据所述进程信息中是否含有隐藏行为路径判断所述源代码中是否含有隐藏代码。
[0016]可选地,所述在所述源代码中含有所述隐藏代码时,根据所述隐藏代码判断所述网页请求是否含有网页追踪信息的步骤,具体包括:
[0017]在所述进程信息中含有隐藏行为路径时,判定所述源代码中含有隐藏代码;
[0018]获取所述隐藏行为路径对应的行为信息,并将所述行为信息输入至预设分类器中,获得行为分类结果;
[0019]根据所述行为分类结果判断所述网页请求是否含有网页追踪信息。
[0020]可选地,所述将所述隐藏行为路径输入至预设分类器中,获得行为分类结果的步骤之前,还包括:
[0021]获取不同的样本行为信息,并对所述样本行为信息进行特征提取,获得样本行为特征;
[0022]获取所述样本行为特征与预设追踪行为特征之间的行为特征匹配度;
[0023]将所述行为特征匹配度大于等于预设行为特征匹配度的样本行为特征作为追踪特征正样本,将所述行为特征匹配度小于所述预设行为特征匹配度的样本行为特征作为追踪特征负样本;
[0024]基于所述追踪特征正样本和所述追踪特征负样本对支持向量机进行训练,以获得预设分类器。
[0025]可选地,所述在所述源代码中含有所述隐藏代码时,根据所述隐藏代码判断所述网页请求是否含有网页追踪信息的步骤,具体包括:
[0026]在所述源代码中含有所述隐藏代码时,对所述隐藏代码进行特征提取,以获得代码特征;
[0027]根据所述代码特征判断所述网页请求是否含有网页追踪信息。
[0028]可选地,所述根据所述代码特征判断所述网页请求是否含有网页追踪信息的步骤,具体包括:
[0029]获取所述代码特征与预设追踪代码特征之间的代码特征相似度;
[0030]根据所述代码特征相似度判断所述网页请求是否含有网页追踪信息。
[0031]可选地,所述判断所述源代码中是否含有隐藏代码的步骤之后,还包括:
[0032]在所述源代码中不含有所述隐藏代码时,在虚拟环境中运行所述源代码,并逐条监控所述源代码执行的进程信息;
[0033]获取所述进程信息对应的行为路径,并根据所述行为路径判断所述网页请求是否含有网页追踪信息。
[0034]可选地,所述获取所述进程信息对应的行为路径,并根据所述行为路径判断所述网页请求是否含有网页追踪信息的步骤,具体包括:
[0035]获取所述进程信息对应的行为路径,并获取所述行为路径对应的行为信息;
[0036]将所述行为路径对应的行为信息输入至预设分类器中,获得行为分类结果;
[0037]根据所述行为分类结果判断所述网页请求是否含有网页追踪信息。
[0038]可选地,所述判断所述源代码中是否含有隐藏代码的步骤,具体包括:
[0039]扫描所述源代码,获得代码扫描结果;
[0040]根据所述代码扫描结果中是否含有预设字符段判断所述源代码中是否含有隐藏代码。
[0041]可选地,所述在检测到网页组件发送的网页请求时,判断所述网页请求是否为第三方请求的步骤,具体包括:
[0042]在检测到网页组件发送的网页请求时,获取所述网页请求对应的地址信息;
[0043]根据所述地址信息判断所述网页请求是否为第三方请求。
[0044]此外,为实现上述目的,本专利技术还提出一种防网页追踪装置,所述防网页追踪装置包括:
[0045]请求判断模块,用于在检测到网页组件发送的网页请求时,判断所述网页请求是否为第三方请求;
[0046]追踪判断模块,用于在所述网页请求为所述第三方请求时,判断所述网页请求是否含有网页追踪信息;
[0047]追踪拦截模块,用于在所述网页请求含有所述网页追踪信息时,对所述网页请求采取对应的拦截措施。
[0048]可选地,所述追踪判断模块,还用于在所述网页请求为所述第三方请求时,获取所述网页请求对应的源代码;
[0049]所述追踪判断模块,还用于判断所述源代码中是否含有隐藏代码;
[0050]所述追踪判断模块,还用于在所述源代码中含有所述隐藏代码时,根据所述隐藏代码判断所述网页请求是否含有网页追踪信息。
[0051]可选地,所述追踪判断模块,还用于在虚拟环境中运行所述源代码,并逐条监控所述源代码执行的进程信息;
[0052]所述追踪判断模块,还用于根据所述进程信息中是否含有隐藏行为路径判断所述源代码中是否含有隐藏代码。
[0053]可选地,所述追踪判断模块,还用于在所述进程信息中含有隐藏行为路径时,判定所述源代码中含有隐藏代码;
[0054]所述追踪判断模块,还用于获取所述隐藏行为路径对应的行为信息,并将所述行本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种防网页追踪方法,其特征在于,所述防网页追踪方法包括以下步骤:在检测到网页组件发送的网页请求时,判断所述网页请求是否为第三方请求;在所述网页请求为所述第三方请求时,判断所述网页请求是否含有网页追踪信息;在所述网页请求含有所述网页追踪信息时,对所述网页请求采取对应的拦截措施。2.如权利要求1所述的防网页追踪方法,其特征在于,所述在所述网页请求为所述第三方请求时,判断所述网页请求是否含有网页追踪信息的步骤,具体包括:在所述网页请求为所述第三方请求时,获取所述网页请求对应的源代码;判断所述源代码中是否含有隐藏代码;在所述源代码中含有所述隐藏代码时,根据所述隐藏代码判断所述网页请求是否含有网页追踪信息。3.如权利要求2所述的防网页追踪方法,其特征在于,所述判断所述源代码中是否含有隐藏代码的步骤,具体包括:在虚拟环境中运行所述源代码,并逐条监控所述源代码执行的进程信息;根据所述进程信息中是否含有隐藏行为路径判断所述源代码中是否含有隐藏代码。4.如权利要求3所述的防网页追踪方法,其特征在于,所述在所述源代码中含有所述隐藏代码时,根据所述隐藏代码判断所述网页请求是否含有网页追踪信息的步骤,具体包括:在所述进程信息中含有隐藏行为路径时,判定所述源代码中含有隐藏代码;获取所述隐藏行为路径对应的行为信息,并将所述行为信息输入至预设分类器中,获得行为分类结果;根据所述行为分类结果判断所述网页请求是否含有网页追踪信息。5.如权利要求4所述的防网页追踪方法,其特征在于,所述将所述隐藏行为路径输入至预设分类器中,获得行为分类结果的步骤之前,还包括:获取不同的样本行为信息,并对所述样本行为信息进行特征提取,获得样本行为特征;获取所述样本行为特征与预设追踪行为特征之间的行为特征匹配度;...

【专利技术属性】
技术研发人员:付阳尹青建
申请(专利权)人:北京鸿享技术服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1