异常网页检测方法、装置、设备和存储介质制造方法及图纸

技术编号:46622832 阅读:2 留言:0更新日期:2025-10-14 21:18
本申请涉及一种异常网页检测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法可应用于云技术领域,所述方法包括:分别获取异常种子网页和待扩散网页的头部信息和地址信息;将属于同一所述异常种子网页的所述头部信息和所述地址信息进行文本拼接,得到所述异常种子网页的网页特征;将属于同一所述待扩散网页的所述头部信息和所述地址信息进行文本拼接,得到所述待扩散网页的网页特征;基于所述网页特征进行特征聚类,得到至少两个聚类簇;基于各所述聚类簇中所述异常种子网页的异常种子占比,确定所述至少两个聚类簇中的异常聚类簇;将所述异常聚类簇中的待扩散网页确定为异常网页。采用本方法能够提高异常网页检测的准确性。

【技术实现步骤摘要】

本申请涉及计算机,特别是涉及一种异常网页检测方法、装置、设备和存储介质


技术介绍

1、随着互联网技术的快速发展,网页已成为人们获取信息、进行交流和商业活动的重要平台。然而海量的网页中不乏存在着一些包含恶意内容、欺骗用户、传播病毒或其他有害软件的异常网页,这些异常网页可能会威胁用户的信息安全,甚至造成经济损失。

2、现有的异常网页检测通常是基于网页内容的检测,然而,攻击者通常使用动态内容生成、动态解析或实时变更网址等手段来避开检测,从而导致异常网页检测的准确性较低。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提升异常网页检测的准确性的异常网页检测方法、装置、设备和存储介质。

2、第一方面,本申请提供了一种异常网页检测方法。所述方法包括:

3、获取异常种子网页的头部信息和地址信息,以及获取待扩散网页的头部信息和地址信息;

4、将属于同一所述异常种子网页的所述头部信息和所述地址信息进行文本拼接,得到所述异常种子网页的网页特征;将属于同一所述待扩散本文档来自技高网...

【技术保护点】

1.一种异常网页检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述资源模型包括根节点;所述基于所述资源模型生成所述已扩散异常网页的异常网页指纹,包括:

4.根据权利要求3所述的方法,其特征在于,所述资源模型为DOM树;所述目标节点为标签节点;所述以所述根节点为起点对所述资源模型进行节点遍历,直至达到遍历停止条件,得到目标节点的节点信息,包括:

5.根据权利要求3所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特...

【技术特征摘要】

1.一种异常网页检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述资源模型包括根节点;所述基于所述资源模型生成所述已扩散异常网页的异常网页指纹,包括:

4.根据权利要求3所述的方法,其特征在于,所述资源模型为dom树;所述目标节点为标签节点;所述以所述根节点为起点对所述资源模型进行节点遍历,直至达到遍历停止条件,得到目标节点的节点信息,包括:

5.根据权利要求3所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述对所述词向量进行向量融合,得到所述已扩散异常网页的异常网页指纹,包括:

7.根据权利要求2所述的方法,其特征在于,所述对网页进行异常检测,包括:

8.根据权利要求7所述的方法,其特征在于,所述方法还包括:

9.根据权利要求7所述的方法,其特征在于,所述异常...

【专利技术属性】
技术研发人员:甘晓华张凯牛亚峰张旭
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1