网页违规图片检测方法和装置制造方法及图纸

技术编号:39601683 阅读:13 留言:0更新日期:2023-12-03 20:01
本申请实施例提出一种网页违规图片检测方法和装置

【技术实现步骤摘要】
网页违规图片检测方法和装置、电子设备、存储介质


[0001]本申请涉及网络安全
,特别涉及一种网页违规图片检测方法和装置

电子设备和存储介质


技术介绍

[0002]随着数字图像技术的快速发展,数字图像凭借着直观

可信度高等优势,越来越多的企事业单位会在单位的官网上配图来展示单位信息

然而,黑客会使用各种网络攻击篡改网页中的图片,对企事业单位的形象造成严重的负面影响

[0003]在相关技术中,对网页图片进行违规检测时往往需要对网页中的所有图片进行违规检测,所需检测的图片数量较大,这使得其检测工作量过大,导致检测效率低下


技术实现思路

[0004]为解决上述问题,本申请实施例提出一种网页违规图片检测方法和装置

电子设备和存储介质,能够降低需要进行网页违规图片检测的图片的数量,从而减轻检测工作量,提高检测效率

[0005]本申请第一方面实施例提出一种网页违规图片检测方法,所述方法包括:
[0006]获取待测页面的待测图片集合,所述待测图片集合包括所述待测页面中的所有网页图片;
[0007]从所述待测图片集合中去除与基线图片相一致的所述网页图片,得到所述待测页面中的篡改图片,其中,所述基线图片为与所述待测页面对应的未被篡改的原始图片;
[0008]对所述篡改图片进行白名单检测,以从所述待测图片集合中去除白名单图片,得到目标检测图片;/>[0009]将所述目标检测图片输入至预设的违规图片检测模型,得到违规图片检测结果

[0010]在一些实施例中,所述方法还包括:
[0011]根据所述待测页面的统一资源定位符查找所述待测页面的基线图片数据库;
[0012]在查找到所述基线图片数据库的情况下,从所述基线图片数据库中获取所述待测页面的基线图片;
[0013]在无法查找到所述基线图片数据库的情况下,访问所述待测页面的服务器并从服务器的配置文件路径下获取所述待测页面的所有基线图片

[0014]在一些实施例中,所述从所述待测图片集合中去除与基线图片相一致的所述网页图片,得到所述待测页面中的篡改图片,包括:
[0015]计算所述网页图片的第一图像哈希值;
[0016]计算所述基线图片的第二图像哈希值;
[0017]在存在与所述第一图像哈希值一致的所述第二图像哈希值的情况下,从所有待测图片集合中去除与所述第一图像哈希值对应的所述网页图片;
[0018]在不存在与所述第一图像哈希值一致的所述第二图像哈希值的情况下,确定与所
述第一图像哈希值对应的所述网页图片为篡改图片

[0019]在一些实施例中,所述对所述篡改图片进行白名单检测,以从所述待测图片集合中去除白名单图片,得到目标检测图片,包括:
[0020]将所述篡改图片的第一图像哈希值与预设的白名单数据库进行匹配,在确定匹配到与所述篡改图片的第一图像哈希值相一致的第三图像哈希值的情况下,确定所述篡改图片属于所述白名单图片;
[0021]从所述待测图片集合中去除所述白名单图片,得到所述目标检测图片

[0022]在一些实施例中,在所述将所述目标检测图片输入至预设的违规图片检测模型,得到违规图片检测结果之后,还包括:
[0023]在所述违规图片检测结果表示所述网页图片合规的情况下,计算所述网页图片的第三图像哈希值,并将所述第三图像哈希值添加至所述白名单数据库中;
[0024]在所述违规图片检测结果表示所述目标检测图片不合规的情况下,在所述待测页面中对所述目标检测图片进行告警

[0025]在一些实施例中,所述获取待测页面的待测图片集合,包括:
[0026]获取待测网址;
[0027]解析所述待测网址的统一资源定位符,得到所述待测网址的域名;
[0028]根据所述待测网址的域名递归所述待测网址的子页面,得到所述待测网址的所有子页面;
[0029]根据所述待测网址和所述待测网址的子页面获取所述待测页面的待测图片集合

[0030]在一些实施例中,所述根据所述待测网址和所述待测网址的子页面获取所述待测页面的待测图片集合,包括:
[0031]通过
GET
请求获取所述待测网址和所述待测网址的子页面中的页面元素;
[0032]根据所述页面元素的属性从所述页面元素中提取所述待测页面的网页图片;
[0033]根据所述网页图片得到所述待测页面的所述待测图片集合

[0034]本申请第二方面实施例提出一种网页违规图片检测装置,所述装置包括:
[0035]获取模块,用于获取待测页面的待测图片集合,所述待测图片集合包括所述待测页面中的所有网页图片;
[0036]基线图片去除模块,用于从所述待测图片集合中去除与基线图片相一致的所述网页图片,得到篡改图片,其中,所述基线图片为与所述待测页面对应的未被篡改的原始图片;
[0037]白名单图片去除模块,用于从所有所述篡改图片中去除白名单图片,得到目标检测图片;
[0038]违规检测模块,将所述目标检测图片输入至预设的违规图片检测模型,得到违规图片检测结果

[0039]本申请第三方面实施例提出一种电子设备,所述电子设备包括存储器

处理器

存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器运行时实现如第一方面实施例中任一项所述的网页违规图片检测方法

[0040]本申请第四方面实施例提出一种计算机可读存储介质,所述计算机可读存储介质
存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器运行,以实现如第一方面实施例中任一项所述的网页违规图片检测方法

[0041]本申请实施例提出一种网页违规图片检测方法和装置

电子设备

存储介质

方法包括:获取待测页面的待测图片集合,所述待测图片集合包括所述待测页面中的所有网页图片;从所述待测图片集合中去除与基线图片相一致的所述网页图片,得到所述待测页面中的篡改图片,其中,所述基线图片为与所述待测页面对应的未被篡改的原始图片;对所述篡改图片进行白名单检测,以从所述待测图片集合中去除白名单图片,得到目标检测图片;将所述目标检测图片输入至预设的违规图片检测模型,得到违规图片检测结果

本申请通过在获取待测页面中的所有网页图片后,先从其中去除大量与页面的基线图片一致的网页图片,仅保留由于页面被篡改所形成的篡改图片,再对篡改图片进行白名单检测,去除其中合规的白名单图片,使待测图片集合中仅保留少量目标检测图片本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种网页违规图片检测方法,所述方法包括:获取待测页面的待测图片集合,所述待测图片集合包括所述待测页面中的所有网页图片;从所述待测图片集合中去除与基线图片相一致的所述网页图片,得到所述待测页面中的篡改图片,其中,所述基线图片为与所述待测页面对应的未被篡改的原始图片;对所述篡改图片进行白名单检测,以从所述待测图片集合中去除白名单图片,得到目标检测图片;将所述目标检测图片输入至预设的违规图片检测模型,得到违规图片检测结果
。2.
根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述待测页面的统一资源定位符查找所述待测页面的基线图片数据库;在查找到所述基线图片数据库的情况下,从所述基线图片数据库中获取所述待测页面的基线图片;在无法查找到所述基线图片数据库的情况下,访问所述待测页面的服务器并从服务器的配置文件路径下获取所述待测页面的所有基线图片
。3.
根据权利要求1所述的方法,其特征在于,所述从所述待测图片集合中去除与基线图片相一致的所述网页图片,得到所述待测页面中的篡改图片,包括:计算所述网页图片的第一图像哈希值;计算所述基线图片的第二图像哈希值;在存在与所述第一图像哈希值一致的所述第二图像哈希值的情况下,从所有待测图片集合中去除与所述第一图像哈希值对应的所述网页图片;在不存在与所述第一图像哈希值一致的所述第二图像哈希值的情况下,确定与所述第一图像哈希值对应的所述网页图片为篡改图片
。4.
根据权利要求1所述的方法,其特征在于,所述对所述篡改图片进行白名单检测,以从所述待测图片集合中去除白名单图片,得到目标检测图片,包括:将所述篡改图片的第一图像哈希值与预设的白名单数据库进行匹配,在确定匹配到与所述篡改图片的第一图像哈希值相一致的第三图像哈希值的情况下,确定所述篡改图片属于所述白名单图片;从所述待测图片集合中去除所述白名单图片,得到所述目标检测图片
。5.
根据权利要求4所述的方法,其特征在于,在所述将所述目标检测图片输入至预设的违规图片检测模型,得到违规图片检测结果之后,还包括:在所述违规图片检测结果表示所述网页图片合规的情况下,计算所述网页图片的第三图像哈希值,并将所...

【专利技术属性】
技术研发人员:赵萌梁海琴
申请(专利权)人:华润数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1