一种仿冒网站检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32489004 阅读:23 留言:0更新日期:2022-03-02 09:55
本申请实施例提供一种仿冒网站检测方法、装置、电子设备及存储介质,涉及人工智能技术领域。该方法包括利用预设的被仿冒网站图像数据库识别被仿冒网站的关键特征区域,以生成掩模和关键图像;利用所述关键图像和预设的仿冒网站检测模型构建被仿冒网站指纹库;利用所述掩模、所述被仿冒网站指纹库和所述仿冒网站检测模型对待检测网站进行检测,以确定所述待检测网站是否为仿冒网站,利用页面图像关键特征区域识别技术,基于深度学习算法进行自动检测,提高检测准确率和稳定性,解决了现有方法需要人工检测以及准确率较低的问题。需要人工检测以及准确率较低的问题。需要人工检测以及准确率较低的问题。

【技术实现步骤摘要】
一种仿冒网站检测方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,具体而言,涉及一种仿冒网站检测方法、装置、电子设备及存储介质。

技术介绍

[0002]传统的仿冒网站检测技术大多采用人工检测、黑名单检测、域名特征检测等手段,检测准确率不高,且需投入大量的人力资源。还有一些方法,比如基于图像颜色和图像纹理来比较两个网页图标的相似度,判定依据过于简单或者采用数值计算的方法提取图片的特征,提取的特征层次较低、特征较为简单,使得检测结果的准确率较低。

技术实现思路

[0003]本申请实施例的目的在于提供一种仿冒网站检测方法、装置、电子设备及存储介质,利用页面图像关键特征区域识别技术,基于深度学习算法进行自动检测,提高检测准确率和稳定性,解决了现有方法需要人工检测以及准确率较低的问题。
[0004]本申请实施例提供了一种仿冒网站检测方法,该方法包括:
[0005]利用预设的被仿冒网站图像数据库识别被仿冒网站的关键特征区域,以生成掩模和关键图像;
[0006]利用所述关键图像和预设的仿冒网站检测本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种仿冒网站检测方法,其特征在于,所述方法包括:利用预设的被仿冒网站图像数据库识别被仿冒网站的关键特征区域,以生成掩模和关键图像;利用所述关键图像和预设的仿冒网站检测模型构建被仿冒网站指纹库;利用所述掩模、所述被仿冒网站指纹库和所述仿冒网站检测模型对待检测网站进行检测,以确定所述待检测网站是否为仿冒网站。2.根据权利要求1所述的仿冒网站检测方法,其特征在于,在所述利用预设的被仿冒网站图像数据库识别被仿冒网站的关键特征区域的步骤之前,所述方法还包括构建被仿冒网站图像数据库:获取多个网站的网站域名并去重,以生成域名列表;筛选所述网站域名对应的页面地址;获取所述页面地址对应的网站页面,并对所述网站页面进行截图,以获得页面截图;利用所述域名列表、页面地址和所述页面截图构建被仿冒网站图像数据库,并对所述页面截图进行定期更新。3.根据权利要求2所述的仿冒网站检测方法,其特征在于,所述利用预设的被仿冒网站图像数据库识别被仿冒网站的关键特征区域,以生成掩模和关键图像,包括:获取所述被仿冒网站图像数据库中预设数量的任意页面截图;获取每张页面截图的任意像素点处的颜色值;当颜色值众数出现次数大于第一预设阈值时,记录对应的像素坐标和颜色值众数构成的集合,所述集合表示为:A={(x,y,clr)|0≤x<W,0≤y<H};其中,A表示所述集合,(x,y)表示任意像素点相对于所述页面截图左下角的偏移坐标,clr表示所述颜色值众数,W表示所述页面截图的宽度,H表示所述页面截图的高度;计算所述集合中的任意两个像素点的偏移坐标之间的距离;根据所述距离计算每个像素点的近邻点个数,若两个像素点之间的距离小于第二预设阈值,则两个像素点为近邻点;若所述近邻点个数小于第三预设阈值,则将所述像素点从所述集合中删除;将未被删除的集合中的元素构成掩模;利用所述掩模生成每个页面地址对应的关键图像。4.根据权利要求3所述的仿冒网站检测方法,其特征在于,所述利用所述掩模生成每个页面地址对应的关键图像,包括:在空白图像上的所述掩模的偏移坐标位置处,填充所述偏移坐标对应的颜色值,以生成关键图像,所述空白图像的大小与所述页面截图的大小相同。5.根据权利要求1所述的仿冒网站检测方法,其特征在于,在所述利用所述关键图像和预设的仿冒网站检测模型构建被仿冒网站指纹库的步骤之前,所述方法还包括构建仿冒网站检测模型:利用预设的仿冒网站黑名单数据获取仿冒网站的第一网站页面截图和对应的被仿冒网站的第二网站页面截图,以生成训练数据集;将所...

【专利技术属性】
技术研发人员:江军王炜陈世武杨渝
申请(专利权)人:北京天融信科技有限公司北京天融信软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1