一种基于功能图片识别仿冒网站的方法及系统技术方案

技术编号:14964375 阅读:105 留言:0更新日期:2017-04-02 18:46
本发明专利技术公开了一种基于功能图片识别仿冒网站的方法,包括:获取待识别网站的功能图片,并形成功能图片集;基于所述功能图片集生成哈希序列;将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于美化需要设置的功能性图片。本发明专利技术还公开了一种基于功能图片识别仿冒网站的系统。本发明专利技术所述技术方案能够有效识别仿冒网站。

【技术实现步骤摘要】

本专利技术涉及网络安全
,尤其涉及一种基于功能图片识别仿冒网站的方法及系统
技术介绍
目前,存在一些用于发现仿冒网站的现有技术,包括:1、使用浏览器访问仿冒网站,在相同分辨率下对网站进行截图,而后通过对已经保存的同分辨率网页截图进行哈希比对,进而识别出哪些网站是仿冒网站。2、通过对网站的访问,获取到网站头像(即ICO图标),将网站头像提取出多张图片得到图片集合,通过对图片集合的识别判断图片集合与现有的网站是否相似,若相似则为仿冒网站。以上方法受限于网站的版面大小与截图中分辨率的大小,如果版面过大在相同分辨率下一次截图很难完成,可能需要多次截图,同时要保证截图的完整性;对于读取网页头像(即ICO图标)的方法由于紧紧局限于网页中含有网站头像的,当网站中没有网站头像该方法就不能够实现检测仿冒网站的目的。通过对大量现有的仿冒网站进行研究,发现为了使网站更像被仿冒网站的真实网站,仿冒者通常采用感官上的仿冒,也就是说无论仿冒网站的源代码多么混乱以及不专业,甚至文字也只是一张图片,那么对于实际访问的用户来说最主要的就是感官上的真而已。所以,无论如何仿冒的网站一定要带上被仿冒的网站的功能图片,使得网站从感官上让人难以区分真伪。
技术实现思路
本专利技术所述的技术方案通过采集待识别网站中能够显示而在网页源码中有迹可循的网站功能图片,作为用于识别网站是否为仿冒网站的基础。收集待识别网站的功能图片生成功能图片集,并基于功能图片集生成哈希序列,与相应的授信网站的哈希序列对比,若相似度超过设定阈值,则认为是仿冒网站。本专利技术所述技术方案能够克服传统识别仿冒网站所存在的问题,能够高效准确地识别仿冒网站。本专利技术采用如下方法来实现:一种基于功能图片识别仿冒网站的方法,包括:获取待识别网站的功能图片,并形成功能图片集;基于所述功能图片集生成哈希序列;将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于美化需要设置的功能性图片。进一步地,所述功能图片,包括:图片超链接或者图片按钮。更进一步地,所述获取待识别网站的功能图片,包括:获取<a>标签下<img>标签下的图片文件;或者,获取<button>标签下<img>标签下的图片文件;或者,获取<input>标签中的图片文件。其中,所述获取待识别网站的功能图片后,还包括:过滤广告图片或者自带展示图片。本专利技术采用如下系统来实现:一种基于功能图片识别仿冒网站的系统,包括:功能图片集生成模块,用于获取待识别网站的功能图片,并形成功能图片集;哈希序列生成模块,用于基于所述功能图片集生成哈希序列;仿冒网站判定模块,用于将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于美化需要设置的功能性图片。进一步地,所述功能图片,包括:图片超链接或者图片按钮。更进一步地,所述获取待识别网站的功能图片,包括:获取<a>标签下<img>标签下的图片文件;或者,获取<button>标签下<img>标签下的图片文件;或者,获取<input>标签中的图片文件。其中,所述获取待识别网站的功能图片后,还包括:过滤广告图片或者自带展示图片。综上,本专利技术给出一种基于功能图片识别仿冒网站的方法及系统,通过获取待识别网站的所有功能图片,并基于收集到的功能图片生成哈希序列,将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,若相似度超过设定阈值,则判定待识别网站为仿冒网站。有益效果为:本专利技术所述的方法及系统,有别于传统基于网页头像或者网站徽标来识别仿冒网站的方法,基于待识别网站的各种功能性图片来识别是否是仿冒网站,从而克服了传统方法的准确性一定程度上受限于版面大小或者分辨率大小的问题。利用本专利技术所述技术方案能够识别超大网页以及没有网站徽标的仿冒网站。附图说明为了更清楚地说明本专利技术的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种基于功能图片识别仿冒网站的方法实施例流程图;图2为本专利技术提供的一种基于功能图片识别仿冒网站的系统实施例结构图。具体实施方式本专利技术给出了一种基于功能图片识别仿冒网站的方法及系统实施例,为了使本
的人员更好地理解本专利技术实施例中的技术方案,并使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图对本专利技术中技术方案作进一步详细的说明:本专利技术首先提供了一种基于功能图片识别仿冒网站的方法实施例,如图1所示,包括:S101获取待识别网站的功能图片,并形成功能图片集;S102基于所述功能图片集生成哈希序列;其中,所述哈希序列可以是基于全哈希算法或者感知哈希算法生成的哈希序列;S103将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于美化需要设置的功能性图片。其中,所述功能图片可以是PNG文件、JPG文件、BMP文件、JPEG文件等常见图片类型。优选地,所述功能图片,包括:图片超链接或者图片按钮。例如:网站为了美化需要将一些超链接设置成图片超链接,这样可以形象表示超链接所连接内容的属性;同时,会将一些按钮设置成图片按钮,也是为了美化需要;而这些图片超链接和图片按钮是一个网站的主要组成部分,也是用户识别网站的重要依据。更优选地,所述获取待识别网站的功能图片,包括:获取<a>标签下<img>标签下的图片文件;或者,获取<button>标签下<img>标签下的图片文件;或者,获取<input>标签中的图片文件。其中,所述获取待识别网站的功能图片后,还包括:过滤广告图片或者自带展示图片。本专利技术还提供了一种基于功能图片识别仿冒网站的系统实施例,如图2所示,包括:功能图片集生成模块201,用于获取待识别网站的功能图片,并形成功能图片集;哈希序列生成模块202,用于基于所述功能图片集生成哈希序列;仿冒网站判定模块203,用于将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于美化需要设置的功能性图片。优选地,所述功本文档来自技高网
...

【技术保护点】
一种基于功能图片识别仿冒网站的方法,其特征在于,包括:获取待识别网站的功能图片,并形成功能图片集;基于所述功能图片集生成哈希序列;将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于美化需要设置的功能性图片。

【技术特征摘要】
1.一种基于功能图片识别仿冒网站的方法,其特征在于,包括:
获取待识别网站的功能图片,并形成功能图片集;
基于所述功能图片集生成哈希序列;
将所述哈希序列与预先生成的对应授信网站的功能图片集的哈希序列对比,判断相似度是否超过设定阈值,若是,则判定是仿冒网站,否则待进一步检测;其中,所述功能图片为网站基于美化需要设置的功能性图片。
2.如权利要求1所述的方法,其特征在于,所述功能图片,包括:图片超链接或者图片按钮。
3.如权利要求2所述的方法,其特征在于,所述获取待识别网站的功能图片,包括:
获取<a>标签下<img>标签下的图片文件;或者,
获取<button>标签下<img>标签下的图片文件;或者,
获取<input>标签中的图片文件。
4.如权利要求1~3所述的方法,其特征在于,所述获取待识别网站的功能图片后,还包括:过滤广告图片或者自带展示图片。
5.一种基于功能图片识别仿冒网站的系统...

【专利技术属性】
技术研发人员:汤洪飞李柏松
申请(专利权)人:深圳市安之天信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1