一种钓鱼网站检测方法技术

技术编号:14478003 阅读:39 留言:0更新日期:2017-01-25 10:40
本发明专利技术公开了一种钓鱼网站检测方法,包括如下步骤:首先随机填充待检测网站的表单,当系统随机生成的账号密码验证通过,则判定待检测网站为钓鱼网站;否则,进入下一步骤;获取待检测网站快照并从中提取其logo区域的文字;将logo区域的文字与预设的白名单进行匹配,获取logo区域对应的根域名;将该根域名与白名单中的根域名进行比对,若所述域名的根域名与白名单中的根域名匹配,则判定待检测网站为非钓鱼网站;否则,判定为非钓鱼网站;本发明专利技术提供的这种钓鱼网站检测方法,具有准确度高,实时性好的特点,解决了现有钓鱼网站检测方法漏报概率大、实时性差的问题。

【技术实现步骤摘要】

本专利技术属于计算机网络安全
,更具体地,涉及一种钓鱼网站检测方法
技术介绍
随着网络信息与服务的迅速发展,人们的生活消费以及服务活动逐渐开始由现实向互联网环境转移;钓鱼网站问题随之浮现;钓鱼网站由于页面内容与被假冒的网站的页面内容几乎完全相同,导致用户被欺骗造成巨大的经济财产损失。现有技术中对于钓鱼网站的检测方法包括人工举报、关键字识别和黑白名单技术;其中,人工举报需要用户主动发现,效果较为被动;关键字识别受限于钓鱼网站文字内容,局限性较大;而黑白名单技术需要管理者不停的更新名单,漏报、错报可能性较大。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种钓鱼网站检测方法,其目的在于解决现有钓鱼网站检测方法漏报概率大、实时性差的问题。为实现上述目的,按照本专利技术的一个方面,提供了一种钓鱼网站检测方法,包括如下步骤:(1)随机填充待检测网站的表单,若表单中随机填充的账号密码通过了验证,则判定待检测网站为钓鱼网站;否则,进入步骤(2);(2)获取待检测网站快照并从中提取其logo区域的文字;(3)将所述文字与预设的白名单进行匹配,获取所述logo区域对应的根域名;(4)将所述根域名与白名单中的根域名进行比对,若所述域名的根域名与白名单中的根域名匹配,则判定待检测网站为非钓鱼网站;否则,判定为非钓鱼网站。优选地,上述钓鱼网站检测方法,所述表单的内容是根据待检测网站对用户名、密码的长度和字符格式限制随机生成的字符串。优选地,上述钓鱼网站检测方法,所述步骤(2)中,将网页快照划分为面积相同4块正方形区域,对左上的正方形区域内容进行识别;根据网站布局的统计结果获知网站logo位于页面左上区域的概率大,因此在本步骤中,直接对左上区域内容进行识别,以提高处理的实时性。优选地,上述钓鱼网站检测方法,所述步骤(3)中,通过去除请求参数,去除控制器与方法字段,对所述域名的当前统一资源定位符(UniformResourceLocator,URL)进行字符串处理获取根域名。优选地,上述钓鱼网站检测方法,所述步骤(4)具体为:将根域名与官网域名进行比对,若两者匹配,则判定待检测网站为非钓鱼网站;否则,判定待检测网站为钓鱼网站。总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:(1)本专利技术提供的钓鱼网站检测方法,直接从图片层次进行识别,解决了钓鱼网站将文字内容伪装成图片从而导致误报、漏报的问题;相比较而言,现有的钓鱼网站检测技术的检测初始点为网站的源代码,通过对网站源代码的分析判断出该网站是否为钓鱼网站;这类方法的缺陷在于:由于源代码中看不到图片内容,因此无法识别出用图片伪造内容的钓鱼网站,而产生误报、漏报;(2)本专利技术提供的钓鱼网站检测方法,通过分析图片内容与URL的对应性,可以判断待检测网站是否为钓鱼网站,并具有普适性,无论钓鱼网站如何在源代码中隐藏伪造痕迹,其伪造的网站均与白名单中的真实网站内容相似或相同,呈献给用户的视觉信息不会发生改变,由此可由一条白名单数据检测出多条钓鱼网站信息,具有高效检测的特点;相比较而言,现有的钓鱼网站检测技术仅通过源代码中的文字内容进行识别,无法直接与用户所看到的内容产生一致性,可能存在视觉信息与网站内容不相匹配的情况,从而产生漏判、误判;(3)本专利技术提供的钓鱼网站检测方法,由于与服务端之间仅仅传递的是待检测网站的URL,再在服务端上对该URL对应的网站进行检测,整个过程传递的都只是文字内容,传递速度快,因此提高了钓鱼网站检测的实时性。附图说明图1是本专利技术实施例提供的钓鱼网站检测方法流程图;图2是本专利技术实施例所检测的某购物网站的登录界面示意图;图3是本专利技术实施例所检测的某购物网站的登录界面的切分示例图;图4是本专利技术实施例所检测的某购物网站的登录界面的左上方logo区域示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。本专利技术提供的钓鱼网站检查方法,先随机填充待检测网站中的表单,若表单中随机填充的账号密码通过了验证,则判定待检测网站为钓鱼网站;否则继续判断;生成网站快照并用图像识别技术识别logo区域的文字,将文字与白名单数据库中对应数据进行匹配,并取白名单中的根域名与待检测网站根域名进行比对,若比对成功,则判定为非钓鱼网站,若比对不成功,则判定为钓鱼网站;与现有的钓鱼网站检查方法相比,本专利技术的这种方法利用钓鱼网站的登录系统大多只是虚设,实则为了获取用户账号信息的特点,用虚假的账号密码组合进行试探,从而进行初始判断;对于初始判断不能确定的网站,则直接利用图像识别待测网页的logo,从视觉上判断待测网页是否为钓鱼网站,做到与用户所看到的内容相一致,从而避免误判、漏判。以下结合对某购物网站进行检测的实施例,来具体阐述本专利技术提供的钓鱼网站检测方法;实施例提供的钓鱼网站检查方法,其流程如图1所示,具体包括如下步骤:(1)随机填充表单数据;实施例中,账号填充为asdiw9424uad,密码为23iwsdh824!ad;其填充页面如图2所示;(2)根据待检测网站返回内容中是否有类似“账户名与密码不匹配”的文本判断是否登录成功来判断待检测网站是否为钓鱼网站;当待检测网站返回内容中不存在该类文本,表明登陆成功,判定待检测网站为钓鱼网站,否则进入步骤(3);(3)生成待检测网站对应页面的网页快照,提取网页快照左上方内容,并利用光学字符识别技术(OpticalCharacterRecognition,OCR)提取Logo区域的文字;(4)将检测出的所有文字与预设的白名单进行匹配,找出存在于文字中的白名单域名,获取Logo区域对应的根域名;(5)将上述根域名与白名单中的根域名进行比对,若所述域名的根域名与白名单中的根域名匹配,则判定待检测网站为非钓鱼网站;否则,判定为非钓鱼网站;本实施例中,待测网站域名的根域名为www.ks-harq.cn,白名单中的域名为www.taobao.com,两者不匹配;判定待测网站为钓鱼网站。实施例中,检测到待测网站的源代码进行了加密;对于在这类源代码加密的钓鱼网站,通过现有的通过源代码检测来进行钓鱼网站识别的方法,极易误判,漏判;而采用本实施例提供的这种从提前的网页快照的图片层次进行识别,则解决了漏判、误判的问题。本领域的技术人员容易理解,以上所述仅为本专利技术的较佳实施例而已,并不用以限制本专利技术,凡在本专利技术的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...
一种钓鱼网站检测方法

【技术保护点】
一种钓鱼网站检测方法,其特征在于,包括如下步骤:(1)随机填充待检测网站的表单,若表单中随机填充的账号密码通过了验证,则判定待检测网站为钓鱼网站;否则,进入步骤(2);(2)获取待检测网站快照并从中提取其logo区域的文字;(3)将所述文字与预设的白名单进行匹配,获取所述logo区域对应的根域名;(4)将所述根域名与白名单中的根域名进行比对,若所述域名的根域名与白名单中的根域名匹配,则判定待检测网站为非钓鱼网站;否则,判定为非钓鱼网站。

【技术特征摘要】
1.一种钓鱼网站检测方法,其特征在于,包括如下步骤:(1)随机填充待检测网站的表单,若表单中随机填充的账号密码通过了验证,则判定待检测网站为钓鱼网站;否则,进入步骤(2);(2)获取待检测网站快照并从中提取其logo区域的文字;(3)将所述文字与预设的白名单进行匹配,获取所述logo区域对应的根域名;(4)将所述根域名与白名单中的根域名进行比对,若所述域名的根域名与白名单中的根域名匹配,则判定待检测网站为非钓鱼网站;否则,判定为非钓鱼网站。2.如权利要求1所述的钓鱼网站检测方法,其特征在于,所述表单的内容是根据待检测网站对用户名、...

【专利技术属性】
技术研发人员:王大为
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1