基于混合方法的三层钓鱼网站检测系统技术方案

技术编号：23318358 阅读：29 留言：0更新日期：2020-02-11 18:58

本发明专利技术公开了基于混合方法的三层钓鱼网站检测系统，此检测系统由三层组成：第一层黑白名单、表单过滤层、第二层favicon检测层和第三层机器学习检测层；第一层黑白名单、表单过滤层可以及时发现已知钓鱼网站，降低检测的成本。第二层favicon检测层能够通过faviocn识别网站的真实身份从而检测钓鱼网站，速度较快且不需消耗太多资源。第三层机器学习检测层可以准确的地对第二层判定为可疑的网站进行识别，得到更精确的判定结果。三个级别的检测既保证识别结果的准确性，又能尽可能的降低检测的时间。

Detection system of three-layer phishing website based on hybrid method

全部详细技术资料下载

【技术实现步骤摘要】
基于混合方法的三层钓鱼网站检测系统
本专利技术涉及网站检测系统，具体为基于混合方法的三层钓鱼网站检测系统。
技术介绍
网络钓鱼是一种欺诈行为，用于通过互联网欺骗用户，发起网络钓鱼攻击的攻击者通常被称为网络钓鱼者(phishers)。国际反网络钓鱼工作组(APWG,Anti-PhishingWorkingGroup)给网络钓鱼的定义是:网络钓鱼是一种网络攻击方式，它利用社会工程学和技术手段，来窃取消费者的个人身份数据和财务账户凭证。采用社会工程手段的网络钓鱼攻击通常向用户发送欺骗性电子邮件、手机短信等，引诱用户泄露凭证信息(如用户名、密码)或下载恶意软件。而技术手段的攻击则是直接在PC上移植恶意软件(如浏览器中间者MitB,man-in-the-browser攻击)，采用某些技术手段直接窃取凭证信息，如使用系统拦截用户的用户名和密码、误导用户访问伪造的网站等。网络钓鱼由于严重影响了网民利益和互联网的信誉，国际反网络钓鱼工作组(APWG,Anti-PhishingWorkingGroup)于2003年应许各个非盈利机构和行业的要求，建立了基于钓鱼网站URL的数据库并将其数据定时分发从而让各行业得以参考。而根据APWG趋势报告；近些年网络钓鱼攻击发展迅速。在2018Q1季度的网络钓鱼活动趋势报告中，2018年第一季度检测到的网络钓鱼总数为263,538。这比2017Q4观察到的180,577增加了46％，这也远远超过2017年第三季度的190,942。日益猖獗的网络钓鱼导致互联网用户遭受经济损失、身份欺诈等...

【技术保护点】
1.基于混合方法的三层钓鱼网站检测系统，其特征在于：此检测系统由三层组成：第一层黑白名单、表单过滤层、第二层favicon检测层和第三层机器学习检测层；/n(1)、第一层黑白名单过滤层：直接通过现有的Google API钓鱼网站黑名单和Alexa网站TOP250构建黑白名单；/n登录表单过滤器，它将没有提交表单登录的网站分类为普通网站，因为目的是检测钓鱼网站，所以没有表单提交的页面显然不具有钓鱼属性；/n经过两个过滤器，如果未被过滤的网站，则会进入下面的流程，被过滤的网站会直接返回结果，这样能提升大部分常见网站的响应；/n当待测网站在黑名单或白名单中被匹配到，则返回检测结果，当待检测网站未在黑白名单匹配到时，若被表单过滤器过滤则输出为合法网站，否则进入下一层检测；/n(2)、第二层favicon检测层，第二层使用favicon来获取网页的身份，相比于网页的其他视觉特征，favicon更能标识一个网页的身份；并且采用Google Search搜索favicon，避免了自己维护数据库而消耗大量的计算与存储资源，其流程如下：/n(2-1)、favicon提取过程：通过对应网址，即可取得网页对...

【技术特征摘要】
1.基于混合方法的三层钓鱼网站检测系统，其特征在于：此检测系统由三层组成：第一层黑白名单、表单过滤层、第二层favicon检测层和第三层机器学习检测层；
(1)、第一层黑白名单过滤层：直接通过现有的GoogleAPI钓鱼网站黑名单和Alexa网站TOP250构建黑白名单；
登录表单过滤器，它将没有提交表单登录的网站分类为普通网站，因为目的是检测钓鱼网站，所以没有表单提交的页面显然不具有钓鱼属性；
经过两个过滤器，如果未被过滤的网站，则会进入下面的流程，被过滤的网站会直接返回结果，这样能提升大部分常见网站的响应；
当待测网站在黑名单或白名单中被匹配到，则返回检测结果，当待检测网站未在黑白名单匹配到时，若被表单过滤器过滤则输出为合法网站，否则进入下一层检测；
(2)、第二层favicon检测层，第二层使用favicon来获取网页的身份，相比于网页的其他视觉特征，favicon更能标识一个网页的身份；并且采用GoogleSearch搜索favicon，避免了自己维护数据库而消耗大量的计算与存储资源，其流程如下：
(2-1)、favicon提取过程：通过对应网址，即可取得网页对应的favicon；
(2-2)、身份验证过程：此过...

【专利技术属性】
技术研发人员：谷勇浩，高翊睿，李良训，黄泽祺，王翼翡，郭振洋，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人