一种钓鱼网站的收集方法和系统技术方案

技术编号:7850953 阅读:194 留言:0更新日期:2012-10-13 07:58
本发明专利技术属于网络安全技术领域,具体公开了一种钓鱼网站的收集方法和系统。该方法和系统通过:实时监测用户当前访问网站的网页内容信息;判断所述网页内容信息是否含有所述特征内容;若无,则返回继续监测用户当前访问网站的网页内容信息;若有,则上传所述网页内容信息对应网站的URL至系统服务器;系统服务器判断所述URL是否在其黑白名单数据库中;若在,则返回继续监测用户当前访问网站的网页内容信息;若不在,则系统服务器将所述URL上传至后台验证系统优先验证;后台验证系统将验证结果回传至系统服务器以更新其黑白名单数据库,以定向收集相同特征内容钓鱼网站,从而使得系统对于灰色网站的检测具有针对性,进而提高钓鱼网站的检出机率。

【技术实现步骤摘要】

本专利技术属于网络安全
,具体涉及ー种钓鱼网站的收集方法和系统
技术介绍
所谓“钓鱼网站”是ー种网络欺诈行为,指不法分子利用各种手段,仿冒真实网站的URL (网页地址)以及页面内容,或者利用真实网站服务器程序上的漏洞在站点的某些网页中插入危险的HTML代码,以此来骗取用户银行或信用卡账号、密码等私人资料。钓鱼网站,通常伪装成为银行网站或仿冒银行网上购物在先支付网页,窃取访问者提交的账号和密码信息。它一般通过电子邮件传播,此类邮件中ー个经过伪装的链接将收件人联到钓鱼网站。钓鱼网站的页面与真实网站界面完全一致,要求访问者提交账号和密码。一般来说钓鱼网站结构很简単,只有ー个或几个页面,URL和真实网站有细微差别。目前,为了防范钓鱼网站的主要手段是在客户端将网站的URL送服务器端的黒白数据库进行查询,所谓的黑数据库即是已审核确认的钓鱼网站的URL数据库,所谓的白数据库即是已审核确认的安全网站的URL。例如我国申请号为201110191152. O公开的ー种网络交易安全系统及方法,如图I和2所示,该技术就是将当前网站的URL送到系统服务器,在系统服务器的黒白数据库名单中查询其是黑(钓鱼网站)、是白(安全网站)、还是灰(即是不在黒白数据库中,处于未知状态的网站),然后将查询结果反馈给系统客户端。实际上,对于灰网站,还会将其URL送内网系统检查其黑白,在内网中将该URL对应的网页内容下载下来根据一定的判断规则进一步确定其黒白,这也是钓鱼网站收集最常用的途径。由于,每天都会产生大量的新网站(新网站对于钓鱼网站检测系统来讲都是灰网 站),内网根本没有办法一一检查的,只能随机抽检或者按照一定的匹配规则进行过滤是检測。因此,此种方式没有针对性,漏检的概率相对较高。
技术实现思路
为了提高内网对于钓鱼网站的检出机率,本专利技术的目的在于提供一种钓鱼网站的收集系统和方法。经过研究发现,为了提高用户上当受骗的概率,大量的钓鱼网站都结合了ー些当下流行的元素,此时这些流行元素就是它们的相同特征内容,例如某种产品在互联网上很火爆,那么很多钓鱼网站都可能伪装成此类网站进行行骗,其网页内容就包括该产品的名称等特征内容。因此,为了实现本专利技术的目的,本专利技术所采用技术方案如下本专利技术提供ー种钓鱼网站的收集方法,用于定向收集具有相同特征内容钓鱼网站,包括启动系统客户端,实时监测用户当前坊问网站的网页内容信息;判断所述网页内容信息是否含有所述某类钓鱼网站的特征内容;若无,则继续监测用户当前坊问网站的网页内容信息;若有,则上传所述网页内容信息对应网站的URL至系统服务器;系统服务器将所述URL上传至后台验证系统优先验证;后台验证系统将验证结果回传至系统服务器以更新其黒白名単数据库。进ー步的,为了避免重复检测的情况发生,在系统服务器将所述URL上传至后台验证系统优先验证之前还包括系统服务器判断所述URL是否在其黒白名単数据库中;若不在,则系统服务器将所述URL上传至后台验证验证系统优先验证;若在,则返回继续监测用户当前坊问网站的网页内容信息。本专利技术还提供ー种钓鱼网站的收集系统,用于定向收集具有相同特征内容钓鱼网站,该收集系统包括安装于用户終端设备中的系统客户端、与所述系统客户端交互通信的系统服务器、以及与所述系统服务器交互通信的后台验证系统,在所述系统服务器中设置有黒白名単数据库;在所述系统客户端设置有ー监测模块,用于实时监测用户当前访问网站的网页内容信息;在所述系统客户端还设置有一判断模块,用于判断所述网页内容信息是否含有所述某类钓鱼网站的特征内容,若无,则继续监测用户当前坊问网站的网页内容信息,若有,则上传所述网页内容信息对应网站的URL至系统服务器;在所述系统服务器中设置有ー传输模块,用于将所述URL上传至后台验证系统优先验证;在所述后台验证系统中设置有一反馈模块,用于将验证结果回传至系统服务器以更新其黒白名単数据库。进ー步的,为了避免重复检测的情况发生,在所述系统服务器中还设置有ー检测模块,用于判断所述URL是否在其黒白名単数据库中,若不在,则系统服务器将所述URL上传至后台验证系统优先验证,若在,则返回继续监测用户当前坊问网站的网页内容信息。进ー步的,为了方便系统客户端判断模块判断,在所述系统客户端还设置有一客户端特征数据库,用于存储所述某类钓鱼网站的特征内容。进ー步的,为了便于更新某类钓鱼网站的特征内容,在所述系统服务器中还设置有一服务器端特征数据库,用于存储所述某类钓鱼网站的特征内容。本专利技术为了提高钓鱼网站的检出机率,通过实时监测用户当前坊问网站的网页内容信息,判断所述网页内容信息是否含有某类钓鱼网站的特征内容,将含有这些信息的网站上传至后台验证系统优先验证,从而使得钓鱼网站的收集更有针对性,必然提高其检出机率。附图说明此附图说明所提供的图片用来辅助对本专利技术的进ー步理解,构成本申请的一部分,并不构成对本专利技术的不当限定,在附图中图I为现有技术的结构示意图;图2为现有技术的操作流程示意图;图3为本专利技术的基本检测流程示意图;图4为本专利技术的一种优选检测流程示意图;图5为图3所对应的基本结构不意图;图6是图4所对应的优选结构示意图。图中1、现有结构示意图 II、系统客户端12、系统服务器 III、监听模块112、判断模块 113、提示模块121黑白名单库 2、本专利技术结构示意图 21、系统客户端22、系统服务器 23、后台验证系统211监测模块 212、判断模块213、客户端特征数据库 221、黑白名单数据库222、检测模块223、传输模块224、服务器端特征数据库231、反馈模块具体实施例方式下面将结合附图以及具体实施方法来详细说明本专利技术,在本专利技术的示意性实施及说明用来解释本专利技术,但并不作为对本专利技术的限定。实施例I :如图3所示,本实施例公开了ー种钓鱼网站的收集方法,用于定向收集具有相同特征内容钓鱼网站,所述相同特征内容可以如当下流行的某个“热门词汇”、也可以是“热门词汇”加“银行账户”、也可以是“热门词汇”加“中奖”等用于表针钓鱼网站的内容,该方法具体包括以下步骤启动系统客户端,实时监测用户当前坊问网站的网页内容信息;判断所述网页内容信息是否含有所述特征内容;具体的监测和判断方法可以是如将需要收集的某类钓鱼网站的特征内容作为关键字,在整个网页中查找是否包含所述关键字的方式,也可以为其他现有判断方式;若无,则返回继续监测用户当前坊问网站的网页内容信息;若有,则上传所述网页内容信息对应网站的URL至系统服务器;系统服务器将所述URL上传至后台验证系统优先验证;所谓的优先验证具体可以是采用现有方法对定向收集上来的URL优先判断其黒白性质;后台验证系统将验证结果回传至系统服务器以更新其黒白名単数据库;所述的验证结果就是外网站对应的黒白性质,黑网站存进对应的黑名单数据库,白网站存进对应的白名単数据库;当然对于已经存在于黑白名単数据库中的URL,要对其性质进行更新修正。通过上述方式,可以定向收集相同特征内容钓鱼网站,尤其是伴随一些流行元素应运而生的钓鱼网站,从而使得系统对于灰色网站的检测具有针对性,进而提高钓鱼网站的检出机率。如图5所示,是本实施例方法对应的收集系统2,该收集系统2包括安装于用户终端设备中的系统客户端21、与所述系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.ー种钓鱼网站的收集方法,用于定向收集具有相同特征内容钓鱼网站,其特征在于包括 启动系统客户端,实时监测用户当前坊问网站的网页内容信息; 判断所述网页内容信息是否含有所述特征内容; 若无,则返回继续监测用户当前坊问网站的网页内容信息; 若有,则上传所述网页内容信息对应网站的URL至系统服务器; 系统服务器将所述URL上传至后台验证系统优先验证; 后台验证系统将验证结果回传至系统服务器以更新其黒白名単数据库。2.根据权利要求I所述的收集方法,其特征在于,在系统服务器将所述URL上传至后台验证系统优先验证之前还包括 系统服务器判断所述URL是否在其黒白名単数据库中; 若不在,则系统服务器将所述URL上传至后台验证系统优先验证; 若在,则返回继续监测用户当前坊问网站的网页内容信息。3.—种钓鱼网站的收集系统,用于定向收集具有相同特征内容钓鱼网站,该收集系统包括安装于用户終端设备中的系统客户端、与所述系统客户端交互通信的系统服务器、以及与所述系统服务器交互通信的后台验证系统,在所述系统服务器中设置有黒白名单数据库,其特征在干 在...

【专利技术属性】
技术研发人员:彭仁诚潘建波
申请(专利权)人:珠海市君天电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1