钓鱼网站识别方法和系统技术方案

技术编号:11442539 阅读:89 留言:0更新日期:2015-05-13 13:01
本发明专利技术公开了一种钓鱼网站识别方法和系统,其中方法通过根据接收到的待识别网站,获取待识别网站的IP地址、域名信息、收录信息和网页数据;通讯连接存储有各模板库的预存数据库,根据网页数据中的各个特征关键词和预存数据库的各模板库中内置的特征字符,确定待识别网站的类型和与待识别网站的类型相匹配的第一模板库;通讯连接第一模板库,根据第一模板库中存储的数据,分别对IP地址、域名信息、收录信息和特征关键词进行分析,得到每项的单风险值,进而得到待识别网站的总风险值;比较总风险值与预设风险值,当总风险值大于或等于预设风险值时,判定待识别网站为钓鱼网站。有效解决了现有的人工方式识别钓鱼网站效率和准确率均较低的问题。

【技术实现步骤摘要】
钓鱼网站识别方法和系统
本专利技术涉及网络安全领域,特别是涉及一种钓鱼网站识别方法和系统。
技术介绍
随着互联网对生活的影响越来越深入,网络交易、中奖发布平台等越来越多的实现了网络化操作。由于钓鱼网站通常与合法网站几乎如出一辙,并且大量引用的链接图片均属于合法网站。因此,一般用户无法识别出是否为钓鱼网站,从而导致用户私人信息泄露,损害用户利益。最终影响了在线金融服务、电子商务等的发展,使得网络交易的安全度降低。而现有的对钓鱼网站的识别,通常是采用人工方式进行审核。而人工审核钓鱼网站,过程繁琐,效率和准确率均较低。
技术实现思路
基于此,有必要针对现有的人工方式识别钓鱼网站效率和准确率均较低的问题,提供一种钓鱼网站识别方法和系统。为实现本专利技术目的提供的一种钓鱼网站识别方法,包括如下步骤:根据接收到的待识别网站,获取所述待识别网站的IP地址、域名信息、收录信息和网页数据;通讯连接存储有各模板库的预存数据库,根据所述网页数据中的各个特征关键词和所述预存数据库的所述各模板库中内置的特征字符,确定所述待识别网站的类型和所述预存数据库中与所述待识别网站的类型相匹配的第一模板库;通讯连接所述第一模板库,根据所述第一模板库中存储的数据,分别对所述IP地址、所述域名信息、所述收录信息和所述特征关键词进行分析,得到每项的单风险值,并将每项所述单风险值进行综合,得到所述待识别网站的总风险值;比较所述总风险值与预设风险值,当所述总风险值大于或等于所述预设风险值时,判定所述待识别网站为钓鱼网站。在其中一个实施例中,当判断出所述待识别网站为所述钓鱼网站后,还包括如下步骤:上传所述待识别网站的所述域名信息至云端服务器。在其中一个实施例中,根据接收到的所述待识别网站,使用socket通信模拟http数据包,获取网络服务器返回的所述待识别网站的所述IP地址、所述域名信息、所述收录信息和所述网页数据。在其中一个实施例中,所述通讯连接存储有各模板库的预存数据库,根据所述网页数据中的各个特征关键词和所述预存数据库的所述各模板库中内置的特征字符,确定所述待识别网站的类型和所述预存数据库中与所述待识别网站的类型相匹配的第一模板库,包括如下步骤:依次在所述预存数据库的各模板库中内置的所述特征字符中扫描所述网页数据中的各个所述特征关键词,并对各个所述特征关键词在同一模板库中出现的次数进行求和或加权叠加,获取相应的多个特征统计值;由所述多个特征统计值中筛选出最大特征统计值;根据所述最大特征统计值,确定所述待识别网站的类型,并调取所述预存数据库中与所述待识别网站的类型相匹配的模板库作为所述第一模板库。在其中一个实施例中,所述通讯连接所述第一模板库,根据所述第一模板库,分别对所述IP地址、所述域名信息、所述收录信息和所述特征关键词进行分析,得到每项的单风险值,并将每项所述单风险值进行综合,得到所述待识别网站的总风险值,包括如下步骤:分析所述IP地址;所述IP地址为第一国外IP地址信息时,设置所述IP地址的单风险值为第一预设值;对比所述域名信息与所述第一模板库中存储的可信任域名信息,所述域名信息与所述可信任域名信息完全不同时,设置所述域名信息的单风险值为第二预设值;对比所述收录信息与所述第一模板库中存储的第一收录信息,所述收录信息小于所述第一收录信息时,设置所述收录信息的单风险值为第三预设值;对比所述特征关键词在所述网页数据中的总数量与所述第一模板库中存储的相应的第一特征字符统计值,所述特征关键词的总数量大于所述第一特征字符统计值预设值时,设置所述特征关键词的总数量的单风险值为第四预设值;对所述IP地址的单风险值、所述域名信息的单风险值、所述收录信息的单风险值和所述特征关键词的总数量的单风险值进行求和或加权叠加,得到所述待识别网站的所述总风险值。相应的,本专利技术还提供了一种钓鱼网站识别系统,包括数据获取模块、类型匹配模块、综合分析模块和比较判断模块;所述数据获取模块被配置为根据接收到的待识别网站,获取所述待识别网站的IP地址、域名信息、收录信息和网页数据;所述类型匹配模块与存储有各模板库的预存数据库通讯连接,并被配置为根据所述网页数据中的各个特征关键词和所述预存数据库的所述各模板库中内置的特征字符,确定所述待识别网站的类型和所述预存数据库中与所述待识别网站的类型相匹配的第一模板库;所述综合分析模块与所述预存数据库中的所述第一模板库通讯连接,并被配置为根据所述第一模板库中的数据,分别对所述IP地址、所述域名信息、所述收录信息和所述特征关键词进行分析,得到每项的单风险值,并将每项所述单风险值进行综合,得到所述待识别网站的总风险值;所述比较判断模块被配置为比较所述总风险值与预设风险值,当所述总风险值大于或等于所述预设风险值时,判定所述待识别网站为钓鱼网站。在其中一个实施例中,还包括数据上传模块,且所述数据上传模块与云端服务器通讯连接;当所述比较判断模块判断出所述待识别网站为所述钓鱼网站时,所述数据上传模块被配置为读取所述数据获取模块获取的所述域名信息,并上传所述域名信息至所述云端服务器。在其中一个实施例中,所述数据获取模块,用于根据接收到的所述待识别网站,使用socket通信模拟http数据包,获取网络服务器返回的所述待识别网站的所述IP地址、所述域名信息、所述收录信息和所述网页数据。在其中一个实施例中,所述类型匹配模块包括查找计算单元、特征筛选单元和模板库调取单元;所述查找计算单元被配置为依次在所述预存数据库的各模板库中内置的所述特征字符中扫描所述网页数据中的各个所述特征关键词,并对各个所述特征关键词在同一模板库中出现的次数进行求和或加权叠加,获取相应的多个特征统计值;所述特征筛选单元被配置为由所述多个特征统计值中筛选出最大特征统计值;所述模板库调取单元被配置为根据所述最大特征统计值,确定所述待识别网站的类型,并调取所述预存数据库中与所述待识别网站的类型相匹配的模板库作为所述第一模板库。在其中一个实施例中,所述综合分析模块包括第一分析设置单元、第一对比设置单元、第二对比设置单元、第三对比设置单元和综合计算单元;所述第一分析设置单元被配置为分析所述IP地址;所述IP地址为第一国外IP地址信息时,设置所述IP地址的单风险值为第一预设值;所述第一对比设置单元被配置为对比所述域名信息与所述第一模板库中存储的可信任域名信息,所述域名信息与所述可信任域名信息完全不同时,设置所述域名信息的单风险值为第二预设值;所述第二对比设置单元被配置为对比所述收录信息与所述第一模板库中存储的第一收录信息,所述收录信息小于所述可第一收录信息时,设置所述收录信息的单风险值为第三预设值;所述第三对比设置单元被配置为对比所述特征关键词在所述网页数据中的总数量与所述第一模板库中存储的相应的第一特征字符统计值,所述特征关键词的总数量大于所述第一特征字符统计值预设值时,设置所述特征关键词的总数量的单风险值为第四预设值;所述综合计算单元被配置为对所述IP地址的单风险值、所述域名信息的单风险值、所述收录信息的单风险值和所述特征关键词的总数量的单风险值进行求和或加权叠加,得到所述待识别网站的所述总风险值。上述钓鱼网站识别方法的有益效果:当对待识别网站进行审核识别时,通过由待识别网站的网页数据中的各个特征本文档来自技高网...
钓鱼网站识别方法和系统

【技术保护点】
一种钓鱼网站识别方法,其特征在于,包括如下步骤:根据接收到的待识别网站,获取所述待识别网站的IP地址、域名信息、收录信息和网页数据;通讯连接存储有各模板库的预存数据库,根据所述网页数据中的各个特征关键词和所述预存数据库的所述各模板库中内置的特征字符,确定所述待识别网站的类型和所述预存数据库中与所述待识别网站的类型相匹配的第一模板库;通讯连接所述第一模板库,根据所述第一模板库中存储的数据,分别对所述IP地址、所述域名信息、所述收录信息和所述特征关键词进行分析,得到每项的单风险值,并将每项所述单风险值进行综合,得到所述待识别网站的总风险值;比较所述总风险值与预设风险值,当所述总风险值大于或等于所述预设风险值时,判定所述待识别网站为钓鱼网站。

【技术特征摘要】
1.一种钓鱼网站识别方法,其特征在于,包括如下步骤:根据接收到的待识别网站,获取所述待识别网站的IP地址、域名信息、收录信息和网页数据;通讯连接存储有各模板库的预存数据库,根据所述网页数据中的各个特征关键词和所述预存数据库的所述各模板库中内置的特征字符,确定所述待识别网站的类型和所述预存数据库中与所述待识别网站的类型相匹配的第一模板库;通讯连接所述第一模板库,根据所述第一模板库中存储的数据,分别对所述IP地址、所述域名信息、所述收录信息和所述特征关键词进行分析,得到每项的单风险值,并将每项所述单风险值进行综合,得到所述待识别网站的总风险值;比较所述总风险值与预设风险值,当所述总风险值大于或等于所述预设风险值时,判定所述待识别网站为钓鱼网站。2.根据权利要求1所述的钓鱼网站识别方法,其特征在于,当判断出所述待识别网站为所述钓鱼网站后,还包括如下步骤:上传所述待识别网站的所述域名信息至云端服务器。3.根据权利要求1所述的钓鱼网站识别方法,其特征在于,根据接收到的所述待识别网站,使用socket通信模拟http数据包,获取网络服务器返回的所述待识别网站的所述IP地址、所述域名信息、所述收录信息和所述网页数据。4.根据权利要求1所述的钓鱼网站识别方法,其特征在于,所述通讯连接存储有各模板库的预存数据库,根据所述网页数据中的各个特征关键词和所述预存数据库的所述各模板库中内置的特征字符,确定所述待识别网站的类型和所述预存数据库中与所述待识别网站的类型相匹配的第一模板库,包括如下步骤:依次在所述预存数据库的各模板库中内置的所述特征字符中扫描所述网页数据中的各个所述特征关键词,并对各个所述特征关键词在同一模板库中出现的次数进行求和或加权叠加,获取相应的多个特征统计值;由所述多个特征统计值中筛选出最大特征统计值;根据所述最大特征统计值,确定所述待识别网站的类型,并调取所述预存数据库中与所述待识别网站的类型相匹配的模板库作为所述第一模板库。5.根据权利要求1至4任一项所述的钓鱼网站识别方法,其特征在于,所述通讯连接所述第一模板库,根据所述第一模板库,分别对所述IP地址、所述域名信息、所述收录信息和所述特征关键词进行分析,得到每项的单风险值,并将每项所述单风险值进行综合,得到所述待识别网站的总风险值,包括如下步骤:分析所述IP地址;所述IP地址为第一国外IP地址信息时,设置所述IP地址的单风险值为第一预设值;对比所述域名信息与所述第一模板库中存储的可信任域名信息,所述域名信息与所述可信任域名信息完全不同时,设置所述域名信息的单风险值为第二预设值;对比所述收录信息与所述第一模板库中存储的第一收录信息,所述收录信息小于所述第一收录信息时,设置所述收录信息的单风险值为第三预设值;对比所述特征关键词在所述网页数据中的总数量与所述第一模板库中存储的相应的第一特征字符统计值,所述特征关键词的总数量大于所述第一特征字符统计值预设值时,设置所述特征关键词的总数量的单风险值为第四预设值;对所述IP地址的单风险值、所述域名信息的单风险值、所述收录信息的单风险值和所述特征关键词的总数量的单风险值进行求和或加权叠加,得到所述待识别网站的所述总风险值。6.一种钓鱼网站识别系统,其特征在于,包括数据获取模块、类型匹配模块、综合分析模块和比较判断模块;所述数据获取模块被配置为根...

【专利技术属性】
技术研发人员:李丰初贾伟龙
申请(专利权)人:北京瑞星信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1