【技术实现步骤摘要】
一种基于GWO-BP神经网络检测钓鱼网页的方法
本专利技术属于网络安全的
,具体涉及一种基于GWO-BP神经网络检测钓鱼网页的方法。
技术介绍
随着互联网的发展,钓鱼攻击的频繁出现严重威胁了网络用户日常网络社交的安全与稳定,攻击者通过网络钓鱼,诱使他们打开非法网站,从而获得网络用户的私人信息。由于钓鱼攻击技术的不断升级,网络钓鱼攻击者可以使用多种技术使钓鱼网页看起来合法,传统的检测方法对于新型的网络钓鱼攻击手段不能完全检测出来。面对众多新型钓鱼攻击如果不能及时高效地检测预防,会使大量互联网用户上当受骗,造成经济损失和引发各种社会问题。黑白名单是检测钓鱼网页的一种直接有效的方法,但是面对钓鱼网站不断增加与不断变化的情况,此方法已不能完全满足钓鱼网页的检测。Google基于PageRank算法可以通过网页排名检测网络钓鱼页面,但是新建立的合法网站排名较低,PageRank算法无法正确地区分网页是否是钓鱼网页。主流的还有通过提取和分析网页的源代码可以检测出一些恶意行为,但是此方法在处理源代码在处理源代码时会花费太多时间,很可能会误判,对网络钓鱼检测效率较低。机器学习已成为预测与检测钓鱼网站的高效的方法,常见的用于检测钓鱼网页的机器学习模型有贝叶斯模型、支持向量机模型、神经网络模型等。这些模型用来检测钓鱼网站是有效的。基于常见的机器学习模型来检测钓鱼网页的方法虽然有一定效果,但是由于网络钓鱼的特征多样而复杂,特征工程构造不当将导致钓鱼网站检测的准确率与效率极不稳定,而且面对大规模数据集,很难找到合适的核 ...
【技术保护点】
1.一种基于GWO-BP神经网络检测钓鱼网页的方法,其特征在于,获取待测网页的URL的特征并分为显性特征和隐形特征;用GWO算法改进的BP神经网络分类器对隐性特征进行检测,并输出结果R
【技术特征摘要】
1.一种基于GWO-BP神经网络检测钓鱼网页的方法,其特征在于,获取待测网页的URL的特征并分为显性特征和隐形特征;用GWO算法改进的BP神经网络分类器对隐性特征进行检测,并输出结果RS;待测网页的URL的评估计算公式如下:
其中,D为待测网站的显性特征,且D=(D1,D2……Di);
分别分配显性特征和显性特征50%的权重,其中,
当分类器节点的输出值小于0.5时,则RS=1,否则RS=0;若评估值Z大于60,则将URL相应的网站标记为网络钓鱼网站,否则标记为正常网站。
2.根据权利要求1所述的一种基于GWO-BP神经网络检测钓鱼网页的方法,其特征在于,建立黑名单哈希库、白名单哈希库,所述黑名单哈希库是历史检测中已被标记为钓鱼网站的URL的哈希值集合,所述白名单哈希库为缓存的受信任网站的URL哈希值集合;通过建立的URL黑名单哈希库、白名单哈希库对待测网页的URL进行过滤。
3.根据权利要求2所述的一种基于GWO-BP神经网络检测钓鱼网页的方法,其特征在于,采用MD5算法对哈希库中的记录进行加密。
4.根据权利要求1所述的一种基于GWO-BP神经网络检测钓鱼网页的方法,其特征在于,所述显性特征为URL是否为IP形式特征D1,URL的长度特征D2,是否提交用户的信息到电子邮件特征D3,域名的使用时间和生命周期特征D4,URL中是否包含短地址特征D5,URL中是否是否包含@符号特征D6,URL中是否包含//符号特征D7,HTTP协议和SSL证书状态特征D8,域名的到期时间特征D9,网站图标的加载特征D10,域名结构是否存在https特征D11中的任意一种或者多种。
5.根据权利要求4所述的一种基于GWO-BP神经网络检测钓鱼网页的方法,其特征在于,
若URL中的域名是IP地址,则D1=1;否则D1=0;其中D1∈{0,1};
若URL字符长度小于等于54个字符,则D2=1;若URL字符长度大于54且小于等于75,则D2=0.5;若URL字符长度大于75,则D2=1;其中D2∈{0,0.5,1};
若待测网站使用mailto()函数或者mail()函数向用户发送信息,则D3=1;否则D3=0;其中D3∈{0,1};
若待测网站的域名使用时间低于6个月或者域名的生命周期小于1年,则D4=1;否则D4=0;其中D4∈{0,1};
若待测网站的URL后面包含短地址,则D5=1;否则D5=0;其中D5∈{0,1};
若待测网站的URL中包含@符号,则D6=1;否则D6=0;其中D6∈{0,1};
若待测网站的URL中包含//符号,则D7=1;否则D7=0;其中D7∈{0,1};
若待测网站的URL地址使用了受信任的发行者颁发的https且证书年龄不小于1年,则D8=-1;若待测网站的URL地址使用的是一般证书颁发机构的https,则D8=0;其他情况D8=1;其中D8∈{-1,0,1};
若待测网站的域名到期时间小于等于1年,则D9=1;否则D9=0;其中D9∈{0,1};
若待测网站图标favicon.icon是从其他域加载的,则D10=1;否则D10=-1;其中D10∈{-1,1};
若待测网站域名结构存在https字符串,则D11=1;否则D11=-1,其中D11∈{-1,1}。
6...
【专利技术属性】
技术研发人员:范如,范渊,
申请(专利权)人:杭州安恒信息技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。