钓鱼网页的深度学习智能检测方法技术

技术编号:7543501 阅读:361 留言:0更新日期:2012-07-13 06:59
本发明专利技术公开了属于网络信息安全技术领域的钓鱼网页的深度学习智能检测方法。包括以下步骤:1)对网页文档模型进行分析,生成网页文档特征向量F;2)将待测网页转化为图像,并采用谱聚类方法对所得图像进行分割;3)提取网页图像特征,从而获得网页内容特征向量N;4)使用流形学习Isomap算法对网页内容特征向量N降维得到特征空间Vnew;5)用DBN分类器对特征空间Vnew进行训练和测试,根据DBN分类器结果判别待检测的网页是否为钓鱼网页。本发明专利技术的有益效果为:检测的特征参数覆盖更加全面,相比文本特征提取方法,DBN深度信任网络算法具有较高的检测精度和较快的检测速度,提高了钓鱼式攻击检测率。

【技术实现步骤摘要】

本专利技术属于网络信息安全
,尤其涉及。
技术介绍
近年来网络“钓鱼”攻击频频出现,严重地影响了电子商务的发展,也给公众造成了很大的危害。国内常见的“钓鱼”式攻击(Phishing),如仿冒各大银行等金融机构和大型交易门户的钓鱼网站,危害非常严重。当前针对钓鱼网页的检测技术一般是单独基于文档模型或网页图像的检测方法。由于HTML语言的灵活性和网页元素的动态性,仿冒者能做出看上去一样但结构完全不同的网页,因而单独基于文档模型的钓鱼网页检测方法存有很大缺陷;同样,目前基于图像的网页相似检测方法主要是根据人的视觉原理,对网页的视觉相似度进行判定,虽然难度较大,攻击发起者对被仿冒的网页的模仿也可以做到以假乱真的程度。综上所述,以往钓鱼网页检测方法中存在的检测识别特征不全面、智能检测精度不足等缺点。
技术实现思路
本专利技术针对上述缺陷公开了,该方法用于解决目前单纯基于文档型或图像型钓鱼网页检测技术对图片网页处理的不足,以及钓鱼网页检测精度不高的问题。,包括以下步骤1)对网页文档模型进行分析,生成网页文档特征向量F ;2)将待测网页转化为图像,并采用谱聚类方法对所得图像进行分割;3)提取网本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:李元诚沈尚方
申请(专利权)人:华北电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术