【技术实现步骤摘要】
本专利技术提供,它具体涉及一种基于网页样式相似度的钓鱼 网页检测方法,属于计算机互联网(Web)安全领域。
技术介绍
钓鱼网页通过仿冒真实网页的统一资源定位符(Uniform Resource Locator, URL)和页面特征,构造在视觉效果上与真实网页相似的页面,或者利用真实网页的服务器 漏洞注入危险的超文本标记语言(Hyper Text Markup Language,即HTML)代码,以骗取用 户个人信息(如信用卡账号、密码和身份证号码等),达到获取经济利益的目的。近年来,钓 鱼网页数量持续高速增长,每年给用户造成巨大的经济损失,已成为互联网的主要安全威 胁之一。钓鱼网页的检测与识别是Web安全领域的重要研究内容。 主流的钓鱼网页检测技术可分为基于URL和基于页面相似度的两类方法。URL是 互联网上可以访问的资源的唯一标识。传统的钓鱼网页检测方法主要基于URL建立钓鱼网 页黑名单或者从统计学的角度对URL的语义和结构进行分析。但是很多钓鱼网页将URL隐 藏在多层iframe下,检测引擎需要对其进行连续追踪下载才能获取钓鱼 ...
【技术保护点】
一种钓鱼网页检测方法,其特征在于:该方法具体步骤如下:步骤一:网页样式特征提取;提取可疑网页Ps与目标网页Pi网页可视部分的文档树结构和CSS文本;步骤1.1:文档树提取;提取可疑网页Ps与目标网页Pi可视部分的文档树结构Tree(Ps)与Tree(Pi);步骤1.2:CSS文本提取;提取可疑网页Ps与目标网页Pi的CSS文本;步骤二:网页样式特征筛选;筛选Tree(Ps)与Tree(Pi)中的元素;解析可疑网页Ps与目标网页Pi的CSS文本,得到对应的规则对象集合,并对所有的规则对象进行筛选;步骤2.1:文档树元素筛选;以深度优先法遍历步骤1.1得到的文档树,遍历过程中, ...
【技术特征摘要】
与目标网页Pi的网页样式相似度S(Ps,Pi); 步骤四:结果判决;根据步骤三中得到的计算结果和可疑网页Ps与目标网页Pi的域 名,判断Ps是否为钓鱼网页; 步骤4. 1 :网页样式复杂度判决;若C(PS)小于预设阈值,则认为可疑网页的网页样式 复杂度过低,该页面可能采用图片或表单形式来模仿某个网页样式复杂...
【专利技术属性】
技术研发人员:毛剑,李佩,李腾,陈岳,马寒军,刘建伟,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。