【技术实现步骤摘要】
一种钓鱼网站检测方法、系统、设备及介质
[0001]本专利技术涉及计算机网络安全领域,特别是涉及一种钓鱼网站检测方法、系统、设备及介质。
技术介绍
[0002]随着互联网技术的蓬勃发展,网络安全问题层出不穷。违规网站是一种典型的在线欺诈行为,包括网络钓鱼、色情赌博、恶意软件传播等。其中,钓鱼网站以互联网为载体,通过伪装成信誉良好的合法网站欺骗用户以获得用户的敏感信息,被欺骗的用户会产生不同程度的个人信息泄漏,继而导致经济损失。如何快速准确的检测钓鱼网站的统一资源定位符(Uniform Resource Locator,URL)是网络安全研究热点。目前,现有的钓鱼网站检测技术主要包括:
[0003](1)基于黑白名单机制的检测技术:作为一种实用的核心技术,黑白名单具有高效准确的优点。通过对域名的判定,可以快速定位钓鱼网站,是最常用的实现技术之一。
[0004](2)基于贝叶斯算法的检测技术:金庆等人基于规则的贝叶斯算法,制定了一系列的匹配钓鱼网站的规则。随后为每个规则分配其相应的权值,计算其修正系数,得出被测网 ...
【技术保护点】
【技术特征摘要】
1.一种钓鱼网站检测方法,其特征在于,包括:基于预先存储的白名单网站,对目标网站的统一资源定位符的字符串的字符位置进行测量和权重标注,得到目标网站的统一资源定位符的字符串中各字符的位置相似度权重;其中,域名位置处的差异字符的位置相似度权重大于路径位置处的差异字符的相似度权重;所述差异字符为同一个字符位置处,目标网站与白名单网站的字符存在差异的字符;基于预先存储的白名单网站,对目标网站的统一资源定位符的字符串的相似度进行测量和权重标注,得到目标网站的统一资源定位符的字符串中各字符的视觉相似度权重;其中,对于目标网站与白名单网站中处于同一个字符位置处的字符,视觉错误程度越大的字符则视觉相似度权重越大;基于预先存储的白名单网站,对目标网站的统一资源定位符的字符串操作进行分类和权重标注,得到目标网站的统一资源定位符的字符串的操作相似度权重;其中,不同的字符串操作对应不同的操作相似度权重;将白名单网站的统一资源定位符转换为二值图片,得到白名单二值图片;将目标网站的统一资源定位符转换为二值图片,得到目标二值图片;将所述白名单二值图片转换为一维向量,得到白名单向量,将所述目标二值图片转换为一维向量,得到目标向量;计算所述目标向量和所述白名单向量的视觉距离;根据所述位置相似度权重、所述视觉相似度权重、所述操作相似度权重和所述视觉距离确定所述目标网站是否为钓鱼网站。2.根据权利要求1所述的一种钓鱼网站检测方法,其特征在于,所述视觉距离的计算公式为:其中,M(v,u)表示目标向量和白名单向量的视觉距离;v表示目标向量;u表示白名单向量。3.根据权利要求1所述的一种钓鱼网站检测方法,其特征在于,根据所述位置相似度权重、所述视觉相似度权重、所述操作相似度权重和所述视觉距离确定所述目标网站是否为钓鱼网站,具体包括:判断所述位置相似度权重、所述视觉相似度权重、所述操作相似度权重和所述视觉距离是否存在处于相应的阈值范围的情况;若是,则确定所述目标网站为钓鱼网站,否则,所述目标网站为正常网站。4.根据权利要求1所述的一种钓鱼网站检测方法,其特征在于,所...
【专利技术属性】
技术研发人员:薛晨,任彦,易立,陆希玉,窦禹,郑礼雄,王一宇,杨昕雨,叶瑞杰,
申请(专利权)人:北京锐驰信安技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。