【技术实现步骤摘要】
一种基于网站指纹的仿冒网站检测方法及装置
[0001]本申请涉及网络安全
,具体而言,涉及一种基于网站指纹的仿冒网站检测方法及装置。
技术介绍
[0002]目前,随着计算机网络技术的飞速发展,网站数量成指数级别增长,网站已成为日常信息获取、企业、学校业务在线办理和网络购物不可或缺的途径之一。同时计算机网络的安全问题也变得日益复杂与突出。特别是企业与金融机构网站,一直是不法分子攻击的重点目标。如何快速检测出仿冒网站,成为亟需解决的安全问题。
[0003]现有技术中,现有仿冒网站检测技术是通过对比网站之间三个维度上的相似性综合判定是否为仿冒网站,具体为通过对网站内容分词、网站截图以及网站URL(uniformresource locator,统一资源定位器)三个维度分别计算与原网站的相似度得分后、集成汇总计算出最终的一个网站相似值,将集成汇总后计算的相似度值与预设的相似度阈值进行比较,超过阈值则判断待检测网站是原网站的仿冒站点;但是,现有仿冒网站检测技术还存在以下问题:网页截图比对的方式消耗较多的存储与计算资源;分 ...
【技术保护点】
【技术特征摘要】
1.一种基于网站指纹的仿冒网站检测方法,其特征在于,包括:获取原网站的网站指纹和待检测网站的网站指纹,所述网站指纹包括关键词指纹、原生指纹、衍生指纹、技术组件指纹中的一种或多种;根据所述关键词指纹、所述原生指纹、所述衍生指纹中的一种或多种进行划分,获得高权重指纹和低权重指纹;根据所述原网站的高权重指纹、低权重指纹、技术组件指纹中的一种或多种和所述待检测网站的权重组合指纹、高权重指纹、低权重指纹、技术组件指纹中的一种或多种进行匹配并计算对应的权重占比值,获得相似度分值;判断所述相似度分值是否大于预设阈值;若大于预设阈值,检测原网站的基础信息和待检测网站的基础信息是否相同,若不相同,判定所述待检测网站是仿冒网站;若相同,判定所述待检测网站不是仿冒网站;若小于等于预设阈值,则判定所述待检测网站不是仿冒网站。2.根据权利要求1所述的基于网站指纹的仿冒网站检测方法,其特征在于,在根据所述关键词指纹、所述原生指纹、所述衍生指纹中的一种或多种进行划分,获得高权重指纹和低权重指纹的步骤之后,所述方法还包括:根据预设条件筛选所述高权重指纹中的部分指纹和所述低权重指纹中的部分指纹,获得权重组合指纹;将所述原网站的权重组合指纹与所述待检测网站的权重组合指纹进行匹配判断是否命中,若匹配命中,则跳转至所述检测原网站的基础信息和待检测网站的基础信息是否相同的步骤。3.根据权利要求1所述的基于网站指纹的仿冒网站检测方法,其特征在于,所述关键词指纹包括网站源码的词汇、短句、网页源码片段中的一种或多种组合;所述原生指纹包括网站响应的header、html源码、网页title、icon图标、网页footer、网页引用js的url、网页dom树、robots页面源码、网页源码提取的备案编号、网站ssl证书提取的网站证书使用者信息中的一种或多种;所述衍生指纹包括html源码hash、icon图标hash、网页footer部分hash、网页引用的js的hash、网页dom树hash 中的一种或多种。4.根据权利要求1或3所述的基于网站指纹的仿冒网站检测方法,其特征在于,所述技术组件指纹通过预设web指纹扫描器检测网站应用获得,其中所述技术组件指纹包括检测网站使用的web服务器、前端框架、后端框架、服务器操作系统、服务端语言、内容管理系统、数据库、中间件中的一种或多种。5.根据权利要求3所述的基于网站指纹的仿冒网站检测方法,其特征在于,所述高权重指纹包括icon图标hash、网页dom树hash、html源码hash、关键词指纹中的一种或多种;所述低权重指纹包括:网页title、网页源...
【专利技术属性】
技术研发人员:汪树蕾,唐御钦,武浩,薛锋,樊兴华,
申请(专利权)人:北京微步在线科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。