标识检测及仿冒站点检测方法、装置、设备及存储介质制造方法及图纸

技术编号：20242743 阅读：23 留言：0更新日期：2019-01-29 23:27

本发明专利技术涉及互联网技术领域，公开了一种标识检测及仿冒站点检测方法、装置、设备及存储介质，所述仿冒站点检测方法包括：获取可疑站点，可疑站点的域名不在白名单中，白名单中包括保护站点的域名；检测可疑站点的站点页面中是否包含敏感内容；获取可疑站点的站点页面的截图，记为第一图像；检测第一图像中是否包含保护站点的特征标识；若第一图像中包含保护站点的特征标识，且可疑站点的站点页面中包含敏感内容，则将可疑站点标记为仿冒站点。本发明专利技术实施例提供的技术方案，有效地提高了检测仿冒站点的准确率和检测性能。

全部详细技术资料下载

【技术实现步骤摘要】
标识检测及仿冒站点检测方法、装置、设备及存储介质
本专利技术涉及互联网
，尤其涉及一种标识检测及仿冒站点检测方法、装置、设备及存储介质。
技术介绍
仿冒站点，即不法分子在互联网上伪造的知名站点，不法分子通过仿冒站点诱导客户输入用户名、密码、身份证号等敏感信息，达到窃取用户信息或者骗取用户钱财的目的。目前监测仿冒站点的方式主要有三种：第一种、域名特征检测法，即根据URL(统一资源定位符，UniformResourceLocator)特征、不使用https、非常用端口或者域名与知名站点的编辑距离等特征进行检测。第二种、内容特征检测法，即检测站点页面中的内容是否具有仿冒站点的内容特征，例如，仿冒站点的页面内容中存在很多隐藏hidden标签，且标签内有大量无关内容、大量外链等。第三种、图像比对检测法，即将待检测的站点页面截图后与保护站点的页面截图的进行图像相似度比较，若相似度较高则认为该待检测的站点为仿冒站点。基于域名特征和内容特征的检测方式存在大量误报，比如目前大多数站点的静态资源(脚本/图片)都放在另外一台服务器上，所以大量外链的站点不一定是仿冒站点。而基于图像比对的检测方式，通常采用的是滑动窗口比对的方式，假设仿冒站点的页面截图的高度和宽度分别为Hp和Wp，而知名站定的页面截图的高度和宽度为Hl和Wl，则需要滑动比对(Hp-Hl+1)×(Wp-Wl+1)次，这意味着在页面截图像素宽高为数百像素时需要进行数万次的比对。此外，不法分子并不会直接照搬知名站点的页面内容，而是会对知名站点的页面内容进行调色、形变、改变页面布局等处理后生成迷惑用户的仿冒站点页面，...

【技术保护点】
1.一种标识检测方法，其特征在于，包括：获取待检测的第一图像；对所述第一图像中相邻的像素点进行聚类，并根据聚类结果将所述第一图像分割为多个有效区域；将所述多个有效区域分别与特征标识进行比对，以确定所述第一图像中是否包含所述特征标识。

【技术特征摘要】
1.一种标识检测方法，其特征在于，包括：获取待检测的第一图像；对所述第一图像中相邻的像素点进行聚类，并根据聚类结果将所述第一图像分割为多个有效区域；将所述多个有效区域分别与特征标识进行比对，以确定所述第一图像中是否包含所述特征标识。2.根据权利要求1所述的方法，其特征在于，所述对所述第一图像中相邻的像素点进行聚类，具体包括：根据形成边的两个像素点的颜色值计算所述第一图像中各个边的边权重，其中，所述第一图像中的任意两个相邻的像素点相连形成一条边；按所述边权重对所述第一图像中的各个边进行升序排序；按排序结果的顺序依次对所述第一图像中的任一边作如下聚类处理，得到包含多个区域的区域集合：在确认形成所述任一边的两个像素点属于不同的聚类，且所述任一边的边权重不大于所述两个像素点分别所属的聚类的类间距离后，合并所述两个像素点所属的聚类，其中，所述类间距离等于一个聚类中最大的边权重。3.根据权利要求2所述的方法，其特征在于，所述根据聚类结果将所述第一图像分割为多个有效区域，具体包括：计算所述区域集合中任意两个区域的相似度，根据所述相似度对所述区域集合中的区域进行合并，得到有效区域。4.根据权利要求3所述的方法，其特征在于，所述计算所述区域集合中任意两个区域的相似度，根据所述相似度对所述区域集合中的区域进行合并，得到有效区域，具体包括：相似度计算步骤、计算所述区域集合中任意两个区域的相似度；合并步骤、合并相似度最高的两个区域，将合并后的区域添加到所述区域集合中并删除所述相似度最高的两个区域；循环执行所述相似度计算步骤和所述合并步骤直至满足循环终止条件，循环终止后所述区域集合中的区域即为有效区域。5.根据权利要求1所述的方法，其特征在于，所述将所述有效区域与特征标识进行比对，具体包括：提取所述有效区域对应的图像中的特征点，得到第二特征点集合；针对所述第二特征点集合中的任一特征点，从第一特征点集合中找到与所述第二特征点集合中的任一特征点最相似的第一目标特征点，将所述第二特征点集合中的任一特征点与所述第一目标特征点之间的第一距离值加入两点间距离集合，所述第一特征点集合中包特征标识中的特征点；针对所述第一特征点集合中的任一特征点，从所述第二特征点集合中找到与所述第一特征点集合中的任一特征点最相似的第二目标特征点，将所述第一特征点集合中的任一特征点与所述第二目标特征点之间的第二距离值加入所述两点间距离集合；统计所述两点间距离集合中距离值小于最近距离值的预设倍数的元素的数量，记为第一数量，所述最近距离值等于所述两点...

【专利技术属性】
技术研发人员：皮靖，袁帅，周旭康，吴令一，
申请(专利权)人：北京神州绿盟信息安全科技股份有限公司，北京神州绿盟科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人