一种基于图像特征的诈骗网站查找方法及系统技术方案

技术编号:31094643 阅读:28 留言:0更新日期:2021-12-01 13:03
本发明专利技术公开了一种基于图像特征的诈骗网站查找方法及系统,属于图像处理技术领域,针对现有技术中存在的诈骗网站数据巨大,人工在确认和分析时,需要花费大量的时间和精力,并且人工分析的准确率不高的问题,本发明专利技术首先获取诈骗网站截图;然后遍历所述诈骗网站截图,提取图像特征向量;对所述图像特征向量进行降维操作,得到图像特征向量中具有代表性的降维图像特征,最后对降维图像特征进行聚类,得到聚类结果集,其目的为:将诈骗网站截图内容进行抽象数字化,并通过数学相关性运算实现关联分析。分析。分析。

【技术实现步骤摘要】
一种基于图像特征的诈骗网站查找方法及系统


[0001]本专利技术属于图像处理
,具体涉及一种基于图像特征的诈骗网站查找方法及系统。

技术介绍

[0002]随着数字图像处理技术的发展,数字处理技术进行自动化特征识别和分析应用越来越广泛,越来越多的领域需要通过数字图像处理技术来解决数据量大,人工分析和确认时耗时耗力且准确性不高的问题。
[0003]现有对诈骗网站进行关联分析主要通过人工获取网站截图,然后人工根据截图信息将对应的诈骗网站进行关联分析和处置。
[0004]现有的技术存在以下问题:现有的诈骗网站数据巨大,人工在确认和分析时,需要花费大量的时间和精力,并且人工分析的准确率不高。

技术实现思路

[0005]针对现有技术中存在的诈骗网站数据巨大,人工在确认和分析时,需要花费大量的时间和精力,并且人工分析的准确率不高的问题,本专利技术提出了一种基于图像特征的诈骗网站查找方法及系统,其目的为:将诈骗网站截图内容进行抽象数字化,并通过数学相关性运算实现关联分析。
[0006]为实现上述目的本专利技术所采用本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图像特征的诈骗网站查找方法,其特征在于,包括:步骤A:首先采集所有的诈骗网站数据,对所述诈骗网站数据进行预处理,获取诈骗网站截图;步骤B:遍历所述诈骗网站截图,提取具有唯一表示的图像特征向量;步骤C:对所述图像特征向量进行降维操作,得到图像特征向量中具有代表性的降维图像特征,将所有的降维图像特征保存至数据库中;步骤D:设置距离阈值,对数据库中的降维图像特征之间的距离进行计算,根据距离阈值范围得到数个图像结果集,然后通过对数个图像结果集进行求平均的操作,实现对图像结果集不断优化,最终得到聚类结果集,实现了对数据库中的所有降维图像特征进行聚类。2.根据权利要求1所述的一种基于图像特征的诈骗网站查找方法,其特征在于,所述步骤A具体为:步骤A1:首先将采集的所有诈骗网站数据进行清洗,去除没有获取到截图的诈骗网站数据;步骤A2:通过对图像内容的处理,筛选掉打开异常的诈骗网站截图,获取用于提取图像特征的诈骗网站截图。3.根据权利要求1所述的一种基于图像特征的诈骗网站查找方法,其特征在于,所述步骤B具体为:对图像特征提取模型进行训练,然后将训练好的图像特征提取模型对诈骗网站截图进行处理,提取出诈骗网站截图对应的具有唯一表示的图像特征向量。4.根据权利要求1所述的一种基于图像特征的诈骗网站查找方法,其特征在于,所述步骤C具体为:步骤C1:自定义符合所述图像特征向量尺寸和内容的卷积核;步骤C2:对所述图像特征向量进行分析,自定义图像特征向量的算子,即卷积核内的值;步骤C3:通过所述卷积核和所述算子对图像特征向量进行降维处理,得到图像特征向量中具有代表性的降维图像特征,将所有的降维图像特征保存至数据库中。5.根据权利要求4所述的一种基于图像特征的诈骗网站查找方法,其特征在于,所述步骤D具体为:步骤D1:将数据库中的每一个降维图像特征和数据库中其它所有的降维图像特征进行距离计算,并通过预设的距离阈值范围得到数个图像结果集;步骤D2:对所有图像结果集进行求平均的操作,得到一个具有代表性的平均图像特征向量;步骤D3:将所述平均图像特征向量与数据库中所有降维图像特征进行距离计算,并根据距离阈值范围得到新的图像结果集;步骤D4:判断得到的新的图像结果集与步骤D1中得到的图形结果集的数量是否相等,若不相等,则重复步骤D2,若相等,则最终得到的数个图像结果集为聚类结果集。6.一种基于图像...

【专利技术属性】
技术研发人员:张浩张瑞冬童永鳌朱鹏马永霄漆伟
申请(专利权)人:成都无糖信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1