【技术实现步骤摘要】
本专利技术涉及互联网
,具体涉及一种基于图片匹配检测钓鱼网页的方法及装置。
技术介绍
随着互联网的发展,基于WEB的应用日益普及,人们通过浏览器可以查询银行账户、网上购物、电子商务、查询信息、获取知识、进行娱乐等,WEB为人们提供了方便和快捷的交互方式。然而,人们在上网冲浪浏览网页的同时,经常会遭遇到恶意网站的侵袭,导致计算机被病毒、木马等感染。恶意网站,例如钓鱼网站、或者是欺诈,仿冒网站等,主要是通过仿冒真实网站的URL地址或是网页内容,伪装成银行及电子商务等类型的网站,或是利用真实网站服务器程序上的漏洞,在该网站的某些网页中插入危险的网页代码,以此来骗取用户银行或信用卡账号、密码等私人资料。恶意网页中包含着许多敏感的特征,例如,金融欺诈类的恶意网页会在文字、图片等方面仿冒官网,或是在真实网页中插入虚假票务、虚假中奖、假冒网银、虚假购物等信息,这些特征大多以文本串的形式出现在网页中。现有的为了防范恶意网站的主要手段是当用户访问某网站时, ...
【技术保护点】
一种基于图片匹配检测钓鱼网页的方法,所述方法的执行基于预先建立的包含多个第一图片和第二图片的图片规则库,所述第一图片是已知钓鱼网页的截图,所述第二图片是在所述第一图片中所截取的具有钓鱼网页特征的图片;所述方法包括:对浏览器打开的网页进行截图,获取第三图片;计算所述第三图片与所述图片规则库中所有第一图片的相似度;根据相似度对图片规则库中的所有第一图片进行排序,按照排序后的顺序选取多个第一图片,选取的第一图片的数量小于所述图片规则库中第一图片的总数量;将所述第三图片与选取的第一图片对应的第二图片进行匹配,若选取的第一图片对应的第二图片中的至少一个与所述第三图片匹配,则确定所述网页为可疑的钓鱼网页。
【技术特征摘要】
1.一种基于图片匹配检测钓鱼网页的方法,所述方法的执行基于预先建
立的包含多个第一图片和第二图片的图片规则库,所述第一图片是已知钓鱼
网页的截图,所述第二图片是在所述第一图片中所截取的具有钓鱼网页特征
的图片;
所述方法包括:
对浏览器打开的网页进行截图,获取第三图片;
计算所述第三图片与所述图片规则库中所有第一图片的相似度;
根据相似度对图片规则库中的所有第一图片进行排序,按照排序后的顺
序选取多个第一图片,选取的第一图片的数量小于所述图片规则库中第一图
片的总数量;
将所述第三图片与选取的第一图片对应的第二图片进行匹配,若选取的
第一图片对应的第二图片中的至少一个与所述第三图片匹配,则确定所述网
页为可疑的钓鱼网页。
2.根据权利要求1所述的方法,所述计算所述第三图片与所述图片规则
库中所有第一图片的相似度进一步包括:
分别对所述第三图片和所述图片规则库中的所有第一图片进行聚类处
理,获取聚类处理后第三图片和图片规则库中第一图片的特征点;
根据聚类处理后第三图片和图片规则库中第一图片的特征点计算特征点
相似度。
3.根据权利要求1或2所述的方法,所述根据相似度对图片规则库中的
所有第一图片进行排序,按照排序后的顺序选取多个第一图片,选取的第一
图片的数量小于所述图片规则库中第一图片的总数量进一步包括:
根据相似度由高至低的顺序对图片规则库中的第一图片进行排序,选取
相似度大于第一预定值的多个第一图片。
4.根据权利要求1或2所述的方法,所述根据相似度对图片规则库中的
所有第一图片进行排序,按照排序后的顺序选取多个第一图片,选取的第一
\t图片的数量小于所述图片规则库中第一图片的总数量进一步包括:
根据相似度由高至低的顺序对图片规则库中的第一图片进行排序,选取
数量为第二预定值的多个第一图片。
5.根据权利要求2-4任一项所述的方法,在所述分别对第三图片和所述
图片规则库中的所有第一图片进行聚类处理之前还包括:对所述图片规则库
中的所有第一图片的特征点进行消重处理。
6.根据权利要求1-5任一项所述的方法,其中,所述对浏览器打开的网
页进行截图,获取第三图...
【专利技术属性】
技术研发人员:李晓波,尹露,杨晶,郭峰,
申请(专利权)人:北京奇虎科技有限公司,奇智软件北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。