【技术实现步骤摘要】
一种钓鱼网站识别方法、装置、电子设备及存储介质
[0001]本申请涉及信息安全
,尤其涉及一种钓鱼网站识别方法、装置、电子设备及存储介质。
技术介绍
[0002]钓鱼网站指欺骗用户的虚假网站。相关技术中,主要通过以下三种方式对钓鱼网站进行识别:1、通过对网页视觉信息的判断识别钓鱼网站;2、通过对网页的标志(Logo)的特征的判断识别钓鱼网站;3、通过对网站对应的统一资源定位符(URL,Uniform Resource Locator)特征的判断识别钓鱼网站。然而,这些方式都存在较高的误判率,且识别效率低下。
技术实现思路
[0003]有鉴于此,本申请实施例的主要目的在于提供一种钓鱼网站识别方法、装置、电子设备及存储介质,以解决相关技术中对钓鱼网站的识别误判率较高、识别效率较低的问题。
[0004]为达到上述目的,本申请实施例的技术方案是这样实现的:
[0005]本申请实施例提供了一种钓鱼网站识别方法,所述方法包括:
[0006]提取待识别网站的至少一个第一特征以及至少一个第二特征 ...
【技术保护点】
【技术特征摘要】
1.一种钓鱼网站识别方法,其特征在于,所述方法包括:提取待识别网站的至少一个第一特征以及至少一个第二特征;所述第一特征表征统一资源定位符URL相关的特征;所述第二特征表征网站页面相关的特征;将所述至少一个第一特征以及所述至少一个第二特征输入设定的特征融合网络模型,得到第一概率;所述第一概率表征所述待识别网站为钓鱼网站的概率;在所述第一概率大于设定阈值时,确定所述待识别网站为钓鱼网站。2.根据权利要求1所述的钓鱼网站识别方法,其特征在于,所述提取待识别网站的至少一个第一特征以及至少一个第二特征,包括:将所述待识别网站的URL的设定字段部分分别与设定白名单和设定黑名单中的每个URL的设定字段部分进行匹配,得到匹配结果;在所述匹配结果表征所述待识别网站的URL的设定字段部分与设定白名单或设定黑名单中的每个URL的设定字段部分都不匹配的情况下,提取所述待识别网站的至少一个第一特征以及至少一个第二特征。3.根据权利要求2所述的钓鱼网站的识别方法,其特征在于,所述将所述待识别网站的URL的设定字段部分分别与设定白名单和设定黑名单中的每个URL的设定字段部分进行匹配,包括:对所述待识别网站的URL进行预处理,将所述URL转换成设定格式的URL;将所述待识别网站的设定格式的URL的设定字段部分分别与设定白名单和设定黑名单中的每个URL的设定字段部分进行匹配。4.根据权利要求2或3所述的钓鱼网站的识别方法,其特征在于,所述方法还包括:在所述匹配结果表征所述待识别网站的URL的设定字段部分与设定白名单或设定黑名单中的任意一个URL的设定字段部分匹配的情况下,输出所述待识别网站对应的识别结果。5.根据权利要求1所述的钓鱼网站识别方法,其特征在于,所述至少一个第一特征包括以下至少一项:所述待识别网站的URL与设定白名单中每个URL之间的字符相似度;所述待识别网站的URL的特征向量;所述特征向量基于所述待识别网站的URL中每个字符确定出。6.根据权利要求5所述的钓鱼网站的识别方法,其特征在于,所述方法还包括:基于所述待识别网站的URL的字符长度和所述设定白名单中每个URL的字符长度以及编辑距离,计算得到...
【专利技术属性】
技术研发人员:孙祥训,程宝平,谢小燕,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。