一种网址识别的方法、服务器及系统技术方案

技术编号:9546487 阅读:52 留言:0更新日期:2014-01-08 22:30
本发明专利技术公开了一种网址识别的方法,包括:获取待检测网址对应的页面内容;将所述页面内容与预先生成的恶意页面模板库中的任一页面模板进行匹配;当所述页面内容与所述任一页面模板的匹配相似度超过第一预设阈值时,确定所述待检测网址为恶意网址。本发明专利技术实施例还提供相应的服务器。本发明专利技术实施例提供的网址识别的方法,可以快速的识别恶意网址,从而提高网络安全性。

【技术实现步骤摘要】
—种网址识别的方法、服务器及系统
本专利技术涉及互联网
,具体涉及一种网址识别的方法、服务器及系统。
技术介绍
互联网在给人们生活带来便利的同时,互联网的安全形势也不容乐观,各类木马病毒伪装成正常文件肆意传播,钓鱼网站模仿正常网站盗取用户帐号密码愈演愈烈。对于恶意网站的识别和打击,通常有两种方案:一类是基于用户举报和人工审核的方法,用户可以提交可疑的统一资源定位符(Uniform Resource Locator,URL),URL也称网页地址,简称网址,经过人工核实为恶意后则加入恶意URL列表中;一类是基于URL特征识别的方法。在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,现有技术中无论是人工审核的方法还是基于URL特征识别的方法,都需要很长的时间才能确定该网址是否为恶意网址,导致对恶意网址的识别效率低下。
技术实现思路
本专利技术实施例提供一种网址识别的方法,可以快速的识别恶意网址,从而提高网络安全性。本专利技术实施例还提供了相应的服务器及系统。本专利技术第一方面提供一种网址识别的方法,包括:获取待检测网址对应的页面内容;将所述页面内容与预先生成的恶意页面模板库中的任一页面模板进行匹配;当所述页面内容与所述任一页面模板的匹配相似度超过第一预设阈值时,确定所述待检测网址为恶意网址。结合第一方面,在第一种可能的实现方式中,所述方法还包括:将所述恶意网址存入预先设置的恶意网址库,并收集被拉黑的网址到所述恶意网址库。结合第一方面第一种可能的实现方式,在第二种可能的实现方式中,所述方法还包括:根据所述恶意网址库更新所述恶意页面模板库。结合第一方面第二种可能的实现方式,在第三种可能的实现方式中,所述根据所述恶意网址库更新所述恶意页面模板库,包括:获取所述恶意网址库中的每一个网址对应的页面内容;计算所述每一个网址对应的页面内容中任意两个页面内容的相似度,将所述任意两个页面内容的相似度超过第二预设阈值的网址划分到同一集合;将包含网址数量超过第三预置阈值的任一集合中网址对应的页面内容作为恶意页面模板,并将所述恶意页面模板存入所述恶意页面模板库中。结合第一方面、第一方面第一种至第三种可能实现方式中的任意一种,在第四种可能的实现方式中,所述获取待检测网址对应的页面内容,包括:接收用户端发送的所述待检测网址;根据所述待检测网址下载所述待检测网址对应的页面内容。本专利技术第二方面提供一种服务器,包括:获取单元,用于获取待检测网址对应的页面内容;匹配单元,用于将所述获取单元获取的页面内容与预先生成的恶意页面模板库中的每个页面模板进行匹配;确定单元,用于当所述匹配单元匹配出所述页面内容与所述任一页面模板的匹配相似度超过第一预设阈值时,确定所述待检测网址为恶意网址。结合第二方面,在第一种可能的实现方式中,所述服务器还包括:存储单元,用于将所述恶意网址存入预先设置的恶意网址库;收集单元,用于收集被拉黑的网址到所述恶意网址库。结合第二方面第一种可能的实现方式,在第二种可能的实现方式中,所述服务器还包括:更新单元,用于根据所述恶意网址库更新所述恶意页面模板库。结合第二方面第二种可能的实现方式,在第三种可能的实现方式中,所述更新单元包括:获取子单元,用于获取所述恶意网址库中的每一个网址对应的页面内容;计算子单元,用于计算所述获取子单元获取的每一个网址对应的页面内容中任意两个页面内容的相似度;划分子单元,用于将所述计算子单元计算的任意两个页面内容的相似度超过第二预设阈值的网址划分到同一集合;确定子单元,用于将包含网址数量超过第三预置阈值的任一所述划分子单元划分的集合中网址对应的页面内容作为恶意页面模板;存储子单元,用于并将所述确定子单元确定的恶意页面模板存入所述恶意页面模板库中。结合第二方面、第二方面第一种至第三种可能实现方式中的任意一种,在第四种可能的实现方式中,所述获取单元包括:接收子单元,用于接收用户端发送的所述待检测网址;下载子单元,用于根据所述接收子单元接收到的待检测网址下载所述待检测网址对应的页面内容。本专利技术第三方面提供一种网址识别系统,包括:服务器和用户端,其中,所述服务器为上述技术方案所述的服务器。本专利技术实施例采用获取待检测网址对应的页面内容;将所述页面内容与预先生成的恶意页面模板库中的任一页面模板进行匹配;当所述页面内容与所述任一页面模板的匹配相似度超过第一预设阈值时,确定所述待检测网址为恶意网址。与现有技术中对恶意网址的识别效率低下相比,本专利技术实施例提供的网址识别的方法,可以快速的识别恶意网址,从而提高网络安全性。【附图说明】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例中网址识别的方法的一实施例示意图;图2是本专利技术实施例中网址识别的方法的另一实施例示意图;图3是本专利技术实施例中服务器的一实施例示意图;图4是本专利技术实施例中服务器的另一实施例示意图;图5是本专利技术实施例中服务器的另一实施例示意图;图6是本专利技术实施例中服务器的另一实施例示意图;图7是本专利技术实施例中服务器的另一实施例示意图;图8是本专利技术实施例中服务器的另一实施例示意图;图9是本专利技术实施例中网址识别系统的一实施例示意图。【具体实施方式】本专利技术实施例提供一种网址识别的方法,可以快速的识别恶意网址,从而提高网络安全性。本专利技术实施例还提供了相应的服务器及系统。以下分别进行详细说明。下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参阅图1,本专利技术实施例提供的网址识别的方法的一实施例包括:101、获取待检测网址对应的页面内容。102、将所述页面内容与预先生成的恶意页面模板库中的任一页面模板进行匹配。预先生成的恶意页面模板库可以是根据之前积累的用户上报的网址或者被拉黑的网址对应的页面内容归结出来。拉黑的URL即被安全软件程序识别为恶意或运营人员收到用户举报后人工核实为恶意的URL。103、当所述页面内容与所述任一页面模板的匹配相似度超过第一预设阈值时,确定所述待检测网址为恶意网址。第一预设阈值可以为80%、90%或者其他数值。恶意网址是指恶意种植木马、病毒等恶意程序在网址内,通过“伪装的网址服务内容”诱导用户访问该网址,一旦进入这些网址,便会触发网址内种植下的木马、病毒等程序,导致访问者计算机被感染,面临丢失帐号或者隐私信息等危险。恶意网址容易出现在一些不知名的带有销售、推荐性质的网址中。本专利技术实施例采用获取待检测网址对应的页面内容;将所述页面内容与预先生成的恶意页面模板库中的任一页面模板进行匹配;当所述页面内容与所述任一页面模板的匹配相似度超过第一预设阈值时,确定所述待检测网址为恶意网址。与现有技术中对恶意网址的识别效率低下相比,本专利技术实施例提供的网址识别的方法,可以快速的识别恶意网址,从而提高网络安全性。可选地,在上述图1对应的实施例的基础上,本专利技术实本文档来自技高网...

【技术保护点】
一种网址识别的方法,其特征在于,包括:获取待检测网址对应的页面内容;将所述页面内容与预先生成的恶意页面模板库中的任一页面模板进行匹配;当所述页面内容与所述任一页面模板的匹配相似度超过第一预设阈值时,确定所述待检测网址为恶意网址。

【技术特征摘要】
1.一种网址识别的方法,其特征在于,包括: 获取待检测网址对应的页面内容; 将所述页面内容与预先生成的恶意页面模板库中的任一页面模板进行匹配; 当所述页面内容与所述任一页面模板的匹配相似度超过第一预设阈值时,确定所述待检测网址为恶意网址。2.根据权利要求1所述的方法,其特征在于,所述方法还包括: 将所述恶意网址存入预先设置的恶意网址库,并收集被拉黑的网址到所述恶意网址库。3.根据权利要求2所述的方法,其特征在于,所述方法还包括: 根据所述恶意网址库更新所述恶意页面模板库。4.根据权利要求3所述的方法,其特征在于,所述根据所述恶意网址库更新所述恶意页面模板库,包括: 获取所述恶意网址库中的每一个网址对应的页面内容; 计算所述每一个网址对应的页面内容中任意两个页面内容的相似度,将所述任意两个页面内容的相似度超过第二预设阈值的网址划分到同一集合; 将包含网址数量超过第三预置阈值的任一集合中网址对应的页面内容作为恶意页面模板,并将所述恶意页面模板存入所述恶意页面模板库中。5.根据权利要求1-4任一所述的方法,其特征在于,所述获取待检测网址对应的页面内容,包括: 接收用户端发送的所述待检测网址; 根据所述待检测网址下载所述待检测网址对应的页面内容。6.一种服务器,其特征在于,包括: 获取单元,用于获取待检测网址对应的页面内容; 匹配单元,用于将所述获取单元获取的页面内容与预先生成的恶意页面模板库中的每个页面模板进行匹配; 确定单元,...

【专利技术属性】
技术研发人员:刘健
申请(专利权)人:腾讯科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1