The invention discloses a method and a device for identifying malicious websites, belonging to the field of the internet. The method comprises the following steps: when receiving a query request to a malicious web site, the first site information based on the identification of the first website, the malicious website request carries the first address information, the first address information for the first web site information, after the identification of the first website, at least one a hyperlink information obtained from the contents of the first page of the web site, the at least one hyperlink based on information, namely the identification of at least one of the second sites, at least one of the second sites for the at least one hyperlink information that link to sites respectively. The invention can recognize the first web site, and also recognize the second web site linked by hyperlink information of the first website, thereby improving the efficiency of identifying the malicious websites.
【技术实现步骤摘要】
识别恶意网站的方法及装置
本专利技术涉及互联网领域,特别涉及一种识别恶意网站的方法及装置。
技术介绍
互联网技术的快速发展给人们的生活带来越来越多的便利,比如,人们可以通过互联网下载各类资料、进行网络购物等。与此同时,出现了将各类木马病毒伪装成正常文件来肆意传播、钓鱼网站模仿正常网站盗取用户账号和密码等恶意行为,因此,识别恶意网站的方法受到了广泛地关注。其中,相关技术中是通过云安全服务器根据网站的网址信息来识别恶意网站,所以,当恶意分子发现某个网址信息被拦截时,该恶意分子可以通过新网址信息来进行恶意行为。此时,信息数据库中不包括该新网址信息的记录,所以,云安全服务器就不会识别出该网站为恶意网站。为了解决该问题,云安全服务器需要下载该网站的页面内容,并对该网站的页面内容进行分析,如果分析结果指示该网站为恶意网站,则在信息数据库中存储该新网址信息的记录,以便下次可以识别出该新网址信息对应的网站为恶意网站。然而,对于信息数据库中不存在的每个新网址,该云安全服务器都需要执行上述的下载页面内容操作和分析页面内容操作,会浪费大量的带宽和处理资源,并且花费的时间较长,不利于快速 ...
【技术保护点】
一种识别恶意网站的方法,其特征在于,所述方法包括:当接收到恶意网站查询请求时,基于第一网址信息,对第一网站进行识别,所述恶意网站查询请求中携带所述第一网址信息,所述第一网址信息为所述第一网站的网址信息;对所述第一网站进行识别之后,从所述第一网站的页面内容中获取至少一个超链接信息;基于所述至少一个超链接信息,分别对至少一个第二网站进行识别,所述至少一个第二网站为所述至少一个超链接信息分别所链接的网站。
【技术特征摘要】
1.一种识别恶意网站的方法,其特征在于,所述方法包括:当接收到恶意网站查询请求时,基于第一网址信息,对第一网站进行识别,所述恶意网站查询请求中携带所述第一网址信息,所述第一网址信息为所述第一网站的网址信息;对所述第一网站进行识别之后,从所述第一网站的页面内容中获取至少一个超链接信息;基于所述至少一个超链接信息,分别对至少一个第二网站进行识别,所述至少一个第二网站为所述至少一个超链接信息分别所链接的网站。2.如权利要求1所述的方法,其特征在于,所述从所述第一网站的页面内容中获取至少一个超链接信息,包括:从所述第一网站的页面内容中,获取至少一个超链接开始标签和至少一个超链接结束标签;从所述第一网站的页面内容中,将目标超链接开始标签、目标超链接结束标签、以及所述目标超链接开始标签与所述目标超链接结束标签之间的信息确定为超链接信息,所述目标超链接开始标签为所述至少一个超链接开始标签中的任一超链接开始标签,所述目标超链接结束标签与所述目标超链接开始标签对应。3.如权利要求1所述的方法,其特征在于,所述基于所述至少一个超链接信息,分别对至少一个第二网站进行识别,包括:对于所述至少一个超链接信息中的每个超链接信息,从所述超链接信息中获取链接地址信息;判断存储的恶意信息数据库中是否存在所述链接地址信息;当所述恶意信息数据库中存在所述链接地址信息时,确定所述超链接信息所链接的第二网站为恶意网站。4.如权利要求3所述的方法,其特征在于,所述判断存储的信息数据库中是否存在所述链接地址信息之后,还包括:当所述信息数据库中不存在所述链接地址信息时,根据预设条件,对所述超链接信息所链接的第二网站进行识别。5.如权利要求所述4所述到的方法,其特征在于,所述根据预设条件,对所述超链接信息所链接的第二网站进行识别,包括:从存储的恶意链接索引库中,获取第三网址信息数目,第三网址信息为第三网站的网址信息,且所述链接地址信息被所述第三网站所引用;当所述第三网址信息数目大于第一预设数值时,将所述第二网站确定为恶意网站。6.如权利要求所述4所述到的方法,其特征在于,所述根据预设条件,对所述超链接信息所链接的第二网站进行识别,包括:从存储的恶意链接索引库中,获取第一上下文信息中包括的特定词语数目,所述第一上下文信息为第三网站的页面内容中与所述链接地址信息位于同一显示区域的文字信息;当所述特定词语数目大于第二预设数值时,将所述第二网站确定为恶意网站。7.如权利要求3-6任一权利要求所述的方法,其特征在于,所述基于所述至少一个超链接信息,分别对至少一个第二网站进行识别之后,还包括:对于所述至少一个第二网站中任一第二网站,当所述第二网站为恶意网站时,将所述第二网站对应的链接地址信息存储到所述恶意信息数据库中。8.如权利要求3-6任一权利要求所述的方法,其特征在于,所述基于所述至少一个超链接信息,分别对至少一个第二网站进行识别之后,还包括:对于所述至少一个第二网站中任一第二网站,当所述第二网站不为恶意网站且所述第一网站为恶意网站时,将所述第二网站对应的链接地址信息、所述第一网址信息和第二上下文信息存储到所述恶意链接索引库中,所述第二上下文信息为所述第一网站的页面内容中与所述第二网站对应的链接地址信息位于...
【专利技术属性】
技术研发人员:刘健,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。