一种检测网站是否存在后门程序的方法及装置制造方法及图纸

技术编号:15749853 阅读:196 留言:0更新日期:2017-07-03 15:27
本申请公开了一种检测网站是否存在后门程序的方法及装置,其中所述方法包括:获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合;获取待检测网站在所述第一统计时长之后的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合;将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为可疑统一资源定位符URL;判断通过上述可疑统一资源定位符URL请求网页得到的网页代码中是否包含预先确定的后门指纹;若是,判定所述待检测网站存在后门程序。本申请实施例可以实现网站中后门程序的检测,从而提高网站的安全等级。

【技术实现步骤摘要】
一种检测网站是否存在后门程序的方法及装置
本申请涉及互联网
,尤其涉及一种检测网站是否存在后门程序的方法及装置。
技术介绍
随着互联网技术的发展,信息资源出现了爆炸式增长,随之而来的则是信息资源的安全问题。位于互联网环境下的信息资源可能面临各方面的威胁。通常情况下,从起源上看,这种威胁可能来自于恶意程序或代码有目的性的主动攻击,比如,黑客、病毒等;也有可能来自信息资源自身所依赖的载体(比如,应用软件、客户端程序、网页/网站等)存在“先天性”的安全漏洞,而这种漏洞具有极大的可能被不正当分子非法利用,进而对信息资源造成威胁。“后门程序”带来的威胁即是后一种情形下的一种较为常见的现象。比如,在软件的开发阶段,为了方便对软件进行修改、调试、升级等操作,程序员可能会在软件内创建或预留适当的接口,以便通过它修改程序设计中的某些缺陷或完善某些功能。但是,这些接口程序如果被其他人知道,或是在发布软件之前未被及时删除,那么它就可能被黑客等恶意者通过这些接口绕过安全性控制而获取对相关程序或系统的访问权,从事搜集信息等非法操作。这种在可能被信息资源的安全带来威胁的接口一般称为后门程序,后门程序一旦被利用可能造成严重后果。因此,有必要在信息资源存在的载体中通过适当的方法对是否存在后门程序进行检测,然后对其进行删除等操作,从而降低安全风险。在现有技术中的某些场景中,后门程序可以被较好的发现,得到及时处理。比如,对于潜伏在客户端程序中的后门程序,可通过现有的杀毒软件进行检测,在检测出来后及时进行查杀处理。但是,对于潜伏在网站中的后门程序,目前还没有一种有效的后门程序检测方式,以提高网站的安全等级。
技术实现思路
本申请实施例提供一种克服上述问题或者至少部分地解决上述问题的检测网站是否存在后门程序的方法及装置。本申请实施例采用下述技术方案:一种检测网站是否存在后门的方法,包括:获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合;获取待检测网站在所述第一统计时长之后或之前的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合;将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL或者所述第一集合中包含的且所述第二集合中未包含的统一资源定位符确定为可疑统一资源定位符URL;判断通过上述可疑统一资源定位符URL获得的与之对应的网页代码中是否包含预先确定的后门指纹,所述后门指纹是根据后门样本库中的多个样本后门程序训练得到的;若是,判定所述待检测网站存在后门程序。优选地,获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合之后,所述方法还包括:对所述第一集合中包含的统一资源定位符URL进行去重;和/或,将所述第一集合中包含的具有对应静态资源的统一资源定位符URL进行过滤;获取待检测网站在所述第一统计时长之后或之前的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合之后,所述方法还包括:对所述第二集合中包含的统一资源定位符URL进行去重;和/或,将所述第二集合中包含的具有对应静态资源的统一资源定位符URL进行过滤。优选地,将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为上述待检测网站的可疑URL,具体包括:确定所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL;判断上述确定的统一资源定位符URL是否带有参数;若是,将该统一资源定位符URL确定为可疑统一资源定位符URL。优选地,获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合之后,所述方法还包括:将所述第一集合划分为包含带有参数的统一资源定位符URL的第一子集、及包含不带有参数的统一资源定位符URL的第二子集;获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合之后,所述方法还包括:将所述第二集合划分为包含带有参数的统一资源定位符URL的第三子集、及包含不带有参数的统一资源定位符URL的第四子集;则,将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为可疑统一资源定位符URL,具体包括:将所述第一子集中包含的且所述第三子集中未包含的统一资源定位符URL确定为带参数的可疑统一资源定位符URL;将所述第二子集中包含的且所述第四子集中未包含的统一资源定位符URL确定为不带参数的可疑统一资源定位符URL。优选地,将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为可疑统一资源定位符URL,具体包括:确定所述第二集合中包含的且所述第一集合中未包含的带有参数的统一资源定位符URL;判断上述确定的统一资源定位符URL中是否包含预设的后门样本库中的后门URL特征;若是,将该统一资源定位符URL确定为可疑统一资源定位符URL。一种检测网站是否存在后门程序的装置,包括:第一获取单元,用于获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合;第二获取单元,用于获取待检测网站在所述第一统计时长之后或之前的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合;确定单元,用于将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL或者所述第一集合中包含的且所述第二集合中未包含的统一资源定位符确定为可疑统一资源定位符URL;判断单元,用于判断通过上述可疑统一资源定位符URL获得的与之对应的网页代码中是否包含预先确定的后门指纹,所述后门指纹是根据后门样本库中的多个样本后门程序训练得到的;若是,判定所述待检测网站存在后门程序。优选地,所述装置还包括:第一预处理单元,用于对所述第一集合中包含的统一资源定位符URL进行去重;和/或将所述第一集合中包含的属于静态资源的统一资源定位符URL进行剔除;第二预处理单元,用于对所述第二集合中包含的统一资源定位符URL进行去重;和/或将所述第二集合中包含的属于静态资源的统一资源定位符URL进行剔除。优选地,所述确定单元具体包括:第一确定子单元,用于确定所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL;第一判断子单元,用于判断上述确定的统一资源定位符URL是否带有参数;若是,将该统一资源定位符URL确定为可疑统一资源定位符URL。优选地,所述装置还包括:第一划分单元,用于将所述第一集合划分为包含带有参数的统一资源定位符URL的第一子集、及包含不带有参数的统一资源定位符URL的第二子集;第一划分单元,用于将所述第二集合划分为包含带有参数的统一资源定位符URL的第三子集、及包含不带有参数的统一资源定位符URL的第四子集;则,所述确定单元具体用于:将所述第一子集中包含的且所述第三子集中未包含的统一资源定位符URL确定为带参数的可疑统一资源定位符URL;将所述第二子集中包含的且所述第四子集中未包含的统一资源定位符URL确定为不带参数的可疑统一资源定位符URL。优选地,所述确定单元具体包括:第二确定子单元,用于确定所述第二集合中包本文档来自技高网
...
一种检测网站是否存在后门程序的方法及装置

【技术保护点】
一种检测网站是否存在后门程序的方法,其特征在于,包括:获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合;获取待检测网站在所述第一统计时长之后或之前的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合;将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL,或者所述第一集合中包含的且所述第二集合中未包含的统一资源定位符确定为可疑统一资源定位符URL;判断通过上述可疑统一资源定位符URL获得的与之对应的网页代码中是否包含预先确定的后门指纹,所述后门指纹是根据后门样本库中的多个样本后门程序训练得到的;若是,判定所述待检测网站存在后门程序。

【技术特征摘要】
1.一种检测网站是否存在后门程序的方法,其特征在于,包括:获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合;获取待检测网站在所述第一统计时长之后或之前的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合;将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL,或者所述第一集合中包含的且所述第二集合中未包含的统一资源定位符确定为可疑统一资源定位符URL;判断通过上述可疑统一资源定位符URL获得的与之对应的网页代码中是否包含预先确定的后门指纹,所述后门指纹是根据后门样本库中的多个样本后门程序训练得到的;若是,判定所述待检测网站存在后门程序。2.如权利要求1所述的方法,其特征在于,获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合之后,所述方法还包括:对所述第一集合中包含的统一资源定位符URL进行去重;和/或,将所述第一集合中包含的具有对应静态资源的统一资源定位符URL进行过滤;获取待检测网站在所述第一统计时长之后或之前的第二统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第二集合之后,所述方法还包括:对所述第二集合中包含的统一资源定位符URL进行去重;和/或,将所述第二集合中包含的具有对应静态资源的统一资源定位符URL进行过滤。3.如权利要求1所述的方法,其特征在于,将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为上述待检测网站的可疑URL,具体包括:确定所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL;判断上述确定的统一资源定位符URL是否带有参数;若是,将该统一资源定位符URL确定为可疑统一资源定位符URL。4.如权利要求1所述的方法,其特征在于,获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合之后,所述方法还包括:将所述第一集合划分为包含带有参数的统一资源定位符URL的第一子集、及包含不带有参数的统一资源定位符URL的第二子集;获取待检测网站在第一统计时长内被访问的统一资源定位符URL,得到包含统一资源定位符URL的第一集合之后,所述方法还包括:将所述第二集合划分为包含带有参数的统一资源定位符URL的第三子集、及包含不带有参数的统一资源定位符URL的第四子集;则,将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为可疑统一资源定位符URL,具体包括:将所述第一子集中包含的且所述第三子集中未包含的统一资源定位符URL确定为带参数的可疑统一资源定位符URL;将所述第二子集中包含的且所述第四子集中未包含的统一资源定位符URL确定为不带参数的可疑统一资源定位符URL。5.如权利要求1所述的方法,其特征在于,将所述第二集合中包含的且所述第一集合中未包含的统一资源定位符URL确定为可...

【专利技术属性】
技术研发人员:董方
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1