网页恶意扫描处理方法及装置、终端设备、可读存储介质制造方法及图纸

技术编号:21146165 阅读:20 留言:0更新日期:2019-05-18 06:42
本发明专利技术提供一种网页恶意扫描处理方法,包括以下步骤:获取当次网页访问的URL地址,并从所述URL地址提取所指向文件的后缀名;判断所指向文件的后缀名是否符合预设敏感条件;若所指向文件的后缀名不符合预设敏感条件,则判断当次网页访问是否存在目录遍历访问;若当次网页访问存在目录遍历访问,则获取预设目录遍历白名单,并判断所遍历访问的目录路径是否存在于所述预设目录遍历白名单;若所遍历访问的目录路径不存在于所述预设目录遍历白名单,则拦截当次网页访问。本发明专利技术还提供了一种网页恶意扫描处理装置、终端设备、可读存储介质。本发明专利技术解决了现有web防扫描技术容易误判并拦截正常访问而影响正常业务的技术问题。

【技术实现步骤摘要】
网页恶意扫描处理方法及装置、终端设备、可读存储介质
本专利技术涉及网络访问
,尤其涉及一种网页恶意扫描处理方法及装置、终端设备、可读存储介质。
技术介绍
目前的web(WorldWideWeb,即全球广域网,也称万维网)防扫描技术都是针对web漏洞扫描进行反向开发研制的。web漏洞扫描一般需要使用自动化工具,如开源软件Nikto、绿盟的应用漏扫设备等。web漏洞扫描原理是:搜寻处于活动状态的web服务器,然后向搜寻到的web服务器发送一些预先经过精心构造的http(HyperTextTransferProtocol,超文本传输协议)请求,再根据返回的内容判断可能存在的漏洞。这些判断信息可能会被黑客利用,为下一步的攻击做准备,或者是作为企业和政府部门风险评估的参考信息。当前的web防扫描技术一般基于上述web漏洞扫描原理进行防扫描。然而,web防扫描技术也存在容易误判并拦截正常访问、无法有效区分数据包特征是否正常等问题,这些问题很容易导致正常业务发生异常甚至被封锁,进而影响正常业务的顺利开展。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种网页恶意扫描处理方法及装置、终端设备、可读存储介质,旨在解决现有web防扫描技术容易误判并拦截正常访问而影响正常业务的技术问题。为实现上述目的,本专利技术提供一种网页恶意扫描处理方法,所述方法包括以下步骤:获取当次网页访问的URL地址,并从所述URL地址提取所指向文件的后缀名;判断所指向文件的后缀名是否符合预设敏感条件;若所指向文件的后缀名不符合预设敏感条件,则判断当次网页访问是否存在目录遍历访问;若当次网页访问存在目录遍历访问,则获取预设目录遍历白名单,并判断所遍历访问的目录路径是否存在于所述预设目录遍历白名单;若所遍历访问的目录路径不存在于所述预设目录遍历白名单,则拦截当次网页访问。优选地,所述判断所指向文件的后缀名是否符合预设敏感条件的步骤,具体包括:将所指向文件的后缀名与预设敏感文件模型进行比对;若所指向文件的后缀名匹配预设的敏感文件模型,则判定所指向文件的后缀名符合预设敏感条件;反之,则判定所指向文件的后缀名不符合预设敏感条件。优选地,所述预设敏感文件模型包含如下比对条件:敏感文件的名称长度、和/或敏感文件的访问目录路径;所述将所指向文件的后缀名与预设敏感文件模型进行比对的步骤,具体包括:基于预设多模匹配算法,将所指向文件的后缀名与预设敏感文件模型包含的所述比对条件进行比对;基于比对结果,判断所指向文件的后缀名是否匹配预设敏感文件模型。优选地,所述获取当次网页访问的URL地址的步骤之前,还包括:获取当次网页访问数据,并根据所述当次网页访问数据确认当次网页访问的实施类型;若当次网页访问的实施类型为请求类型,则执行所述获取当次网页访问的URL地址的步骤;若当次网页访问的实施类型为响应类型,则执行如下步骤:获取目标服务器返回的网页页面文件;从所述网页页面文件中提取包含目录路径的属性标签;根据所述属性标签,进行目录关键字的提取;基于所述目录关键字,通过机器学习构建所述目录遍历白名单。优选地,所述基于所述目录关键字,通过机器学习构建所述目录遍历白名单的步骤之后,还包括:基于所述网页页面文件,获取进行网页访问的访问端的源IP地址;判断所述访问端的源IP地址是否存在于预设智能隐藏表中;其中,所述预设智能隐藏表包含访问统计信息异常的若干IP地址;若所述访问端的源IP地址存在于所述预设智能隐藏表中,则在所述目标服务器返回404错误页面时隐藏所述404错误页面。优选地,所述判断所述访问端的源IP地址是否存在于预设智能隐藏表中的步骤之后,还包括:若所述访问端的源IP地址不存在于所述预设智能隐藏表中,则统计所述访问端对所述目标服务器实施访问所产生的404错误页面的总次数;若所产生的404错误页面的总次数超过第一预设阈值,则将所述访问端的源IP地址加入至所述预设智能隐藏表,并在所述目标服务器返回404错误页面时隐藏所述404错误页面。优选地,所述判断所述访问端的源IP地址是否存在于预设智能隐藏表中的步骤之后,还包括:若所述访问端的源IP地址不存在于所述预设智能隐藏表中,则进行循环冗余校验,以判断所述访问端的当次访问页面与上次访问页面是否相同;若相同,则更新所述访问端访问对应页面的访问总次数;判断所述访问总次数是否大于第二预设阈值;若是,则将所述访问端的源IP地址加入至所述预设智能隐藏表,并在所述目标服务器返回404错误页面时隐藏所述404错误页面。此外,为实现上述目的,本专利技术还提供一种网页恶意扫描处理装置,所述装置包括:信息提取单元,用于获取当次网页访问的URL地址,并从所述URL地址提取所指向文件的后缀名;敏感条件判断单元,用于判断所指向文件的后缀名是否符合预设敏感条件;目录遍历访问判断单元,用于若所指向文件的后缀名不符合预设敏感条件,则判断当次网页访问是否存在目录遍历访问;目录遍历白名单判断单元,用于若当次网页访问存在目录遍历访问,则获取预设目录遍历白名单,并判断所遍历访问的目录路径是否存在于所述预设目录遍历白名单;拦截单元,用于若所遍历访问的目录路径不存在于所述预设目录遍历白名单,则拦截当次网页访问。此外,为实现上述目的,本专利技术还提供一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的网页恶意扫描处理程序,所述网页恶意扫描处理程序被所述处理器执行时实现如上所述的网页恶意扫描处理方法的步骤。此外,为实现上述目的,本专利技术还提供一种可读存储介质,所述可读存储介质上存储有网页恶意扫描处理程序,所述网页恶意扫描处理程序被处理器执行时实现如上所述的网页恶意扫描处理方法的步骤。本专利技术实施例提出一种网页恶意扫描处理方法及装置、终端设备、可读存储介质,先从当次网页访问的URL地址中提取所指向文件的后缀名,并判断所指向文件的后缀名是否符合预设敏感条件,从而进行所指向文件后缀名的合理性验证。随后,在所指向文件后缀名的合理性验证通过后,进行当次网页访问是否存在目录遍历访问特征的验证;在确认当次网页访问存在目录遍历访问特征时,验证所遍历访问的目录路径是否存在于预设目录遍历白名单。在验证所遍历访问的目录路径不存在于预设目录遍历白名单时,确认当次网页访问为恶意扫描访问,进而对当次网页访问进行拦截。在本实施例中,通过多项不同类型的验证判断当次网页访问是否属于恶意扫描访问,避免了基于访问频率的恶意扫描判断方式,同时能够综合性地判断URL地址是否为正常业务访问地址,大大降低正常业务访问被误判的概率,同时提高对恶意扫描访问请求的识别能力。附图说明图1为本专利技术网页恶意扫描处理方法第一实施例的流程示意图;图2为本专利技术网页恶意扫描处理方法第一实施例中步骤S20的细化步骤意图;图3为本专利技术网页恶意扫描处理方法的实现流程示意图;图4为本专利技术网页恶意扫描处理装置各功能单元的一种组成示意图;图5为本专利技术网页恶意扫描处理装置各功能单元的另一种组成示意图;图6为本专利技术终端设备的各组成部分框图。本专利技术目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,本文档来自技高网...

【技术保护点】
1.一种网页恶意扫描处理方法,其特征在于,所述方法包括以下步骤:获取当次网页访问的URL地址,并从所述URL地址提取所指向文件的后缀名;判断所指向文件的后缀名是否符合预设敏感条件;若所指向文件的后缀名不符合预设敏感条件,则判断当次网页访问是否存在目录遍历访问;若当次网页访问存在目录遍历访问,则获取预设目录遍历白名单,并判断所遍历访问的目录路径是否存在于所述预设目录遍历白名单;若所遍历访问的目录路径不存在于所述预设目录遍历白名单,则拦截当次网页访问。

【技术特征摘要】
1.一种网页恶意扫描处理方法,其特征在于,所述方法包括以下步骤:获取当次网页访问的URL地址,并从所述URL地址提取所指向文件的后缀名;判断所指向文件的后缀名是否符合预设敏感条件;若所指向文件的后缀名不符合预设敏感条件,则判断当次网页访问是否存在目录遍历访问;若当次网页访问存在目录遍历访问,则获取预设目录遍历白名单,并判断所遍历访问的目录路径是否存在于所述预设目录遍历白名单;若所遍历访问的目录路径不存在于所述预设目录遍历白名单,则拦截当次网页访问。2.如权利要求1所述的网页恶意扫描处理方法,其特征在于,所述判断所指向文件的后缀名是否符合预设敏感条件的步骤,具体包括:将所指向文件的后缀名与预设敏感文件模型进行比对;若所指向文件的后缀名匹配预设的敏感文件模型,则判定所指向文件的后缀名符合预设敏感条件;反之,则判定所指向文件的后缀名不符合预设敏感条件。3.如权利要求2所述的网页恶意扫描处理方法,其特征在于,所述预设敏感文件模型包含如下比对条件:敏感文件名称的字符长度、和/或敏感文件名称的分布位置;所述将所指向文件的后缀名与预设敏感文件模型进行比对的步骤,具体包括:基于预设多模匹配算法,将所指向文件的后缀名与预设敏感文件模型包含的所述比对条件进行比对;基于比对结果,判断所指向文件的后缀名是否匹配预设敏感文件模型。4.如权利要求1所述的网页恶意扫描处理方法,其特征在于,所述获取当次网页访问的URL地址的步骤之前,还包括:获取当次网页访问数据,并根据所述当次网页访问数据确认当次网页访问的实施类型;若当次网页访问的实施类型为请求类型,则执行所述获取当次网页访问的URL地址的步骤;若当次网页访问的实施类型为响应类型,则执行如下步骤:获取目标服务器返回的网页页面文件;从所述网页页面文件中提取包含目录路径的属性标签;根据所述属性标签,进行目录关键字的提取;基于所述目录关键字,通过机器学习构建所述目录遍历白名单。5.如权利要求4所述的网页恶意扫描处理方法,其特征在于,所述基于所述目录关键字,通过机器学习构建所述目录遍历白名单的步骤之后,还包括:基于所述网页页面文件,获取进行网页访问的访问端的源IP地址;判断所述访问端的源IP地址是否存在于预设智能隐藏表中;其中,所述预设智能隐藏表包含访问统计信息异常的若干IP地址;若所述访问端的源IP地...

【专利技术属性】
技术研发人员:黄浩
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1