一种WEB网页篡改识别方法及系统技术方案

技术编号:7000727 阅读:273 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种WEB网页篡改识别方法及系统,以实现对WEB页面的篡改识别,其中该系统包括:网页获取模块,用于获取WEB页面;模式提取模块,与网页获取模块相连,用于对WEB页面进行模式提取,生成WEB页面的页面模式;基线数据库,用于保存WEB页面比较基线;篡改识别模块,与模式提取模块及基线数据库相连,用于根据WEB页面比较基线对作为识别目标的目标WEB页面的页面模式进行篡改识别,获得识别结果。与现有技术相比,本发明专利技术技术方案在网页服务器的外部进行WEB网页篡改检测,提高了检测效率,实现了WEB页面的篡改识别。

【技术实现步骤摘要】

本专利技术涉及网络安全领域,尤其涉及一种TOB网页篡改识别方法及系统。
技术介绍
随着互联网应用技术的不断发展,网站已经深入人们的生活,发挥着越来越重要 的作用。外部网站因需要被公众访问而暴露于因特网上,容易成为黑客的攻击目标。虽然 目前已有防火墙、入侵检测等安全防范手段,但现代操作系统的复杂性和多样性导致系统 漏洞层出不穷,防不胜防。黑客入侵和WEB页面篡改的事件时有发生。目前TOB篡改模式主要有两种主要形式WEB页面被完全篡改(完全被新文件替 换)和WEB页面被部分篡改(WEB页面大部分内容没有被修改,而其中部分图片、文字内容 或者超链接被修改)。对于以上两种类型的网页篡改攻击,经过统计发现,第一种情况占绝大多数,而后 者相对较少。并且从管理员角度而言,最担心的篡改是第一种,因为这种篡改影响面最大。目前一般的TOB网页防篡改技术方案,较多采用可靠的WEB服务器核心内嵌式,其 篡改检测过程运行于WEB服务器内部,与TOB服务器无缝结合。WEB网页正常发布时,为其 计算出唯一的加密水印。每次网页被浏览时,都对网页进行水印比对,实时地确保每个网页 的真实性。这种技术方案对每个网页文件产生一个水印并保存在服务器上,每次公众浏览 该网页时,服务器就进行水印检测,以判断网页是否被篡改。但是,经过分析发现,目前较多采用的这种WEB页面防篡改技术方案有以下不足(1)服务器上要保存所有网页的水印,并且每次公众浏览都要进行水印检测,对服 务器的运行带来较大的负担。(2)如果黑客将网页及其水印一同篡改,则不能有效地检测出来。(3)目前的技术方案还比较简单,且部署网页防篡改系统或产品需要改变现有的 单服务器模式,增加额外的服务器,并改变服务器的架构。
技术实现思路
本专利技术所要解决的技术问题,在于需要提供一种WEB网页篡改识别方法及系统, 以实现对WEB页面的篡改识别。为了解决上述技术问题,本专利技术提供了一种TOB网页篡改识别系统,包括网页获取模块,用于获取TOB页面;模式提取模块,与所述网页获取模块相连,用于对所述WEB页面进行模式提取,生 成所述WEB页面的页面模式;基线数据库,用于保存WEB页面比较基线;篡改识别模块,与所述模式提取模块及基线数据库相连,用于根据所述TOB页面 比较基线对作为识别目标的目标WEB页面的页面模式进行篡改识别,获得识别结果。优选地,该系统进一步包括基线建立模块,与所述模式提取模块及基线数据库相连,用于根据未经篡改的TOB 页面的页面模式,生成所述WEB页面比较基线并保存到所述基线数据库。优选地,所述网页获取模块包括地址接收子模块,用于接收所述TOB页面的页面地址;页面请求子模块,与所述地址接收子模块相连,用于根据所述页面地址,向WEB服 务器发出页面请求,以获取所述WEB页面;响应分析子模块,用于从所述TOB服务器返回的页面响应中提取出所述TOB网页。优选地,所述模式提取模块包括解析子模块,与所述网页获取模块相连,用于从所述TOB页面中提取文档对象模 型树;落叶树生成子模块,与所述解析子模块相连,用于对所述文档对象模型树进行删 叶处理,生成文档对象模型落叶树;序列化子模块,与所述落叶树生成子模块相连,用于对所述文档对象模型落叶树 进行序列化,生成落叶树节点序列;模式输出子模块,与所述序列化子模块相连,用于将所述落叶树节点序列作为所 述WEB页面的页面模式进行输出。为了解决上述技术问题,本专利技术还提供了一种TOB网页篡改识别方法,包括获取WEB页面;对所述WEB页面进行模式提取,生成所述WEB页面的页面模式;根据预存的TOB页面比较基线对作为识别目标的目标WEB页面的页面模式进行篡 改识别,获得识别结果。优选地,该方法进一步包括根据未经篡改的TOB页面的页面模式,生成所述WEB页面比较基线并保存。优选地,获取所述TOB页面的步骤,包括接收所述TOB页面的页面地址;根据所述页面地址,向TOB服务器发出页面请求,以获取该WEB页面;从所述WEB服务器返回的页面响应中提取出所述WEB网页。优选地,所述WEB页面的页面地址,包括所述WEB页面的IP地址或者域名。优选地,对所述WEB页面进行模式提取,生成所述页面模式的步骤,包括从所述WEB页面中提取文档对象模型树;对所述文档对象模型树进行删叶处理,生成文档对象模型落叶树;对所述文档对象模型落叶树进行序列化,生成落叶树节点序列;将所述落叶树节点序列作为所述TOB页面的页面模式。与现有技术相比,本专利技术技术方案在网页服务器的外部进行TOB网页篡改检测, 克服了现有技术由服务器自己产生和验证页面水印的技术缺陷,减小了服务器的负担,提 高了检测效率,而且不会对页面服务器产生任何影响,实现了 WEB页面的篡改识别。而且, 基于网络技术,本专利技术技术方案实现了 WEB页面篡改的远程检测,不需要在客户网站上安 装任何软件,也不会向客户网站发送有害探测包。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利 要求书以及附图中所特别指出的结构来实现和获得。附图说明 附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实 施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中图1为本专利技术TOB网页篡改识别系统实施例的结构示意图;图2为图1所示实施例中网页获取模块的组成示意图;图3为图1所示实施例中模式提取模块的组成示意图;图4为本专利技术TOB网页篡改识别方法实施例的流程示意图;图5为图4所示方法实施例中步骤S410的流程示意图;图6为图4所示方法实施例中步骤S420的流程示意图;图7为一种DOM树示意图;图8为对应于图7所示DOM树的DOM落叶树示意图。 具体实施例方式以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用 技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,如果不冲突,本专利技术实施例以及实施例中的各个特征可以相互结 合,均在本专利技术的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机 可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况 下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是本专利技术TOB网页篡改识别系统实施例的结构示意图。如图1所示,该系统 实施例主要包括网页获取模块110、模式提取模块120、基线建立模块130、基线数据库140 以及篡改识别模块150,其中网页获取模块110,用于获取TOB页面;模式提取模块120,与该网页获取模块110相连,用于对该网页获取模块110获取 的TOB页面进行模式提取,生成该WEB页面的页面模式;基线建立模块130,与该模式提取模块120相连,对于正常的未经篡改的TOB页面, 用于根据该模式提取模块120生成的正常的未经篡改的WEB页面的页面模式,生成WEB页 面比较基线;基线数据库140,与该基线建立模块130相连,用于保存由该基线建立模块130建 立的TOB页面比较基线;篡改识别模块150,与该模式提取模块120及基线数据库140相连,用于在进行 WEB页面的篡改识别时,根据基线数据库140保存的本文档来自技高网
...

【技术保护点】
1.一种WEB网页篡改识别系统,其特征在于,包括:网页获取模块,用于获取WEB页面;模式提取模块,与所述网页获取模块相连,用于对所述WEB页面进行模式提取,生成所述WEB页面的页面模式;基线数据库,用于保存WEB页面比较基线;篡改识别模块,与所述模式提取模块及基线数据库相连,用于根据所述WEB页面比较基线对作为识别目标的目标WEB页面的页面模式进行篡改识别,获得识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡振宇孙海波周涛叶润国黄宇鸿
申请(专利权)人:北京启明星辰信息技术股份有限公司北京启明星辰信息安全技术有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1