一种网页篡改监测的方法技术

技术编号:10652597 阅读:209 留言:0更新日期:2014-11-19 15:04
本发明专利技术涉及信息安全技术领域,旨在提供一种网页篡改监测的方法。该种网页篡改监测的方法包括步骤:过滤标签项配置、敏感字项配置、定级项配置、文件变更配置、模板套用、爬取网页、形成基准、对比改动页面、网页截取、形成报告、产生告警。本发明专利技术通过策略配置进行篡改监测,可过滤了一些特殊网页标签,可临时针对特殊项目或者活动进行自定义过滤或自定义策略编辑,使得篡改监测更加精准更加灵活,让工作人员可以轻松地得到更加可信的篡改监测告警。

【技术实现步骤摘要】
一种网页篡改监测的方法
本专利技术是关于信息安全
,特别涉及一种网页篡改监测的方法。
技术介绍
随着互联网的发展,各种技术架构层出不穷,极大程度地满足了用户的各种需求。但是,现有的技术架构下网站漏洞却长期存在:1、操作系统复杂性:已经公布超过1万多个系统漏洞;2、漏洞与补丁:系统漏洞从发现到被利用为5天,补丁发布时间为47天;3、应用系统漏洞:各种注入式攻击,多个应用系统不同的开发者。主观原因而言,过于苛刻的安全管理要求,通常网络管理员难以完全实现:1、密码管理:合格密码需要8位以上复杂字符并定期改变;2、漏洞补丁:操作系统、中间件、应用系统的定期更新;3、上网控制:钓鱼、木马、间谍软件。这些原因导致网站网页极容易被篡改,防不胜防。传统的篡改监测,覆盖范围不全,且容易产生误报。例如网站正常的维护,进行图片链接的修改,传统监测方法,会当作是被篡改告警给网站负责人,实际不存在篡改情况,照成网站维护人员时间和精力上的浪费。这些因素还包括:1)很多网页的动态性,造成篡改监测系统的判断错误;2)篡改监测系统本身的判断逻辑不完善;3)目前的应用环境非常复杂,篡改监测系统判断逻辑往往无法覆盖所有可能出现的情况。
技术实现思路
本专利技术的主要目的在于克服现有技术中的不足,提供一种准确率更高、灵活度更高的篡改监测方法和系统。为解决上述技术问题,本专利技术的解决方案是:提供一种网页篡改监测的方法,用于监测所需监测网站的网页篡改,具体包括下述步骤:(1)过滤标签项配置:通过配置需要过滤的标签项,过滤网页中特定的标签,用于避免网页动态性标签所引起的篡改误报;所述标签是指网页浏览器识别符(网页程序中不同的标签有着不同的意义,也代表不同功能和样式,如div标签定义HTML文档中的分隔(division)或部分(section)等),过滤标签包括div标签计数器、选择器、Div名称属性、Div临时属性;(2)敏感字项配置:通过增加敏感字的字库或使用内置敏感字库,实现敏感字的监测,用于控制篡改监测范围;所述敏感字是指系统禁止发表的词语,包括黄色、政治、暴力、辱骂方面的词汇;(3)定级项配置:通过将篡改内容进行分级分类,用于按照所需进行分级告警,满足用户特殊需求;定级是指对篡改检测内容进行分级分类;(4)文件变更配置:用于避免网站正常维护而产生篡改误报;文件变更包括Js文件变更、Css文件变更;(5)模板套用:根据不同篡改监测需求,通过上述步骤,配置任意组合形成不同的策略模板,在进行篡改监测网站时,选择相应的策略模板名称进行模板套用,形成网站对应一个策略模板的形式,进行篡改监测;(6)爬取网页:抓取所需监测网站的所有页面,抓取方式采用网络爬虫、正则表达式、模拟解析中的任意一种或至少两种方式相结合的方法,或者现有开源的网络爬虫;(7)形成基准:将步骤(6)中抓取的网页进行保存,形成基准(通过网络爬虫抓取的网站网页会保存在指定文件夹下,形成基准文件),即为标注,用于作为下一次爬取网页结果的对比对象;(8)对比改动页面:通过再一次进行步骤(6)抓取的网页结果进行保存,与步骤(7)形成的基准进行对比;再将对比结果根据步骤(5)中选择套用的策略模板来进行处理:根据套用的策略模板中的配置内容,过滤掉对比结果的过滤标签项,筛选出对比结果的敏感关键字,对对比结果的定级项进行结果定级,再进行对比结果的文件变更调整,形成最终的比对结果;(9)网页截取:根据步骤(8)中检测出的比对结果,截取篡改前和篡改后的网页,并通过界面直观展现;(10)形成报告:根据步骤(8)中检测出的比对结果、步骤(9)中获得的截图,(通过velocity组件)形成网站安全报告;(11)产生告警:将步骤(10)中形成的网站安全报告发送给用户,用于反馈篡改信息。本专利技术的工作原理:在对一个网站进行篡改监测之前,利用已知的策略进行配置,排除因网站正常维护或计数器类网页动态性因素产生的篡改告警,定级别定分类进行告警,能够很大程度上降低误报给工作人员带来的困惑。与现有技术相比,本专利技术的有益效果是:通过策略配置进行篡改监测,可过滤了一些特殊网页标签,可临时针对特殊项目或者活动进行自定义过滤或自定义策略编辑,使得篡改监测更加精准更加灵活,让工作人员可以轻松地得到更加可信的篡改监测告警。附图说明图1为本专利技术的网页篡改监测的方法流程图。具体实施方式下面结合附图与具体实施方式对本专利技术作进一步详细描述:如图1所示,一种网页篡改监测的方法,用于监测所需监测网站的网页篡改,采用人工干预策略配置方法,提高篡改监测的准确率,产生更加准确可信的篡改告警结果,具体包括下述步骤:(1)过滤标签项配置:标签即为网页浏览器识别符,网页程序中不同的标签有着不同的意义,也代表不同功能和样式,如div标签定义HTML文档中的分隔(division)或部分(section)等。过滤标签项是指通过人工配置需要过滤的标签项,从而达到过滤网页中特定的标签的目的,如div标签计数器、选择器、Div名称属性、Div临时属性。进行过滤标签项配置,用于避免网页动态性标签所引起的篡改误报;(2)敏感字项配置:敏感字是指一般系统禁止发表的词语,一般包括黄色,政治,暴力,辱骂方面的词汇。通过手工配置增加敏感字项的字库或使用内置敏感字库,达到敏感字检测的目的。通过敏感字项,控制篡改监测范围;(3)定级特征项配置:定级是指对篡改检测内容进行分级分类,通过定级项的配置可达到篡改分级告警的目的,满足用户特殊需求;(4)文件变更配置:文件变更包括Js文件变更、Css文件变更,通过对文件变更项的配置,可达到避免网站正常维护而产生篡改误报的目的;(5)模板套用:根据不同篡改监测需求,通过上述步骤,配置形成不同策略的模板。在进行下达篡改监测任务时,选择相应的模板名称进行模板套用,形成网站对应一个策略模板的形式,快速进行篡改监测。(6)爬取网页:抓取所需监测网站的所有页面,抓取方式采用网络爬虫、正则表达式、模拟解析中的任意一种或至少两种方式相结合的方法,或者现有开源的网络爬虫;(7)形成基准:用于通过步骤(6)的抓取的网页进行保存,形成基准。基准即为标注,通过网络爬虫抓取的网站网页会保存在指定文件夹下,形成基准文件,作为下一次爬取网页结果的对比对象。(8)对比改动页面:目的是进行与步骤(7)形成的基准进行对比。篡改监测通过再一次进行步骤(6)抓取的网页结果进行保存,与步骤(7)形成的基准进行对比;再将对比结果根据步骤(5)中选择套用的策略模板来进行处理:根据套用的策略模板中的配置内容,过滤掉对比结果的过滤标签项,筛选出对比结果的敏感关键字,对对比结果的定级项进行结果定级,再进行对比结果的文件变更调整,形成最终的比对结果。(9)网页截取:通过步骤(8)中的对比改动处,截取篡改前和篡改后的网页,并通过界面直观展现;(10)形成报告:通过步骤(8)中获得的对比改动处、步骤(9)中获得的截图,通过velocity组件形成网站安全报告;(11)产生告警:将步骤(10)中形成的网站安全报告发送给用户,用于反馈篡改信息。最后,需要注意的是,以上列举的仅是本专利技术的具体实施例。显然,本专利技术不限于以上实施例,还可以有很多变形。本领域的普通技术人员能从本专利技术公开的内容中直接导出或联想本文档来自技高网...
一种网页篡改监测的方法

【技术保护点】
一种网页篡改监测的方法,用于监测所需监测网站的网页篡改,其特征在于,具体包括下述步骤:(1)过滤标签项配置:通过配置需要过滤的标签项,过滤网页中特定的标签,用于避免网页动态性标签所引起的篡改误报;所述标签是指网页浏览器识别符,过滤标签包括div标签计数器、选择器、Div名称属性、Div临时属性;(2)敏感字项配置:通过增加敏感字的字库或使用内置敏感字库,实现敏感字的监测,用于控制篡改监测范围;所述敏感字是指系统禁止发表的词语,包括黄色、政治、暴力、辱骂方面的词汇;(3)定级项配置:通过将篡改内容进行分级分类,用于按照所需进行分级告警,满足用户特殊需求;定级是指对篡改检测内容进行分级分类;(4)文件变更配置:用于避免网站正常维护而产生篡改误报;文件变更包括Js文件变更、Css文件变更;(5)模板套用:根据不同篡改监测需求,通过上述步骤,配置任意组合形成不同的策略模板,在进行篡改监测网站时,选择相应的策略模板名称进行模板套用,形成网站对应一个策略模板的形式,进行篡改监测;(6)爬取网页:抓取所需监测网站的所有页面,抓取方式采用网络爬虫、正则表达式、模拟解析中的任意一种或至少两种方式相结合的方法,或者现有开源的网络爬虫;(7)形成基准:将步骤(6)中抓取的网页进行保存,形成基准,即为标注,用于作为下一次爬取网页结果的对比对象;(8)对比改动页面:通过再一次进行步骤(6)抓取的网页结果进行保存,与步骤(7)形成的基准进行对比;再将对比结果根据步骤(5)中选择套用的策略模板来进行处理:根据套用的策略模板中的配置内容,过滤掉对比结果的过滤标签项,筛选出对比结果的敏感关键字,对对比结果的定级项进行结果定级,再进行对比结果的文件变更调整,形成最终的比对结果;(9)网页截取:根据步骤(8)中检测出的比对结果,截取篡改前和篡改后的网页,并通过界面直观展现;(10)形成报告:根据步骤(8)中检测出的比对结果、步骤(9)中获得的截图,形成网站安全报告;(11)产生告警:将步骤(10)中形成的网站安全报告发送给用户,用于反馈篡改信息。...

【技术特征摘要】
1.一种网页篡改监测的方法,用于监测所需监测网站的网页篡改,其特征在于,具体包括下述步骤:(1)过滤标签项配置:通过配置需要过滤的标签项,过滤网页中特定的标签,用于避免网页动态性标签所引起的篡改误报;所述标签是指网页浏览器识别符,过滤标签包括div标签计数器、选择器、Div名称属性、Div临时属性;(2)敏感字项配置:通过增加敏感字的字库或使用内置敏感字库,实现敏感字的监测,用于控制篡改监测范围;所述敏感字是指系统禁止发表的词语,包括黄色、政治、暴力、辱骂方面的词汇;(3)定级项配置:通过将篡改内容进行分级分类,用于按照所需进行分级告警,满足用户特殊需求;定级是指对篡改检测内容进行分级分类;(4)文件变更配置:用于避免网站正常维护而产生篡改误报;文件变更包括Js文件变更、Css文件变更;(5)模板套用:根据不同篡改监测需求,通过上述步骤,配置任意组合形成不同的策略模板,在进行篡改监测网站时,选择相应的策略模板名称进行模板套用,形成网站对应一个策略...

【专利技术属性】
技术研发人员:葛菲菲范渊杨永清莫金友
申请(专利权)人:杭州安恒信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1