【技术实现步骤摘要】
页面篡改检测方法、装置、终端及存储介质
本专利技术涉及网络安全
,具体涉及一种页面篡改检测方法、装置、终端及存储介质。
技术介绍
目前,检测页面是否发生篡改主要有两大类方法:一种是利用浏览器测试框架驱动搜索引擎,搜索待检测网站的页面并判断待检测网站的页面中是否存在目标网站域名,根据判断结果判定待检测网站是否发生篡改但是这种检测方法需要耗费大量的时间。一种是使用防篡改平台,通过黑词库构建方法,不断的新创黑词或者短语,统计黑词或者短语在待检测网站的页面中出现的概率,根据概率的大小确定所述待检测网站是否发生篡改,然而误判率较高;并且仅仅通过统计黒词出现的概率无法准确判定待检测网站是否被篡改,漏判率较高。因此,一种快速获取待检测网站的网页及降低网页被篡改的误报率和漏判率成为了亟待解决的问题。
技术实现思路
鉴于以上内容,有必要提出一种页面篡改检测方法、装置、终端及存储介质,通过拼接得到待检测网站的精确链接,提高了获取待检测网站的效率;通过爬取待检测网站的代码并与白名单和第二网页代码进行比对,降低了误
【技术保护点】
1.一种页面篡改检测方法,其特征在于,所述方法包括:/n通过服务器导入待检测网站的源码;/n将所述源码按照网站结构进行分类,提取出所述待检测网站中每个网页的网页目录和第一网页代码;/n将每个所述网页目录中的网页名与所述待检测网站的域名进行拼接,得到多个待检测网页的链接;/n预设周期内爬取每个所述链接指向的网页的第二网页代码;/n比对所述第二网页代码中是否存在白名单函数代码;/n当所述第二网页代码中不存在所述白名单函数代码时,比对所述第二网页代码与所述第一网页代码是否一致;/n当所述第二网页代码与所述第一网页代码不一致时,输出所述待检测网页的网页代码被篡改的信息。/n
【技术特征摘要】
1.一种页面篡改检测方法,其特征在于,所述方法包括:
通过服务器导入待检测网站的源码;
将所述源码按照网站结构进行分类,提取出所述待检测网站中每个网页的网页目录和第一网页代码;
将每个所述网页目录中的网页名与所述待检测网站的域名进行拼接,得到多个待检测网页的链接;
预设周期内爬取每个所述链接指向的网页的第二网页代码;
比对所述第二网页代码中是否存在白名单函数代码;
当所述第二网页代码中不存在所述白名单函数代码时,比对所述第二网页代码与所述第一网页代码是否一致;
当所述第二网页代码与所述第一网页代码不一致时,输出所述待检测网页的网页代码被篡改的信息。
2.如权利要求1所述的方法,其特征在于,在将所述源码按照网站结构进行分类,提取出所述待检测网站中每个网页的网页目录和第一网页代码之后,所述方法还包括:
提取所述每个网页的网页目录的第一网页代码;
建立网页目录的提取顺序与目录存储单元中第一条目位置之间的关联关系,及第一网页代码的提取顺序与母版存储单元中第二条目位置之间的关联关系;
根据所述网页目录的提取顺序将所述每个网页的网页目录存储至对应的第一条目位置中;
根据所述第一网页代码的提取顺序将所述每个网页的网页目录的第一网页代码存储至对应的第二条目位置中。
3.如权利要求2所述的方法,其特征在于,在所述预设周期内爬取每个所述链接指向的网页的第二网页代码之后,所述方法还包括:
建立推送顺序与子版存储单元中第三条目位置之间的关联关系;
根据所述推送顺序将所述第二网页代码推送至对应的第三条目位置中。
4.如权利要求3所述的方法,其特征在于,所述比对所述第二网页代码中是否存在白名单函数代码包括:
依次获取所述第三条目位置中的所述第二网页代码;
提取所述第二网页代码中的每一行代码;
将所述每一行代码与预先存储的白名单函数代码进行一一比对;
当任意一行代码中存在所述白名单函数代码,确定所述第二网页代码中存在所述白名单函数代码;
当任意一行代码中均不存在所述白名单函数代码,确定所述第二网页代码中不存在所述白名单函数代码。
5.如权利要求3所述的方法,其特征在于,所述比对所述第二网页代码与所述第一网页代码是否一致包括:
识别所述第二网页代码对应的链接;
提取所述链接中的文件名;
识别所述文件名对应的第一条目位置中的所述网页目录;
依次获取所述网页目录对应的第二条目位置中与所述文件名对应的所述第一网页代码;
提取所述第一网页代码中的每一行代码;
控制多线程将所述...
【专利技术属性】
技术研发人员:苟竣博,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。