System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于网页防篡改,具体涉及一种网页防篡改方法及系统。
技术介绍
1、随着网络技术的发展,互联网逐渐普及,给用户带来极大的遍历,用户常常通过浏览网站来获取信息。然而危害网络的安全事件常常发生,网页被攻击者非法篡改就是最常见的一种。如果一个被用户信任的网站被非法篡改,散布一些虚假信息、反动信息、非法信息等等,对经济以及社会都会产生比较恶劣的影响。而杜绝篡改后的网页文件流出仅仅依靠网站管理人员进行人工监管是远远不够的,因此亟需研发一种网页防篡改方法。
2、现有技术中,常常采用时间轮训技术、事件触发技术以及文件过滤驱动技术等等技术进行网页防篡改,虽然能够起到一定的防篡改作用,但是存在防篡改效率较低以及防篡改的效果较差的问题。
技术实现思路
1、本专利技术提供一种网页防篡改方法及系统,用以解决现有技术中存在防篡改效率较低以及防篡改的效果较差的问题。
2、一方面,本专利技术提供一种网页防篡改方法,包括:
3、获取预设的数据采样周期以及待监控网站,并按照预设的数据采样周期,抓取待监控网站中的网页特征;
4、采用已部署的多个网页检测器对抓取到的网页特征进行检测,以获取当前数据采样周期对应的第一篡改检测结果;所述第一篡改检测结果包括网页被篡改或者网页未被篡改;
5、当所述第一篡改检测结果为网页被篡改时,向管理员发出网页异常警告,并将网页恢复至上一个数据采样周期对应的状态,将当前数据采样周期的状态备份保存,并结束网页防篡改流程;
>6、当所述第一篡改检测结果为网页未被篡改时,允许接收用户传输的网页请求,并将网页请求对应目标网页同时传输至预处理服务器以及部署于用户终端上的应用中,通过预处理服务器将目标网页进行二次加密之后,得到二次加密网页数据;
7、通过部署于用户终端上的应用对接收到的目标网页进行加密,得到一次加密网页数据,并根据一次加密网页数据以及二次加密网页数据,对目标网页进行检测,以获取目标网页对应的第二篡改检测结果;所述第二篡改检测结果包括网页被篡改或者网页未被篡改;
8、当所述第二篡改检测结果为网页被篡改时,终止用户的当前访问,并反馈异常信息给管理员以及用户;当所述第二篡改检测结果为网页未被篡改时,允许用户持续访问网页。
9、进一步地,获取预设的数据采样周期以及待监控网站,并按照预设的数据采样周期,抓取待监控网站中的网页特征,包括:
10、获取预设的数据采样周期以及待监控网站;
11、每过一个预设的数据采样周期,抓取待监控网站中的文本数据、网页截图数据、属性特征以及行为表现特征,得到待监控网站中的网页特征。
12、进一步地,已部署的多个网页检测器包括文本数据检测器、网页截图检测器、属性检测器以及行为表现检测器。
13、进一步地,采用已部署的多个网页检测器对抓取到的网页特征进行检测,以获取当前数据采样周期对应的第一篡改检测结果,包括:
14、采用已部署的文本数据检测器对文本数据进行检测,获取文本检测结果;所述文本检测结果包括文本异常或者文本正常;
15、采用已部署的网页截图检测器对网页截图数据进行检测,获取图像检测结果;所述像检测结果包括图像异常或者图像正常;
16、采用已部署的属性检测器对属性特征进行检测,获取属性检测结果;所述属性检测结果包括属性异常或属性正常;
17、采用已部署的行为表现检测器对行为表现特征进行检测,获取行为表现检测结果;所述行为表现检测结果包括行为表现异常或行为表现正常;
18、当文本检测结果、图像检测结果、属性检测结果以及行为表现检测结果中至少一个结果为异常时,则确定当前数据采样周期对应的第一篡改检测结果为网页被篡改;否则确定当前数据采样周期对应的第一篡改检测结果为网页未被篡改。
19、进一步地,采用已部署的文本数据检测器对文本数据进行检测,获取文本检测结果,包括:
20、调度已部署的文本数据检测器,以当前数据采样周期为基准,提取网页中的文本数据,并依次进行文本分词以及tf-idf计算,提取到文本数据对应的tf-idf特征;
21、按照预设的聚类数量,并采用聚类算法对tf-idf特征进行聚类,得到多个文本聚类结果;
22、以多个文本聚类结果为基础,获取每个聚类对应的tf-idf均值,并获取每个聚类对应的tf-idf均值与其他聚类的tf-idf均值之间的欧式距离,并将获取的多个欧式距离取平局值,得到每个聚类对应的距离平均值;
23、将当前数据采样周期对应的多个聚类所对应的距离平均值组成向量,得到当前数据采样周期对应的文本特征向量;
24、获取当前数据采样周期对应的文本特征向量与上一个数据采样周期对应的文本特征向量之间的欧式距离,得到目标欧式距离,并判断所述目标欧式距离是否大于预设距离阈值,若是,则确定文本检测结果为文本异常,否则确定文本检测结果为文本正常。
25、进一步地,采用已部署的网页截图检测器对网页截图数据进行检测,获取图像检测结果,包括:
26、将当前数据采样周期对应的网页截图数据与上一个数据采样周期对应的网页截图数据进行拼接,得到已部署的网页截图检测器的输入数据;
27、将得到的输入数据传入已部署的网页截图检测器,获取图像检测结果为图像异常或者图像正常。
28、进一步地,所述已部署的网页截图检测器设置为深度学习模型;通过对深度学习模型进行训练之后,使深度学习模型具备对网页截图数据进行识别的能力,从而输出分类结果,得到图像检测结果。
29、进一步地,采用已部署的属性检测器对属性特征进行检测,获取属性检测结果,包括:
30、调度已部署的属性检测器,解析属性特征,得到网页代码行数、链接数量、图片数量以及文件大小;
31、以当前数据采样周期为起点,获取前n个数据采样周期对应的网页代码行数、链接数量、图片数量以及文件大小;
32、分别获取网页代码行数、链接数量、图片数量以及文件大小的平均值和标准差;
33、判断平均值以及标准差是否均满足预设的阈值条件,若是,则确定属性检测结果为属性正常,否则确定属性检测结果为属性异常。
34、进一步地,采用已部署的行为表现检测器对行为表现特征进行检测,获取行为表现检测结果,包括:
35、调度已部署的行为表现检测器,获取当前数据采样周期的行为表现特征以及上一个数据采样周期的行为表现特征;
36、解析当前数据采样周期的行为表现特征与上一个数据采样周期的行为表现特征之间的相似度,并判断相似度是否大于预设的相似度阈值,若是,则确定行为表现检测结果为行为表现正常,否则确定行为表现检测结果为行为表现异常。
37、另一方面,本专利技术提供一种网页防篡改系统,包括数据获取模块、第一篡改检测模块、第一执行模块、第二篡改检测模块以及第二执行模块;
本文档来自技高网...
【技术保护点】
1.一种网页防篡改方法,其特征在于,包括:
2.根据权利要求1所述的网页防篡改方法,其特征在于,获取预设的数据采样周期以及待监控网站,并按照预设的数据采样周期,抓取待监控网站中的网页特征,包括:
3.根据权利要求2所述的网页防篡改方法,其特征在于,已部署的多个网页检测器包括文本数据检测器、网页截图检测器、属性检测器以及行为表现检测器。
4.根据权利要求3所述的网页防篡改方法,其特征在于,采用已部署的多个网页检测器对抓取到的网页特征进行检测,以获取当前数据采样周期对应的第一篡改检测结果,包括:
5.根据权利要求4所述的网页防篡改方法,其特征在于,采用已部署的文本数据检测器对文本数据进行检测,获取文本检测结果,包括:
6.根据权利要求5所述的网页防篡改方法,其特征在于,采用已部署的网页截图检测器对网页截图数据进行检测,获取图像检测结果,包括:
7.根据权利要求6所述的网页防篡改方法,其特征在于,所述已部署的网页截图检测器设置为深度学习模型;通过对深度学习模型进行训练之后,使深度学习模型具备对网页截图数据进行识别的
8.根据权利要求7所述的网页防篡改方法,其特征在于,采用已部署的属性检测器对属性特征进行检测,获取属性检测结果,包括:
9.根据权利要求8所述的网页防篡改方法,其特征在于,采用已部署的行为表现检测器对行为表现特征进行检测,获取行为表现检测结果,包括:
10.一种网页防篡改系统,其特征在于,包括数据获取模块、第一篡改检测模块、第一执行模块、第二篡改检测模块以及第二执行模块;
...【技术特征摘要】
1.一种网页防篡改方法,其特征在于,包括:
2.根据权利要求1所述的网页防篡改方法,其特征在于,获取预设的数据采样周期以及待监控网站,并按照预设的数据采样周期,抓取待监控网站中的网页特征,包括:
3.根据权利要求2所述的网页防篡改方法,其特征在于,已部署的多个网页检测器包括文本数据检测器、网页截图检测器、属性检测器以及行为表现检测器。
4.根据权利要求3所述的网页防篡改方法,其特征在于,采用已部署的多个网页检测器对抓取到的网页特征进行检测,以获取当前数据采样周期对应的第一篡改检测结果,包括:
5.根据权利要求4所述的网页防篡改方法,其特征在于,采用已部署的文本数据检测器对文本数据进行检测,获取文本检测结果,包括:
6.根据权利要求5所述的网页防篡改方法,其...
【专利技术属性】
技术研发人员:胡莹,
申请(专利权)人:云尖北京软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。