网页篡改检测方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:19009417 阅读:36 留言:0更新日期:2018-09-22 09:15
本发明专利技术公开了一种网页篡改检测方法,包括:获取被保护网页的页面截图;从页面截图中获取包含敏感信息的敏感内容截图;判断所述敏感内容截图与预先存储的标准敏感内容截图是否一致;若否,则判定所述被保护页面被篡改。可见,在本方案中,通过对被保护页面的页面截图,获取该页面的敏感内容截图,并将敏感内容截图与预存的标准敏感内容截图的对比,来确定该页面的敏感内容是否被篡改,从而可及时发现被篡改的敏感内容,避免由于敏感内容被篡改带来的损失;本发明专利技术还公开了一种网页篡改检测装置、设备及计算机可读存储介质,同样可实现上述技术效果。

Webpage tampering detection method, device, device and computer readable storage medium

The invention discloses a method for detecting web page tampering, which includes: obtaining a screenshot of a protected web page; obtaining a screenshot of sensitive content containing sensitive information from a screenshot of a page; judging whether the screenshot of the sensitive content is consistent with a pre-stored standard sensitive content screenshot; and judging if not, whether the protected page is tampered with. Change. It can be seen that in this scheme, the sensitive content of the protected page is captured by screenshots, and the sensitive content screenshots are compared with the saved standard sensitive content screenshots to determine whether the sensitive content of the page has been tampered with, so that the tampered sensitive content can be found in time and avoid being sensitive. The invention also discloses a web page tampering detection device, a device and a computer readable storage medium, which can achieve the same technical effect.

【技术实现步骤摘要】
网页篡改检测方法、装置、设备及计算机可读存储介质
本专利技术涉及网页篡改检测
,更具体地说,涉及一种网页篡改检测方法、装置、设备及计算机可读存储介质。
技术介绍
目前,在网站的某些页面上会存在一些敏感内容,例如联系电话/支付地址等。这些敏感信息是公开的,很容易受到其他人的恶意篡改,进而会对网站主造成巨大的伤害。例如:2017/07/21CoinDash平台ICO融资700万美元被洗劫,原因是网站内的支付地址被改为黑客的地址。可以看出,敏感信息被篡改会造成很严重的问题。因此,如何及时发现被篡改的敏感内容,避免由于敏感内容被篡改带来的损失,是本领域技术人员需要解决的问题。
技术实现思路
本专利技术的目的在于提供一种网页篡改检测方法、装置、设备及计算机可读存储介质,以实现及时发现被篡改的敏感内容,避免由于敏感内容被篡改带来的损失。为实现上述目的,本专利技术实施例提供了如下技术方案:一种网页篡改检测方法,包括:获取被保护网页的页面截图;从页面截图中获取包含敏感信息的敏感内容截图;判断所述敏感内容截图与预先存储的标准敏感内容截图是否一致;若否,则判定所述被保护页面被篡改。其中,所述从页面截图中获取包含敏感信息的敏感内容截图,包括:对所述页面截图进行切分,生成包括所有连通子图的集合;去除所述集合中的背景子图,保留前景子图;将切割位置相邻且风格相近的前景子图合并,生成待识别的局部截图;按照预定识别算法识别所述待识别的局部截图,确定包含敏感信息的敏感内容截图。其中,所述按照预定识别算法识别所述待识别的局部截图,确定包含敏感信息的敏感内容截图包括:利用OCR文本识别技术将所述待识别的局部截图转换为文字信息,并利用文本分类算法判断文字信息中是否包含敏感内容;若包含敏感内容,则将所述敏感内容所在的待识别的局部截图作为敏感内容截图。其中,所述判断所述敏感内容截图与预先存储的标准敏感内容截图是否一致,若否,则判定所述被保护页面被篡改,包括:判断预先存储的标准敏感内容截图中是否存在与所述敏感内容截图位置一致的目标标准敏感内容截图;若不存在,则判定所述被保护页面被篡改;若存在,则判断所述目标标准敏感内容截图的内容与所述述敏感内容截图的内容是否一致;若不一致,则判定所述被保护页面被篡改。其中,判定所述被保护页面被篡改之后,还包括:按照预存的提醒方式,向管理员发送篡改提示信息。一种网页篡改检测装置,包括:页面截图获取模块,用于获取被保护网页的页面截图;敏感内容截图获取模块,用于从页面截图中获取包含敏感信息的敏感内容截图;判断模块,用于判断所述敏感内容截图与预先存储的标准敏感内容截图是否一致;若否,则判定所述被保护页面被篡改。其中,所述敏感内容截图获取模块包括:切分单元,用于对所述页面截图进行切分,生成包括所有连通子图的集合;筛选单元,用于去除所述集合中的背景子图,保留前景子图;合并单元,用于将切割位置相邻且风格相近的前景子图合并,生成待识别的局部截图;识别单元,用于按照预定识别算法识别所述待识别的局部截图,确定包含敏感信息的敏感内容截图。其中,所述识别单元包括:文字转换子单元,用于利用OCR文本识别技术将所述待识别的局部截图转换为文字信息;判断子单元,用于利用文本分类算法判断文字信息中是否包含敏感内容;敏感内容截图确定子单元,用于在文字信息中包含敏感内容时,将所述敏感内容所在的待识别的局部截图作为敏感内容截图。其中,所述判断模块包括:第一判断单元,用于判断预先存储的标准敏感内容截图中是否存在与所述敏感内容截图位置一致的目标标准敏感内容截图;若不存在,则判定所述被保护页面被篡改;第二判断单元,用于存在与所述敏感内容截图位置一致的目标标准敏感内容截图时,判断所述目标标准敏感内容截图的内容与所述述敏感内容截图的内容是否一致;若不一致,则判定所述被保护页面被篡改。其中,本方案还包括:提示模块,用于按照预存的提醒方式,向管理员发送篡改提示信息。一种网页篡改检测设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述网页篡改检测方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述网页篡改检测方法的步骤。通过以上方案可知,本专利技术实施例提供的一种网页篡改检测方法,包括:获取被保护网页的页面截图;从页面截图中获取包含敏感信息的敏感内容截图;判断所述敏感内容截图与预先存储的标准敏感内容截图是否一致;若否,则判定所述被保护页面被篡改。可见,在本方案中,通过对被保护页面的页面截图,获取该页面的敏感内容截图,并将敏感内容截图与预存的标准敏感内容截图的对比,来确定该页面的敏感内容是否被篡改,从而可及时发现被篡改的敏感内容,避免由于敏感内容被篡改带来的损失;本专利技术还公开了一种网页篡改检测装置、设备及计算机可读存储介质,同样可实现上述技术效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例公开的一种网页篡改检测方法流程示意图;图2为本专利技术实施例公开的另一种网页篡改检测方法流程示意图;图3为本专利技术实施例公开的一种网页篡改检测装置结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例公开了一种网页篡改检测方法、装置、设备及计算机可读存储介质,以实现及时发现被篡改的敏感内容,避免由于敏感内容被篡改带来的损失。参见图1,本专利技术实施例提供的一种网页篡改检测方法,包括:S101、获取被保护网页的页面截图;具体的,在本实施例中,获取被保护网页的页面截图可以理解为在检测阶段获取的,进而,在检测阶段获取被保护网页的页面截图可以通过设置检测间隔,即每隔预定时间间隔便执行S101-S103,对被保护页面进行一次检测。需要说明的是,预设的时间间隔可为用户预先设置的检测间隔,例如:60s、120s等,也就是说,若间隔时间为60s,那么系统会每间隔60s重新执行S101-S103,以防止被保护网页被篡改;当然,该时间间隔可以根据实际情况进行设定,若被保护页面的重要等级较高,则可设定时间间隔短一些,相反,则可设置长一些。在本实施例中,被保护网页也就是被保护的页面的URL,可以由用户手工指定来确定,也可以由用户指定域名后,通过爬虫获取站点内的网页,再通过S102来判断是否存在敏感内容截图,如果网页内存在敏感信息,则确定为被保护的网页。进一步,确定被保护页面的URL后,需要获取被保护页面的页面截图,具体来说,可以使用脚本驱动浏览器访问被保护的URL,从而保存整个页面的截图。S102、从页面截图中获取包含敏感信息的敏感内容截图;具体的,页面截图中包括被保护页面的所有内容,包括图片、链接、文字等信息。在获取敏感内容截图时,可以由用户指定,也可以通本文档来自技高网...
网页篡改检测方法、装置、设备及计算机可读存储介质

【技术保护点】
1.一种网页篡改检测方法,其特征在于,包括:获取被保护网页的页面截图;从页面截图中获取包含敏感信息的敏感内容截图;判断所述敏感内容截图与预先存储的标准敏感内容截图是否一致;若否,则判定所述被保护页面被篡改。

【技术特征摘要】
1.一种网页篡改检测方法,其特征在于,包括:获取被保护网页的页面截图;从页面截图中获取包含敏感信息的敏感内容截图;判断所述敏感内容截图与预先存储的标准敏感内容截图是否一致;若否,则判定所述被保护页面被篡改。2.根据权利要求1所述的网页篡改检测方法,其特征在于,所述从页面截图中获取包含敏感信息的敏感内容截图,包括:对所述页面截图进行切分,生成包括所有连通子图的集合;去除所述集合中的背景子图,保留前景子图;将切割位置相邻且风格相近的前景子图合并,生成待识别的局部截图;按照预定识别算法识别所述待识别的局部截图,确定包含敏感信息的敏感内容截图。3.根据权利要求2所述的网页篡改检测方法,其特征在于,所述按照预定识别算法识别所述待识别的局部截图,确定包含敏感信息的敏感内容截图包括:利用OCR文本识别技术将所述待识别的局部截图转换为文字信息,并利用文本分类算法判断文字信息中是否包含敏感内容;若包含敏感内容,则将所述敏感内容所在的待识别的局部截图作为敏感内容截图。4.根据权利要求3所述的网页篡改检测方法,其特征在于,所述判断所述敏感内容截图与预先存储的标准敏感内容截图是否一致,若否,则判定所述被保护页面被篡改,包括:判断预先存储的标准敏感内容截图中是否存在与所述敏感内容截图位置一致的目标标准敏感内容截图;若不存在,则判定所述被保护页面被篡改;若存在,则判断所述目标标准敏感内容截图的内容与所述述敏感内容截图的内容是否一致;若不一致,则判定所述被保护页面被篡改。5.根据权利要求1至4中任意一项所述的网页篡改检测方法,其特征在于,判定所述被保护页面被篡改之后,还包括:按照预存的提醒方式,向管理员发送篡改提示信息。6.一种网页篡改检测装置,其特征在于,包括:页面截图获取模块,用于获取被保护网页的页面截图;敏感内容截图获取模块,用于从页面截图中获取包含敏感信息的敏感内容截图;判断模块,用于判断所述敏感内容截图与预先存储...

【专利技术属性】
技术研发人员:马长春
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1