一种检测页面篡改的方法技术

技术编号:20160931 阅读:33 留言:0更新日期:2019-01-19 00:13
本发明专利技术涉及一种检测页面篡改的方法,包括:步骤S100,在第二时间获取所述页面;步骤S200,根据所述页面,获得第二页面指纹;步骤S300,根据所述第二页面指纹与第一页面指纹,判断所述页面是否被篡改;其中,所述第一页面指纹为根据第一时间获取的所述页面获得;所述第二时间在第一时间之后。

【技术实现步骤摘要】
一种检测页面篡改的方法
本专利技术涉及信息的正确性验证,尤其涉及一种检测页面是否被篡改的方法。
技术介绍
目前,经常有网页页面被篡改。在多篇中国专利文献CN201210424973、CN201110120998中公开了检测网页被篡改的方法。但是上述方法中均涉及复杂模型的构建、训练,检测方法过于复杂。因此,特别需要一种能够快速检测网页页面是否被篡改的方法。
技术实现思路
为解决上述技术问题,本专利技术涉及一种检测页面篡改的方法,包括:步骤S100,在第二时间获取所述页面;步骤S200,根据所述页面,获得第二页面指纹;步骤S300,根据所述第二页面指纹与第一页面指纹,判断所述页面是否被篡改;其中,所述第一页面指纹为根据第一时间获取的所述页面获得;所述第二时间在第一时间之后。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,将对本专利技术作进一步地详细描述。这种描述是通过示例而非限制的方式介绍了与本专利技术的原理相一致的具体实施方式,这些实施方式的描述是足够详细的,以使得本领域技术人员能够实践本专利技术,在不脱离本专利技术的范围和精神的情况下可以使用其他实施方式并且可以改变和/或替换各要素的结构。因此,不应当从限制性意义上来理解以下的详细描述。本专利技术提供了一种检测网页(尤其是Web)页面是否被篡改的方法。本专利技术中,网页页面包括能够在PC或移动终端上通过浏览器或其他类型的应用程序或APP显示的页面;网页页面的内容可以包括文本、表格、图像、音频、视频等任一及其组合能够使用二进制数据表示的格式;网页的所涉及的主题可以包括新闻类、体育类、音乐类、影视类、技术类、广告类等任一及其组合;网页页面可以为HTML页面、XML页面、WML页面等多种类型。换言之,前述枚举的网页页面的打开方式、内容、主题和类型等均会落入本专利技术的保护范围。本专利技术的第一个实施例中,首先,在第一时间获取网页页面,然后根据所述页面获得第一页面指纹。本专利技术中,页面指纹为对网页页面进行处理而获得的能够唯一标识网页页面的数据,即相同的页面指纹必然对应着相同的网页页面,不同的页面指纹必然对应不同的网页页面。本领域中,任何能够实现页面指纹的前述功能的处理方法均可以适用于本专利技术,例如现有技术中的不可逆加密方法均可适用于本专利技术,即采用不可逆加密方法对网页页面进行处理从而获得页面指纹。具体的,该第一页面指纹是指在对网页页面进行不可逆加密后获得的第一编码数据。优选的,对网页页面进行不可逆加密后获得的第一编码数据,包括对网页页面进行MD5加密运算后获得的第一MD5编码数据(例如32位编码数据,本领域技术人员知晓,也可以采用其他位数的MD5编码数据)。MD5编码数据是根据网页页面运算得到的具有唯一性的编码数据,且通过该MD5编码数据无法还原出原网页页面。之后,在与第一时间间隔一段时间后的第二时间,再次获取网页页面,然后根据所述页面获得第二页面指纹。第二页面指纹的含义、具体实现方式、以及获取过程等与第一页面指纹相同,不再赘述。然后,根据获得的所述第二页面指纹与所述第一页面指纹,判断所述网页页面是否被篡改。本专利技术的一个实施例中,即将第一页面指纹(例如第一MD5编码数据)和第二页面指纹(例如第二MD5编码数据)进行比较。若比较结果相同,则判断出所述网页页面没有被篡改。若比较结果不同,则判断出所述网页页面被篡改了。通过本专利技术的上述实施例,获得了快速检测网页页面是否被篡改的有益技术效果。该检测方法不需要构建复杂的模型,且获得的检测结果快速。前述实施例中,虽然能够快速获得检索结果,但是在处理网页页面时也存在一些技术问题。网页页面上呈现的内容包括两种情况,一种是内容(例如文字内容)直接体现在网页中,另一种是内容的链接地址体现在网页源码中。对于第一种情况,如果网页页面的部分内容被善意的微调,例如两段无关联的文字内容的显示顺序的对调。此时,虽然网页页面的文字内容没有发生变化,但是生成的网页指纹的确发生了改变,从而导致不必要的误判。对于第二种情况,如果链接地址不发生变化,但是链接地址指向的内容发生了变化。此时,网页页面呈现的内容将发生变化,但是生成的网页指纹仍然不会变化,从而导致误判。为克服上述问题,本专利技术进一步提供了以下优选的实施例。优选的本专利技术的一个实施例中,首先,在第一时间获取网页页面,所述页面包括多个()组指示在页面上显示内容(例如文本内容)的内容标签。例如,新浪网的网页页面中包括以下两条内容,每条内容中的“<b><b>”构成了一组内容标签,第一组内容标签指示在页面上显示文本“体育”,第二组指示显示“娱乐”。“<ahref="http://sports.sina.com.cn/"target="_blank"><b>体育<b></a>;<ahref="http://ent.sina.com.cn/"target="_blank"><b>娱乐</b></a>。”根据本专利技术,在第一时间获取网页页面的内容标签(前述例子中的“<b><b>”),根据该内容标签解析获得页面中的一个或多个显示内容。例如,该解析出的显示内容是页面中的文本内容(前述例子中的“体育”和“娱乐”)。之后,对所述解析出的一个或多个显示内容进行排序,形成排序后的显示内容。本领域技术人员应该知晓在现有技术中存在排序的多种方式,例如,对显示内容按字母、拼音、笔画进行排序等。然后,对所述排序后的显示内容进行不可逆加密,形成第一内容编码数据。根据本专利技术的一个优选实施例,对所述排序后的显示内容进行不可逆加密后获得的第一编码数据,是指对所述排序后的显示内容进行MD5加密运算后获得第一MD5编码数据(例如32位编码数据,本领域技术人员知晓,也可以采用其他位数的MD5编码数据)。之后,采用与上述在第一时间获取显示内容的相同方式,在与第一时间间隔一段时间后的第二时间,再次获取网页页面中的一个或多个显示内容。同样的,采用相同的排序方法,对再次获得的所述一个或多个显示内容进行排序,形成排序后的显示内容。然后,对所述排序后的显示内容进行不可逆加密,形成第二内容编码数据。对所述排序后的显示内容进行不可逆加密后获得的第二编码数据,是指对所述排序后的显示内容进行MD5加密运算后获得第二MD5编码数据(例如32位编码数据,本领域技术人员知晓,也可以采用其他位数的MD5编码数据)。然后,根据获得的所述第一MD5编码数据与所述第二MD5编码数据,判断所述网页页面是否被篡改。即将第一MD5编码数据和第二MD5编码数据进行比较。若比较结果相同,则判断出所述网页页面中的显示内容没有被篡改。若比较结果不同,则判断出所述网页页面中的显示内容被篡改了,进而判断出网页页面被篡改。上述优选的本专利技术的一个实施例有效克服了第一种情况的技术问题,并且取得了以下有益技术效果:在网页页面中的显示内容未发生变化,只是显示的前后顺序进行调整的情况下,进行页面检测时依然能判本文档来自技高网...

【技术保护点】
1.一种检测(Web)页面篡改的方法,其特征在于,包括:步骤S100,在第二时间获取所述页面;步骤S200,根据所述页面,获得第二页面指纹;步骤S300,根据所述第二页面指纹与第一页面指纹,判断所述页面是否被篡改;其中,所述第一页面指纹为根据第一时间获取的所述页面获得;所述第二时间在第一时间之后。

【技术特征摘要】
1.一种检测(Web)页面篡改的方法,其特征在于,包括:步骤S100,在第二时间获取所述页面;步骤S200,根据所述页面,获得第二页面指纹;步骤S300,根据所述第二页面指纹与第一页面指纹,判断所述页面是否被篡改;其中,所述第一页面指纹为根据第一时间获取的所述页面获得;所述第二时间在第一时间之后。2.根据权利要求1所述的方法,其特征在于,所述第一、二页面指纹分别为对第一、二时间获取的页面进行相同的不可逆加密后获得的第一、二编码数据(例如32位的MD5编码数据);所述步骤S300包括:如果所述第一、二编码数据相同,那么判断所述页面没有被篡改;如果所述第一、二编码数据不同,那么判断所述页面被篡改。3.根据权利要求1所述的方法,其特征在于,所述页面包括多个(组)指示在页面上显示内容(例如文本内容)的内容标签,所述第一、二页面指纹包括第一、二内容编码数据;步骤S200进一步包括:步骤S210,根据内容标签解析页面,获得页面中的一个或多个显示内容;步骤S220,对所述一个或多个显示内容排序,形成排序后的显示内容;步骤S230,对所述排序后的显示内容进行不可逆加密,形成所述第二内容编码数据;所述第一内容编码数据的获取包括:步骤S10,根据第一时间获取页面的内容标签解析页面,获得页面中的一个或多个显示内容;步骤S20,对所述一个或多个显示内容排序(与步骤S220相同的排序方法),形成排序后的显示内容;步骤...

【专利技术属性】
技术研发人员:俞锋锋鲁静赵磊磊叶新江方毅
申请(专利权)人:浙江每日互动网络科技股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1