网页文字的加密显示方法和装置制造方法及图纸

技术编号:10281944 阅读:181 留言:0更新日期:2014-08-03 07:03
本发明专利技术公开了一种网页文字的加密显示方法和装置。所述网页文字的加密显示方法包括:将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系;根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。本发明专利技术实施例提供的网页文字的加密显示方法和装置能够通过简单的技术手段防止网页文字内容被非法抓取,增强了网页文字内容的安全性。

【技术实现步骤摘要】
网页文字的加密显示方法和装置
[0001 ] 本专利技术实施例涉及计算机应用技术,尤其涉及一种网页文字的加密显示方法和装置。
技术介绍
在互联网的使用十分盛行的今天,各种网络爬虫(Web crawler)和网络刮削器(Web scraper)的活动也十分猖獗。网络爬虫和网络刮削器通过非授权的读取目标网站的网页内容来获知竞争对手的关键信息。因此,防止网络爬虫和网络刮削器对网站内容的非法读取对保护企业的商业秘密十分必要。现有的防范网络爬虫和网络刮削器的手段一般通过IP地址过滤和防爬虫策略来实现。这些防范措施的实现过程都较为复杂,而网络爬虫或者网络刮削器则可以通过简单的改变访问策略而轻易的避开这些防范措施。
技术实现思路
有鉴于此,本专利技术实施例提出一种网页文字的加密显示方法和装置,以增强网页文字内容的安全性,防止网页文字内容被轻易的抓取。第一方面,本专利技术实施例提供了一种网页文字的加密显示方法,所述方法包括:将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系;根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。第二方面,本专利技术实施例提供了 一种网页文字的加密显示装置,所述装置包括:内容调整模块,用于将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系;还原显示模块,用于根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。本专利技术实施例提供的网页文字的加密显示方法和装置,通过将网页文字切分和置舌L并在切分和置乱后设置相对应的CSS选择器,使得网络爬虫或者刮削器即使抓取了网页文字内容页难以从中获取真实的信息,提高了网页文字内容的安全性,有效防止了网页文字内容被非法抓取。【附图说明】通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是本专利技术第一实施例提供的网页文字的加密显示方法的流程图;图2是本专利技术第二实施例提供的网页文字的加密显示方法中内容调整的流程图;图3是本专利技术第二实施例提供的网页文字的加密显示方法中子串切分的流程图;图4是本专利技术第三实施例提供的网页文字的加密显示方法中内容调整的流程图;图5是本专利技术第三实施例提供的网页文字的加密显示方法中扰码添加的流程图;图6是本专利技术第三实施例提供的层叠显示的原理示意图;图7是本专利技术第三实施例提供的网页文字的加密显示方法中干扰字添加的流程图;图8是本专利技术第四实施例提供的网页文字的加密显示方法中内容调整的流程图;图9是本专利技术第五实施例提供的网页文字的加密显示装置的结构图。【具体实施方式】下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。第一实施例图1是本专利技术第一实施例提供的网页文字的加密显示方法的流程图。本实施例的方法可以由网页文字的加密显示装置来实现,该装置通常可配置在诸如搜索服务器或网页编辑服务器中,对待发布的网页内容进行处理。参见图1,所述网页文字的加密显示方法包括:S110,将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系。网页数据一般包括文字、链接地址和图片等,在网页的脚本文件中,文字、链接地址和图片的资源地址通常是以字符串形式记录的,所以可采用相同手段处理。由于链接地址和图片并不容易被抓取,所以本实施例优选是对文字形式的内容进行加密。优选的,以行为单位,对待加密的网页文字进行处理。对所述待加密的网页数据的调整可以是调整所述待加密的网页数据中包含的字符子串的前后位置关系,也就是将字符子串置乱,也可以是在在所述待加密的网页数据中添加扰码。调整形式可以有多种,能满足使调整后的内容失去原有表达语义即可。在完成了对所述待加密的网页数据的内容调整后,需要对所述调整的关系进行记录。优选的,可以通过层叠样式表(Cascading style sheet, CSS)选择器对所述调整的关系进行记录。S120,根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。由于在对待加密的网页数据进行内容调整后对所述调整的关系进行了记录,所以在对内容进行调整之后,可以根据所记录的调整的关系,将调整后的网页源内容在网页中进行还原显示。优选的,可以根据在CSS选择器中记录的调整的关系,将调整后的网页源内容在网页中进行还原显示。本实施例通过将待加密的网页数据进行内容调整,将调整后的网页数据存储在网页源内容中,记录所述调整的关系,以及将调整后的网页源内容在网页中进行还原显示,实现的对网页文字的加密显示,不仅使得网页内容能够正常的显示,而且使得网络爬虫或者刮削器从网页源内容中即使抓取了网页文字内容也难以从中获取真实的信息,提高了网页文字内容的安全性,有效防止了网页文字内容被非法抓取。第二实施例图2是本专利技术第二实施例提供的网页文字的加密显示方法中内容调整的流程图。所述网页文字的加密显示方法以本专利技术的第一实施例为基础,进一步的,将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系包括:将网页源内容中待加密的网页字符串切分为至少两个字符子串;在所述网页源内容中,调整所述至少两个字符子串的位置关系;将所述字符子串的切分关系,以及将调整的字符子串位置关系作为所述调整的关系进行记录。参见图2,将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系包括:S111,将网页源内容中待加密的网页字符串切分为至少两个字符子串。对待加密的网页数据进行的内容调整是以字符子串为单元进行的,因此,在对待加密的网页数据进行内容调整时必须将网页源内容中待加密的网页字符串进行切分。每个字符子串至少包含一个字符。对所述待加密的网页字符串的切分可以是随机的,也可以是按照预定的函数关系进行的切分。示例的,所述网页源内容如下:<html>〈body〉新疆同时决定,今后在天山一号冰川保护区域内不得再设置探矿权、釆矿权,到期的矿业权不予延续,现有矿点不得扩建,用3到5年时间关停保护区域内所有矿点,并停止一切以天山一号冰川为目的地的旅游、探险等活动。〈/P〉〈/body〉</html>。那么,对待加密的网页文字进行切分后的文字可以是:<html>〈body〉〈span〉新疆同〈/span><span> 时决定,今〈/spanXspan〉后在天山〈/spanXspan〉一号冰〈/spanXspan)川保护区〈/spanXspan)域内不得再设〈/spanXspan)置探矿权、釆矿〈/spanXspan〉权,到期的矿业〈/spanXspan〉权不予延续〈/spanXspan〉,现有〈/spanXspan〉矿点不〈/spanXspan〉得扩建,用3到5年时〈/spanXspan〉间关停保护〈/spanXspan〉区域内所有〈/spanXspan〉矿点,并停止〈/spanXspan〉一切以天〈/spanXspan)山一号冰川为〈/spanXspan〉目的地的旅游、本文档来自技高网...
网页文字的加密显示方法和装置

【技术保护点】
一种网页的加密显示方法,其特征在于,包括:将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系;根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。

【技术特征摘要】
1.一种网页的加密显示方法,其特征在于,包括: 将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系; 根据所述调整的关系,将调整后的网页源内容在网页中进行还原显示。2.根据权利要求1所述的方法,其特征在于,将待加密的网页数据进行内容调整,并将调整后的网页数据存储在网页源内容中,且记录所述调整的关系包括: 将网页源内容中待加密的网页字符串切分为至少两个字符子串; 在所述网页源内容中,调整所述至少两个字符子串的位置关系,和/或,为所述字符子串添加扰码,且为添加有扰码的所述字符子串配置层叠关系; 将所述字符子串的切分关系,以及将调整的字符子串位置关系,和/或,配置的字符子串层叠关系作为所述调整的关系进行记录。3.根据权利要求2所述的方法,其特征在于,将所述字符子串的切分关系,以及将调整的字符子串位置关系,和/或,配置的字符子串层叠关系作为所述调整的关系进行记录包括: 采用层叠样式表CSS选择器记录字符子串切分长度,以及记录调整的字符子串位置关系,和/或,配置的字符子串层叠关系。4.根据权利要求2所述的方法,其特征在于,将网页源内容中待加密的网页字符串切分为至少两个字符子串包括: 按照预定方式产生切分子串长度数组,其中,所述切分子串长度数组中的数值的和大于所述待加密的网页字符串的长度; 将所述切分子串长度数组中的数值作为切分后字符子串的长度,对所述待加密的网页字符串进行切分。5.根据权利要求2所述的方法,其特征在于,为所述字符子串添加扰码,且为添加有扰码的所述字符子串配置层叠关系包括: 在所述字符子串的首部和/或尾部添加干扰字,作为所述扰码; 将添加有扰码的所述字符子串配置为部分覆盖在相邻字符子串的下层,以使所述相邻字符子串覆盖所述扰码,且露出所述字符子串。6.根据权利要求5所述的方法,其特征在于,在所述字符子串的首部和/或尾部添加干扰字包括: 从所述至少两个字符子串中选择切分点,作为目标切分点; 在所述目标切分点的前向字符子串的尾部或...

【专利技术属性】
技术研发人员:韩利豪逯鹏宇
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1