数据处理方法及装置制造方法及图纸

技术编号:20993065 阅读:46 留言:0更新日期:2019-04-29 22:54
本发明专利技术提供数据处理方法及装置。所述数据处理方法包括:获取预先存储的自定义字符;使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,其中,在显示所述目标页面时,根据所述对应关系将所述目标数据显示在所述目标页面上。所述方法使爬虫用户获取到的数据是替换后的自定义字符,如果不知道其中的对应关系,就无法得知正确的目标数据,有效的保护核心数据。

Data Processing Method and Device

The invention provides a data processing method and a device. The data processing method includes acquiring the pre-stored custom characters, replacing the target data in the source code of the target page with the custom characters, and storing the corresponding relationship between the custom characters and the target data replaced by them. When displaying the target page, the target data is displayed on the target page according to the corresponding relationship. The method enables the data acquired by the crawler user to be replaced by custom characters. If the corresponding relationship among them is not known, the correct target data can not be known and the core data can be effectively protected.

【技术实现步骤摘要】
数据处理方法及装置
本专利技术涉及信息安全
,具体而言,涉及一种数据处理方法及装置。
技术介绍
爬虫:网络爬虫(又被称为网页蜘蛛,网络机器人,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取信息的程序或者脚本。在实际场景中,爬虫也被称为蚂蚁、自动索引、模拟程序或者蠕虫。反爬虫,一种克制恶意爬虫行为的方式。现有技术中,主要是通过限制爬虫用户的IP(InternetProtocolAddress,网际协议地址),识别爬虫用户,从而保护重要的数据。由于爬虫用户可以通过隐藏自己的IP等方式避免被限制,所以识别爬虫用户比较困难,不能有效的保护核心数据。
技术实现思路
本申请在于提供一种数据处理方法及装置,以改善现有技术中不能有效的保护核心数据的技术问题。本专利技术的实施例通过如下方式实现:第一方面,本专利技术实施例提供一种数据处理方法,所述方法包括:获取预先存储的自定义字符;使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,其中,在显示所述目标页面时,根据所述对应关系将所述目标数据显示在所述目标页面上。在本专利技术实施例的技术方案中,使用预先存储的自定义字符对目标页面的源代码中的目标数据进行替换,并存储替换的对应的关系。与现有技术相比,不用去找到爬虫用户再限制其IP,对于爬虫用户来说从页面源代码中获取到的数据是替换后的自定义字符,如果不知道其中的对应关系,就无法得知正确的目标数据,有效的保护核心数据。结合第一方面,在第一方面的第一种可能的实现方式中,获取预先存储的自定义字符包括:从预先存储的自定义字符库中任意选择至少两种自定义字符;相应的,使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,包括:使用所述至少两种自定义字符替换目标页面的源代码中的目标数据,并存储每种自定义字符与其替换的目标数据的对应关系。使用多种自定义字符进行替换,使替换的对应关系更复杂且具有随机性。如果爬虫想要尝试破解对应关系,复杂且随机性较强的对应关系加大了破解的难度,做到有效的保护核心数据。结合第一方面,在第一方面的第二种可能的实现方式中,获取预先存储的自定义字符,包括:周期性获取预先存储的自定义字符,其中,至少有两次获取的自定义字符互不相同。通过周期性的获取不同的自定义字符,那么替换目标数据的自定义字符也是周期性变化的,使对应关系能够动态变化和更新,更加有效的防止爬虫用户进行针对性分析而盗取核心数据。结合第一方面,在第一方面的第三种可能的实现方式中,在获取预先存储的自定义字符之前,所述方法还包括:获取多种初始字符;按照预设规则对所述多种初始字符进行转换,得到与所述多种初始字符分别对应的自定义字符,并将所述自定义字符进行对应存储。选择多种初始字符,按照预设规则进行转换,得到多种自定义字符,使爬虫难以盗取正确的核心数据。结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述预设规则包括改变所述初始字符对应的进位制编码、改变所述初始字符对应的进位制编码的格式中的至少一种。通过对初始字符进行至少一种方式的转换得到的自定义字符,使爬虫难以破解自定义字符对应的目标数据,有效的保护核心数据。第二方面,本专利技术实施例还提供一种数据处理方法,所述方法包括:接收用户的目标页面访问请求;获取与所述目标页面对应的源代码,以及所述源代码中的自定义字符与其替换的目标数据的对应关系;显示所述目标页面,并根据所述对应关系将所述目标数据显示在所述目标页面上。根据对应关系将正确的目标数据显示给正常用户,在保护核心数据的同时不影响正常用户的浏览。结合第二方面,在第二方面的第一种可能的实现方式中,获取所述源代码中的自定义字符与其替换的目标数据的对应关系包括:获取所述源代码中的至少两种自定义字符与其替换的目标数据的对应关系,所述对应关系包括所述源代码中每种自定义字符与其替换的目标数据的对应关系。结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,根据所述对应关系将所述目标数据显示在所述目标页面上包括:根据所述对应关系确定所述至少两种自定义字符分别替换的目标数据;将所述分别替换的目标数据显示在所述目标页面上。第三方面,本专利技术实施例提供一种数据处理装置,所述数据处理装置包括用于实现第一方面所述的方法的功能模块。第四方面,本专利技术实施例还提供一种数据处理装置,所述数据处理装置包括用于实现第二方面所述的方法的功能模块。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举本专利技术实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术实施例提供的数据处理系统结构示意图;图2为本专利技术实施例提供的一种数据处理方法流程图;图3为本专利技术实施例提供的另一种数据处理方法流程图;图4为本专利技术实施例提供的一种数据处理装置的功能框图;图5为本专利技术实施例提供的另一种数据处理装置的功能框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。下面结合附图,对本专利技术的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。为了能够更加清楚地理解本专利技术实施例的技术方案,本专利技术实施例先对本专利技术实施例的技术方案的应用场景作介绍。请参照图1,是本专利技术实施例提供的一种数据处理系统100,如图1所示,数据处理系统100包括客户端101和服务器102,客户端101和服务器102之间通信连接。其中的客户端101可以是例如手机、电脑等电子设备或者安装在电子设备上的网页浏览器等,用户可以利用客户端101查询或者浏览各种数据。服务器102可以是不同类型的服务器例如文件服务器、终端服务器或者邮件服务器等。服务器102中存储着大量的数据,这些数据可以供用户查询或者浏览。但是,有关于用户的隐私或者商业机密或者身份信息等核心数据,可能不是所有用户都能看到的,因此存在着一些恶意的行为想要盗取这些核心数据,在这种情况下,服务器102就需要对这些核心数据进行保护,同时还要保证正常用户能够获取到核心数据。其中,正常用户可以理解为拥有查看这些核心数据的权限的用户,比如某一封邮件的收件人和发件人,或者未发布的重要消息的知情者等。爬虫:网络爬虫(又被称为网页蜘蛛,网络机器人,更经常的本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:获取预先存储的自定义字符;使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,其中,在显示所述目标页面时,根据所述对应关系将所述目标数据显示在所述目标页面上。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取预先存储的自定义字符;使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,其中,在显示所述目标页面时,根据所述对应关系将所述目标数据显示在所述目标页面上。2.根据权利要求1所述的方法,其特征在于,获取预先存储的自定义字符包括:从预先存储的自定义字符库中任意选择至少两种自定义字符;相应的,使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,包括:使用所述至少两种自定义字符替换目标页面的源代码中的目标数据,并存储每种自定义字符与其替换的目标数据的对应关系。3.根据权利要求1所述的方法,其特征在于,获取预先存储的自定义字符,包括:周期性获取预先存储的自定义字符,其中,至少有两次获取的自定义字符互不相同。4.根据权利要求1所述的方法,其特征在于,在获取预先存储的自定义字符之前,所述方法还包括:获取多种初始字符;按照预设规则对所述多种初始字符进行转换,得到与所述多种初始字符分别对应的自定义字符,并将所述自定义字符进行对应存储。5.根据权利要求4所述的方法,其特征在于,所述预设规则包括改变所述初始字符对应的进位制编码、改变所述初始字符对应的进位制编码的格式中的至少一种。6.一种数据处理方法,其特征在于,包括:接收用户的目标页面...

【专利技术属性】
技术研发人员:赵景坤曾盈周亮庞伟兰英
申请(专利权)人:北京知道创宇信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1