The invention provides a data processing method and a device. The data processing method includes acquiring the pre-stored custom characters, replacing the target data in the source code of the target page with the custom characters, and storing the corresponding relationship between the custom characters and the target data replaced by them. When displaying the target page, the target data is displayed on the target page according to the corresponding relationship. The method enables the data acquired by the crawler user to be replaced by custom characters. If the corresponding relationship among them is not known, the correct target data can not be known and the core data can be effectively protected.
【技术实现步骤摘要】
数据处理方法及装置
本专利技术涉及信息安全
,具体而言,涉及一种数据处理方法及装置。
技术介绍
爬虫:网络爬虫(又被称为网页蜘蛛,网络机器人,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取信息的程序或者脚本。在实际场景中,爬虫也被称为蚂蚁、自动索引、模拟程序或者蠕虫。反爬虫,一种克制恶意爬虫行为的方式。现有技术中,主要是通过限制爬虫用户的IP(InternetProtocolAddress,网际协议地址),识别爬虫用户,从而保护重要的数据。由于爬虫用户可以通过隐藏自己的IP等方式避免被限制,所以识别爬虫用户比较困难,不能有效的保护核心数据。
技术实现思路
本申请在于提供一种数据处理方法及装置,以改善现有技术中不能有效的保护核心数据的技术问题。本专利技术的实施例通过如下方式实现:第一方面,本专利技术实施例提供一种数据处理方法,所述方法包括:获取预先存储的自定义字符;使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,其中,在显示所述目标页面时,根据所述对应关系将所述目标数据显示在所述目标页面上。在本专利技术实施例的技术方案中,使用预先存储的自定义字符对目标页面的源代码中的目标数据进行替换,并存储替换的对应的关系。与现有技术相比,不用去找到爬虫用户再限制其IP,对于爬虫用户来说从页面源代码中获取到的数据是替换后的自定义字符,如果不知道其中的对应关系,就无法得知正确的目标数据,有效的保护核心数据。结合第一方面,在第一方面的第一种可能的实现方式中,获取预先存储的自定义字符包括:从预先存储的自定义字符库 ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:获取预先存储的自定义字符;使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,其中,在显示所述目标页面时,根据所述对应关系将所述目标数据显示在所述目标页面上。
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取预先存储的自定义字符;使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,其中,在显示所述目标页面时,根据所述对应关系将所述目标数据显示在所述目标页面上。2.根据权利要求1所述的方法,其特征在于,获取预先存储的自定义字符包括:从预先存储的自定义字符库中任意选择至少两种自定义字符;相应的,使用所述自定义字符替换目标页面的源代码中的目标数据,并存储所述自定义字符与其替换的目标数据的对应关系,包括:使用所述至少两种自定义字符替换目标页面的源代码中的目标数据,并存储每种自定义字符与其替换的目标数据的对应关系。3.根据权利要求1所述的方法,其特征在于,获取预先存储的自定义字符,包括:周期性获取预先存储的自定义字符,其中,至少有两次获取的自定义字符互不相同。4.根据权利要求1所述的方法,其特征在于,在获取预先存储的自定义字符之前,所述方法还包括:获取多种初始字符;按照预设规则对所述多种初始字符进行转换,得到与所述多种初始字符分别对应的自定义字符,并将所述自定义字符进行对应存储。5.根据权利要求4所述的方法,其特征在于,所述预设规则包括改变所述初始字符对应的进位制编码、改变所述初始字符对应的进位制编码的格式中的至少一种。6.一种数据处理方法,其特征在于,包括:接收用户的目标页面...
【专利技术属性】
技术研发人员:赵景坤,曾盈,周亮,庞伟,兰英,
申请(专利权)人:北京知道创宇信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。