一种网页信息反爬虫方法、装置、系统、设备及存储介质制造方法及图纸

技术编号:39184421 阅读:24 留言:0更新日期:2023-10-27 08:31
本发明专利技术适用于计算机领域,提供了一种网页信息反爬虫方法、装置、系统、设备及存储介质。其中,方法包括:接收终端发送的信息获取请求;将待返回信息中预设的关键信息转换为图片数据;对所述图片数据进加密,得到加密图片数据;将所述待返回信息以及加密图片数据返回至所述终端,使得终端能够正常地将加密图像数据中的信息渲染出来,从而不影响用户的正常浏览,而在爬虫爬取网页数据时,得到的只是无意义的乱码,从而使得爬虫无法获取关键信息,进而提高反爬虫效果。高反爬虫效果。高反爬虫效果。

【技术实现步骤摘要】
一种网页信息反爬虫方法、装置、系统、设备及存储介质


[0001]本专利技术属于计算机领域,尤其涉及一种网页信息反爬虫方法、装置、系统、设备及存储介质。

技术介绍

[0002]爬虫,也被称为网络爬虫、网络机器人,是一种按照一定的规则,自动地抓取互联网信息的程序或者脚本。而网站所有者为了避免网页信息被他人通过爬虫自动采集,或者是减轻爬虫给服务器带来的巨大压力,会采用一定的反爬虫策略以遏制爬虫。
[0003]现有的反爬虫策略是:在用户登录时,需要用户与验证码进行一定的交互,从而根据用户的操作以判断用户是否爬虫,或者是:限制IP的请求频率,从而避免一个IP地址在短时间内频繁地访问,以降低服务器的压力。
[0004]但现有技术的反爬虫策略的反爬虫的效果不够理想。

技术实现思路

[0005]本申请实施例的目的在于提供一种网页信息反爬虫方法,旨在解决现有反爬虫策略的反爬虫效果较差的技术问题。
[0006]本申请实施例是这样实现的,一种网页信息反爬虫方法,应用于服务器,所述方法包括:接收终端发送的信息获取请求;将待返回信本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种网页信息反爬虫方法,其特征在于,应用于服务器,所述方法包括:接收终端发送的信息获取请求;将待返回信息中预设的关键信息转换为图片数据;对所述图片数据进加密,得到加密图片数据;将所述待返回信息以及加密图片数据返回至所述终端。2.根据权利要求1所述的一种网页信息反爬虫方法,其特征在于,所述将待返回信息中预设的关键信息转换为图片数据,包括:根据待返回信息中预设的关键信息的长度,确定图片尺寸;根据所述图片尺寸,生成空白图片;将所述关键信息添加至所述空白图片,得到图片数据。3.根据权利要求1所述的一种网页信息反爬虫方法,其特征在于,所述对所述图片数据进加密,得到加密图片数据,包括:基于base64加密算法对所述图片数据进加密,得到加密图片数据。4.一种网页信息反爬虫方法,其特征在于,应用于终端,包括:向服务器发送信息获取请求;接收并直接展示服务器返回的待返回信息以及加密图片数据。5.一种网页信息反爬虫装置,其特征在于,包括:信息获取请求接收模块,用于接收终端发送的信息获取请求;关键信息转换模块,用于将待返回信息中预设的关键信息转换为图片数据;图片数据加密模块,用于对所述图片数据进加密,得到加密图片数据;以及,信息返回模块,用于将所述待返回信息以及加密图片数据返回至所述终端。6.根据权利要...

【专利技术属性】
技术研发人员:徐鸿举
申请(专利权)人:百鸟数据科技北京有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1