The invention provides a data capture method and device, including the data capture method access: receiving a request sent by the user, the user request contains the user information; judging whether the user information is in the pre generated list; if the user information on the blacklist, and access corresponding to the user information data placement strategy, and according to the data on the strategy to generate false data, and the false data feedback to the access. This method can improve the effect of data anti grasping.
【技术实现步骤摘要】
数据反抓取方法和装置
本专利技术涉及互联网
,尤其涉及一种数据反抓取方法和装置。
技术介绍
随着互联网的蓬勃发展,竞争日益白热化,其中通过对竞品进行数据抓取,可以进行竞品分析,为竞争提供了基础支持和后续相关支持。相应的,为了保护自身数据,企业也需要进行数据反抓取。相关技术中,数据反抓取的常规解决方式是对异常IP进行IP封禁或者采用验证码进行验证,但是这种方式简单直接,效果并不理想。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种数据反抓取方法,该方法可以提高数据反抓取的效果。本专利技术的另一个目的在于提出一种数据反抓取装置。为达到上述目的,本专利技术第一方面实施例提出的数据反抓取方法,包括:本专利技术第一方面实施例提出的数据反抓取方法,通过在用户信息在黑名单时,生成虚假数据并反馈给访问方,可以避免被抓取用户很快觉察,并且可以对抓取用户造成误导,相对于直接封禁的方式,可以提高数据反抓取的效果。为达到上述目的,本专利技术第二方面实施例提出的数据反抓取装置,包括:本专利技术第二方面实施例提出的数据反抓取装置,通过在用户信息在黑名单时,生成虚假数据并反馈给访问方,可以避免被抓取用户很快觉察,并且可以对抓取用户造成误导,相对于直接封禁的方式,可以提高数据反抓取的效果。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一个 ...
【技术保护点】
一种数据反抓取方法,其特征在于,包括:接收访问方发送的用户请求,所述用户请求中包含用户信息;判断所述用户信息是否在预先生成的黑名单中;如果所述用户信息在所述黑名单中,获取与所述用户信息对应的数据投放策略,并根据所述数据投放策略生成虚假数据,以及,将所述虚假数据反馈给所述访问方。
【技术特征摘要】
1.一种数据反抓取方法,其特征在于,包括:接收访问方发送的用户请求,所述用户请求中包含用户信息;判断所述用户信息是否在预先生成的黑名单中;如果所述用户信息在所述黑名单中,获取与所述用户信息对应的数据投放策略,并根据所述数据投放策略生成虚假数据,以及,将所述虚假数据反馈给所述访问方。2.根据权利要求1所述的方法,其特征在于,在判断所述用户信息是否在预先生成的黑名单中之前,所述方法还包括:判断所述用户信息中是否包括正常访问页面时的用户信息;如果不包括,则根据预先设置的与当前情况对应的数据投放策略,生成当前情况对应的虚假数据,以及,将所述当前情况对应的虚假数据反馈给所述访问方。3.根据权利要求1所述的方法,其特征在于,所述用户信息包括IP地址,在判断所述用户信息是否在预先生成的黑名单中之前,所述方法还包括:判断所述IP地址是否属于预先确定的封禁IP地址;如果属于,则直接拒绝所述用户请求。4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:通过在线分析和/或离线分析识别异常的用户信息并记录在黑名单中,以生成黑名单。5.根据权利要求4所述的方法,其特征在于,通过在线分析识别异常的用户信息并记录在黑名单中,包括:实时获取访问的用户请求的数据流,对所述数据流进行如下项中的至少一项,识别异常的用户信息并记录在黑名单中:获取访问预设页面的用户请求中同一种用户信息的出现次数,将出现次数大于预设值的用户信息,记录在黑名单中;获取翻页请求中包含的数量值,将数量值不为默认值的翻页请求中包含的用户信息,记录在黑名单中;获取用户请求中的IP地址,如果所述IP地址属于国外IP地址,则将所述用户请求中包含的用户信息,记录在黑名单中。6.根据权利要求4所述的方法,其特征在于,通过离线分析识别异常的用户信息并记录在黑名单中,包括:获取预设时间段内的用户请求作为数据样本,对所述数据样本进行如下项中的至少一项,生成黑名单:获取访问预设页面的用户请求中同一种用户信息的出现次数,将出现次数大于预设值的用户信息,记录在黑名单中;将访问时间均匀集中在预设时间段内的用户请求中包含的用户信息,记录在黑名单中;获取IP地址的访问情况,如果访问的对象是均匀的,则记录在黑名单中;根据其他产品线提供的信息识别异常的用户信息并记录在黑名单中;将后续无用户行为的用户请求中的用户信息记录在黑名单中。7.一种数据反抓取...
【专利技术属性】
技术研发人员:刘小春,黄曙光,梁福坤,杜洪先,
申请(专利权)人:北京小度信息科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。