The invention discloses a method for obtaining IP information, according to the IP request to determine the first predetermined rules, if you do not meet the first predetermined rules, will re obtain IP information, so that users in the set after you do not need to request information management access to IP is available, but does not meet the requirements, will be re get IP address. The whole process does not need to be processed by human judgment, so the operation is flexible and convenient, no artificial addition algorithm is needed, and simple and efficient use is used. The embodiment of the invention also provides a device for obtaining IP, which can also achieve the above technical effect.
【技术实现步骤摘要】
一种获取IP的方法及装置
本专利技术涉及代理IP
,更具体地说,涉及一种获取IP的方法及装置。
技术介绍
随着互联网技术的飞速发展,大数据时代已经到来,数据采集成为至关重要的环节。在获取大量数据过程中,会使用网络爬虫技术抓取网站信息。通常,网站的反爬虫机制都是依据IP来标识爬虫的,在网络爬虫抓取信息的过程中,如果一个IP抓取频率高过了网站的设置阀值,将会被禁止访问。通过代理IP访问网站进行数据采集,可以有效的应对反爬虫机制。目前市面上的IP代理服务十分单一,没有精细化的控制,只是简单的提供ADSL拨号获取IP,当获取到的IP不符合需求时只能人为的重新获取,因此目前的代理服务不够灵活。因此,如何简单、灵活的得到合适的代理IP,是本领域技术人员需要解决的问题。
技术实现思路
本专利技术的目的在于提供一种获取IP地址的方法和装置,以简单、灵活的得到合适的代理IP。为实现上述目的,本专利技术实施例提供了如下技术方案:一种获取IP的方法,包括:S101,利用IP请求信息获取代理IP地址;S102,判断代理IP地址是否符合利用所述IP请求信息确定的第一预设规则;若是,则执行S103,若否,则执行S104;S103,返回代理IP地址;S104,重新获取代理IP地址,返回S102。其中,包括:利用所述IP请求信息判断是否向缓存中请求获取代理IP地址;若是,则在所述IP请求信息中获取序列号,利用所述序列号在所述缓存中获取代理IP地址,并判断代理IP地址是否为空,为空则利用第二预设规则从可用代理IP池中获取代理IP地址;若否,则利用第二预设规则从所述可用代理IP池中获取代理 ...
【技术保护点】
一种获取IP的方法,其特征在于,包括:S101,利用IP请求信息获取代理IP地址;S102,判断代理IP地址是否符合利用所述IP请求信息确定的第一预设规则;若是,则执行S103,若否,则执行S104;S103,返回代理IP地址;S104,重新获取代理IP地址,返回S102。
【技术特征摘要】
1.一种获取IP的方法,其特征在于,包括:S101,利用IP请求信息获取代理IP地址;S102,判断代理IP地址是否符合利用所述IP请求信息确定的第一预设规则;若是,则执行S103,若否,则执行S104;S103,返回代理IP地址;S104,重新获取代理IP地址,返回S102。2.根据权利要求1所述的方法,其特征在于,所述S101,包括:利用所述IP请求信息判断是否向缓存中请求获取代理IP地址;若是,则在所述IP请求信息中获取序列号,利用所述序列号在所述缓存中获取代理IP地址,并判断代理IP地址是否为空,为空则利用第二预设规则从可用代理IP池中获取代理IP地址;若否,则利用第二预设规则从所述可用代理IP池中获取代理IP地址。3.根据权利要求2所述的方法,其特征在于,所述利用第二预设规则从所述可用代理IP池中获取代理IP地址,包括:根据所述IP请求信息确定数据源和所述数据源的最少可用IP地址数;判断所述可用代理IP池中所述数据源的代理IP地址数是否大于所述最少可用IP地址数;若是,则利用第二预设规则从所述可用代理IP池中获取所述数据源的代理IP地址;若否,则利用代理IP地址数与所述最少可用IP地址数的差值确定需借IP地址数;在所述可用代理IP池中确定所述需借IP地址数个的其他数据源的借出代理IP地址,并将所述借出代理IP地址进行拨号处理,以使所述借出代理IP地址成为所述数据源的代理IP地址。4.根据权利要求2所述的方法,其特征在于,所述S102,包括:判断代理IP地址的并发线程数是否小于所述IP请求信息中预设的并发线程数;若是,则执行S103,若否,则执行S104...
【专利技术属性】
技术研发人员:王能,李界鹏,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。