温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种利用云端进行并发采集的爬虫实现方法,包括爬虫端和若干云节点服务端,爬虫端能够定时检查云端的状态,并选择云端进行任务发送;根据云端状态进行实时配置同步;根据云端已下载网页数,择机进行网页收取;通过本地缓存和数据实现异常容错处理...该专利属于山东浪潮云服务信息科技有限公司所有,仅供学习研究参考,未经过山东浪潮云服务信息科技有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种利用云端进行并发采集的爬虫实现方法,包括爬虫端和若干云节点服务端,爬虫端能够定时检查云端的状态,并选择云端进行任务发送;根据云端状态进行实时配置同步;根据云端已下载网页数,择机进行网页收取;通过本地缓存和数据实现异常容错处理...