The invention discloses a network information capture method, and the method comprises the following steps: the server receives messages sent via HTTP to grab the requesting user from the network server; grasping with the capture request corresponding information; determining the information processing strategies including the server according to the request information corresponding to the capture image information. The technical proposal provided by the invention has the advantages of high safety.
【技术实现步骤摘要】
网上信息抓取方法及系统
本专利技术涉及数据处理领域,尤其涉及一种网上信息抓取方法及系统。
技术介绍
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。网络爬虫实际是一种网络信息抓取的应用程序,现有的网络爬虫无法依据抓取的信息判断其处理策略,导致现有的网络爬虫可能使得用户侵犯别人的权利,安全性低。
技术实现思路
本申请提供一种网上信息抓取方法。其解决现有技术的技术方案侵犯别人的权利,安全性低的缺点。一方面,提供一种网上信息抓取方法,所述方法包括如下步骤:网上信息抓取方法,所述方法包括如下步骤:服务器接收用户通过HTTP发送的信息抓取请求;服务器从网络中抓取与该抓取请求对应的信息;服务器依据该抓取请求对应的信息内包含的图片信息确定该信息的处理策略。可选的,所述方法还包括:服务器如所述信息包含图片信息,则将该信息存储,如所述信息不包含图片信息,则将该信息分享。可选的,所述方法还包括:服务器通过社交软件或即时通信软件对所述信 ...
【技术保护点】
一种网上信息抓取方法,其特征在于,所述方法包括如下步骤:服务器接收用户通过HTTP发送的信息抓取请求;服务器从网络中抓取与该抓取请求对应的信息;服务器依据该抓取请求对应的信息内包含的图片信息确定该信息的处理策略。
【技术特征摘要】
1.一种网上信息抓取方法,其特征在于,所述方法包括如下步骤:服务器接收用户通过HTTP发送的信息抓取请求;服务器从网络中抓取与该抓取请求对应的信息;服务器依据该抓取请求对应的信息内包含的图片信息确定该信息的处理策略。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:服务器如所述信息包含图片信息,则将该信息存储,如所述信息不包含图片信息,则将该信息分享。3.根据权要求2所述的方法,其特征在于,所述方法还包括:服务器通过社交软件或即时通信软件对所述信息分享。4.一种网上信息抓取系统,其特征在于,所述系统包括:获取单元,用于接收用户通过HTTP发送的信息抓取请求;处理单元,用于从网络中抓取与该抓取请求对应的信息;依据该抓取请求对应的信息内包含的图片信息确定该信息的处理策略。5.根据权利要求4所述的系统,其特征在于,所述系统还包括:处理...
【专利技术属性】
技术研发人员:马岩,
申请(专利权)人:深圳市博信诺达经贸咨询有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。