当前位置: 首页 > 专利查询>马岩专利>正文

网络信息的抓取方法及系统技术方案

技术编号:14844793 阅读:98 留言:0更新日期:2017-03-17 11:37
本发明专利技术公开了一种网络信息的抓取方法及系统,所述方法包括如下步骤:获取用户点击进入网页的进入时间和出入时间;如该出入时间与进入时间的时间差大于时间阈值时,对该网页的类型进行抓取;将抓取的网页类型以及用户的标识发送给后台服务器。本发明专利技术提供的技术方案具有网络信息抓取准确的优点。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及互联网领域,尤其涉及一种网络信息的抓取方法及系统。
技术介绍
网络是由节点和连线构成,表示诸多对象及其相互联系。在数学上,网络是一种图,一般认为专指加权图。网络除了数学定义外,还有具体的物理含义,即网络是从某种相同类型的实际问题中抽象出来的模型。在计算机领域中,网络是信息传输、接收、共享的虚拟平台,通过它把各个点、面、体的信息联系到一起,从而实现这些资源的共享,网络是人类发展史来最重要的专利技术,提高了科技和人类社会的发展。现有的网络信息是海量的,而每个用户又是特定的人物,所以对于此种情况来说,网络信息的抓取非常重要,现有的网络信息的抓取没有任何的筛选,所以其网络信息抓取的效果不好。
技术实现思路
本申请提供一种网络信息的抓取方法。其解决现有技术的技术方案网络信息抓取的效果不好的缺点。一方面,提供一种网络信息的抓取方法,所述方法包括如下步骤:获取用户点击进入网页的进入时间和出入时间;如该出入时间与进入时间的时间差大于时间阈值时,对该网页的类型进行抓取;将抓取的网页类型以及用户的标识发送给后台服务器。可选的,所述方法还包括:如该时间差小于时间阈值,不对该网络的类型进行抓取。可选的,所述方法还包括:如该网页的点击次数超过次数阈值,则对该网络的类型进行抓取。第二方面,提供一种网络信息的抓取系统,所述系统包括:获取单元,用于获取用户点击进入网页的进入时间和出入时间;抓取单元,用于如该出入时间与进入时间的时间差大于时间阈值时,对该网页的类型进行抓取;发送单元,用于将抓取的网页类型以及用户的标识发送给后台服务器。可选的,所述系统还包括:放弃单元,用于如该时间差小于时间阈值,不对该网络的类型进行抓取。可选的,所述抓取单元,还用于如该网页的点击次数超过次数阈值,则对该网络的类型进行抓取。本专利技术提供的技术方案能够依据用户点击网页的时间来确定是否抓取用户的网络信息,其对网络信息的筛选具有积极的作用,所以其具有网络信息抓取效果好的优点。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术第一较佳实施方式提供的一种网络信息的抓取方法的流程图;图2为本专利技术第二较佳实施方式提供的一种网络信息的抓取系统的结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1是本专利技术第一较佳实施方式提出的一种网络信息的抓取方法,该方法如图1所示,包括如下步骤:步骤S101、获取用户点击进入网页的进入时间和出入时间;步骤S102、如该出入时间与进入时间的时间差大于时间阈值时,对该网页的类型进行抓取;步骤S103、将抓取的网页类型以及用户的标识发送给后台服务器。本专利技术提供的技术方案能够依据用户点击网页的时间来确定是否抓取用户的网络信息,其对网络信息的筛选具有积极的作用,所以其具有网络信息抓取效果好的优点。可选的,上述方法在步骤S103之后还可以包括:如该时间差小于时间阈值,不对该网络的类型进行抓取。可选的,上述方法在步骤S103之后还可以包括:如该网页的点击次数超过次数阈值,则对该网络的类型进行抓取。请参考图2,图2是本专利技术第二较佳实施方式提出的一种网络信息的抓取系统,该系统如图2所示,包括:获取单元201,用于获取用户点击进入网页的进入时间和出入时间;抓取单元202,用于如该出入时间与进入时间的时间差大于时间阈值时,对该网页的类型进行抓取;发送单元203,用于将抓取的网页类型以及用户的标识发送给后台服务器。本专利技术提供的技术方案能够依据用户点击网页的时间来确定是否抓取用户的网络信息,其对网络信息的筛选具有积极的作用,所以其具有网络信息抓取效果好的优点。可选的,上述系统还可以包括:放弃单元204,用于如该时间差小于时间阈值,不对该网络的类型进行抓取。可选的,上述抓取单元202,还用于如该网页的点击次数超过次数阈值,则对该网络的类型进行抓取。需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本专利技术并不受所描述的动作顺序的限制,因为依据本专利技术,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本专利技术所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(英文:Read-OnlyMemory,简称:ROM)、随机存取器(英文:RandomAccessMemory,简称:RAM)、磁盘或光盘等。以上对本专利技术实施例所提供的内容下载方法及相关设备、系统进行了详细介绍,本文中应用了具体个例对本专利技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本专利技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本专利技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本专利技术的限制。本文档来自技高网...

【技术保护点】
一种网络信息的抓取方法,其特征在于,所述方法包括如下步骤:获取用户点击进入网页的进入时间和出入时间;如该出入时间与进入时间的时间差大于时间阈值时,对该网页的类型进行抓取;将抓取的网页类型以及用户的标识发送给后台服务器。

【技术特征摘要】
【国外来华专利技术】1.一种网络信息的抓取方法,其特征在于,所述方法包括如下步骤:
获取用户点击进入网页的进入时间和出入时间;
如该出入时间与进入时间的时间差大于时间阈值时,对该网页的类型进行
抓取;
将抓取的网页类型以及用户的标识发送给后台服务器。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如该时间差小于时间阈值,不对该网络的类型进行抓取。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如该网页的点击次数超过次数阈值,则对该网络的类型进行抓取。
4.一种网络信息的抓取系统,其...

【专利技术属性】
技术研发人员:马岩
申请(专利权)人:马岩
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1