【技术实现步骤摘要】
本专利技术涉及浏览器
,特别是涉及对网络资源进行抓取及更新消息推送的方法及系统。
技术介绍
随着Web2. 0技术的发展,人们通过互联网进行信息交流的频度和需求不断扩大 (电子邮箱、社交网络、微博、电子商务等),与此同时,新一代互联网已经由传统的信息发布平台,转化为信息推送平台。从应用角度而言,从用户使用浏览器获取信息,转化为浏览器向用户推送信息。即,在传统的方式下,用户需要通过浏览器进入各个网站的页面,然后从众多纷繁复杂的信息中筛选或查找自己需要的信息;但是,在信息推送平台下,浏览器能够为用户推送其需要或者可能需要的信息,减少了用户搜索、刷新网页寻找自己需要信息的工作量,提高了效率。信息推送平台的一种方案是通过浏览器对网络资源的自动监控实现信息的推送。 现有技术中,通常会采用固定的时间间隔对网络资源进行轮询,从而实现对网络资源的监控。例如,假设预先设定的时间间隔为5分钟,则浏览器会每隔五分钟就对所有的目标网站都发起一次访问,并判断与上一次访问时的页面内容相比是否发生更新,如果是,则向用户发出提醒(例如,可以采用消息盒子或弹出消息窗口等方式),换而言之,向 ...
【技术保护点】
1.一种对网络资源进行抓取的方法,其特征在于,包括:在对目标网络资源进行周期性抓取的过程中,收集所述目标网络资源的相关信息;根据所述目标网络资源的相关信息,动态调整所述目标网络资源的抓取时间间隔;根据动态调整的抓取时间间隔对所述目标网络资源进行周期性抓取。
【技术特征摘要】
1.一种对网络资源进行抓取的方法,其特征在于,包括在对目标网络资源进行周期性抓取的过程中,收集所述目标网络资源的相关信息;根据所述目标网络资源的相关信息,动态调整所述目标网络资源的抓取时间间隔;根据动态调整的抓取时间间隔对所述目标网络资源进行周期性抓取。2.根据权利要求1所述的方法,其特征在于,所述收集所述目标网络资源的相关信息包括收集所述目标网络资源的更新情况信息;所述根据所述目标网络资源的相关信息,动态调整所述目标网络资源的抓取时间间隔包括根据目标网络资源的更新情况,动态调整所述目标网络资源的抓取时间间隔。3.根据权利要求2所述的方法,其特征在于,所述根据目标网络资源的更新情况,动态调整所述目标网络资源的抓取时间间隔包括如果所述目标网络资源发生更新或者连续发生更新的次数达到预置阈值,则将所述抓取时间间隔缩短或保持;如果所述目标网络资源未发生更新,或者连续未发生更新的次数达到预置阈值,则将所述抓取时间间隔增长;或者,如果所述目标网络资源发生更新或者连续发生更新的次数达到预置阈值,则将所述抓取时间间隔缩短;如果所述目标网络资源未发生更新,或者连续未发生更新的次数达到预置阈值,则将所述抓取时间间隔增长或保持。4.根据权利要求1所述的方法,其特征在于,所述收集所述目标网络资源的相关信息包括收集用户对所述目标网络资源的关注情况信息;所述根据所述目标网络资源的相关信息,动态调整所述目标网络资源的抓取时间间隔包括根据用户对所述目标网络资源的关注情况,动态调整所述目标网络资源的抓取时间间隔。5.根据权利要求4所述的方法,其特征在于所述收集用户对所述目标网络资源的关注情况信息包括向用户推送关于所述目标网络资源的更新消息,根据用户对所述更新消息的操作行为,确定所述目标网络资源是否被用户关注;所述根据用户对所述目标网络资源的关注情况,动态调整所述目标网络资源的抓取时间间隔包括如果所述目标网络资源的用户关注情况满足预置的缩短条件,则将所述抓取时间间隔缩短;如果所述目标网络资源的用户关注情况满足预置的增长条件,将所述抓取时间间隔增长。6.根据权利要求5所述的方法,其特征在于,所述根据用户对所述目标网络资源的关注情况,动态调整所述目标网络资源的抓取时间间隔包括根据用户对所述目标网络资源的关注情况,对所述目标网络资源的抓取时间间隔进行针对不同用户的个性化动态调整;或者,根据用户对所述目标网络资源的关注情况,对所述目标网络资源的抓取时间间隔进行针对网络中多个用户的通用性动态调整。7.根据权利要求5或6所述的方法,其特征在于,所述如果所述目标网络资源的用户关注情况满足预置的缩短条件,则将所述抓取时间间隔缩短包括如果所述目标网络资源被某用户关注,或连续被该用户关注的次数达到预置阈值,则针对该用户将该目标网络资源的抓取时间间隔缩短;或者,如果所述目标网络资源被网络中的多数用户关注,或连续被网络中的多数用户关注的次数达到预置阈值,则针对网络中多个用户将该目标网络资源的抓取时间间隔缩短;所述如果所述目标网络资源的用户关注情况满足预置的增长条件,将所述抓取时间间隔增长包括如果所述目标网络资源没有被某用户关注,或者连续被该用户关注的次数没有达到预置阈值,则针对该用户将该目标网络资源的抓取时间间隔增长;或者,如果所述目标网络资源只被网络中的少数用户关注,或连续只被网络中的少数用户关注的次数达到预置阈值,则将针对网络中多个用户将该目标网络资源的抓取时间间隔缩短增长。8.根据权利要求3、5或6所述的方法,其特征在于,所述将所述抓取时间间隔缩短包括将所述抓取时间间隔除以预置的大于一的系数; 或者乘以预置的小于一的系数;或者,将所述抓取时间间隔减去预置的大于零的步进值; 或者,将所述抓取时间间隔回退到抓取时间间隔的初始值;或者,如果当前的抓取时间间隔大于抓取时间间隔的初始值,则回退到抓取时间间隔的初始值;否则,将所述抓取时间间隔除以预置的大于一的系数,或,乘以预置的小于一的系数,或,将所述抓取时间间隔减去预置的大于零的步进值;所述将所述抓取时间间隔增长包括将所述抓取时间间隔乘以预置的大于一的系数, 或者除以小于一的系数;或者,将所述抓取时间间隔加上预置的大于零的步进值;或者,将所述抓取时间间隔增长到抓取时间间隔的初始值;或者,如果当前的抓取时间间隔小于抓取时间间隔的初始值,则增长到抓取时间间隔的初始值;否则,将所述抓取时间间隔除以乘以预置的大于一的系数,或,除以预置的小于一的系数,或,将所述抓取时间间隔加上预置的大于零的步进值。9.一种对网络资源的更新消息进行推送的方法,其特征在于,包括在周期性获取目标网络资源更新消息的过程中,收集所述目标网络资源的相关信息;根据所述目标网络资源的相关信息,动态调整所述目标网络资源的更新消息推送时间间隔;根据所述动态调整的更新消息推送时间间隔,向用户推送关于所述目标网络资源的更新消息。10.根据权利要求9所述的方法,其特征在于,所述收集所述目标网络资源的相关信息包括收集所述目标网络资源的更新情况信息;所述根据所述目标网络资源的相关信息,动态调整所述目标网络资源的更新消息推送时间间隔包括根据目标网络资源的更新情况,动态调整所述目标网络资源的更新消息推送时间间隔。11.根据权利要求10所述的方法,其特征在于所述根据目标网络资源的更新情况,动态调整所述目标网络资源的更新消息推送时间间隔包括如果所述目标网络资源未发生更新,或者连续未发生更新的次数达到预置阈值, 则将所述更新消息推送时间间隔增长。12.根据权利要求9所述的方法,其特征在于,所述收集所述目标网络资源的相关信息包括收集用户对所述目标网络资源的关注情况信息;所述根据所述目标网络资源的相关信息,动态调整所述目标网络资源的更新消息推送时间间隔包括根据用户对所述目标网络资源的关...
【专利技术属性】
技术研发人员:李俊强,任斌,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。