网页内容更新速度对比方法和装置制造方法及图纸

技术编号:14287189 阅读:37 留言:0更新日期:2016-12-25 17:46
本发明专利技术涉及一种网页内容更新速度对比方法,包括以下步骤:获取待对比关键字;循环向各个目标网站请求所述关键字对应的搜索结果网页;分目标网站提取本次循环请求到的搜索结果网页相对于上一次循环请求到的搜索结果网页更新的所述关键字对应的内容条目;若提取到更新的内容条目,则以本次循环处理时间作为该内容条目的更新时间,记录相应目标网站、所述关键字、该内容条目以及该更新时间的对应关系;对比目标网站之间更新所述关键字对应的相同内容条目的更新时间;根据对比结果生成目标网站之间更新所述关键字对应的相同内容条目的更新差异数据。上述网页内容更新速度对比方法,可以获得准确的对比结果。此外,还提供一种网页内容更新速度对比装置。

【技术实现步骤摘要】

本专利技术涉及网络
,特别是涉及一种网页内容更新速度对比方法和装置
技术介绍
随着网络技术以及移动终端技术的发展,各种网络服务应用为人们提供多样的网络服务,例如,视频网站提供视频观看服务,小说网站提供小说浏览服务,新闻网站则提供时事新闻阅览服务,等等。网络服务的推出时间至关重要,关系到用户体验,从而影响到网站的用户拥有量。例如,用户往往更加青睐于第一时间更新电视剧剧集的视频网站、第一时间更新小说章节的小说网站、以及第一时间公布时事新闻的新闻网站等等。网站之间激烈的竞争决定了各个网站需要评估自己网站与竞争对手更新网络服务内容的速度差异,以便根据该速度差异做出相关决策,例如,提升自身应用服务性能等;另外,用户也存在知道该速度差异的需求,以方便用户去网络服务内容更新速度更快的网站享受相应的服务。传统的方法一般通过提取网页内容中明确指出的发布时间来确定网页内容的更新时间,而由于该发布时间由网站人员进行人工设置,因此存在不准确的风险,从而导致网页内容更新速度对比结果的不准确性。
技术实现思路
基于此,有必要提供一种可获得准确对比结果的网页内容更新速度对比方法和装置。一种网页内容更新速度对比方法,包括以下步骤:获取待对比关键字;循环向各个目标网站请求所述关键字对应的搜索结果网页;分目标网站提取本次循环请求到的搜索结果网页相对于上一次循环请求到
的搜索结果网页更新的所述关键字对应的内容条目;若提取到更新的内容条目,则以本次循环处理时间作为该内容条目的更新时间,记录相应目标网站、所述关键字、该内容条目以及该更新时间的对应关系;对比目标网站之间更新所述关键字对应的相同内容条目的更新时间;根据对比结果生成目标网站之间更新所述关键字对应的相同内容条目的更新差异数据。一种网页内容更新速度对比装置,包括对比关键字获取模块,用于获取待对比关键字;关键字搜索网页请求模块,用于循环向各个目标网站请求所述关键字对应的搜索结果网页;更新内容条目提取模块,用于分目标网站提取所述关键字搜索网页请求模块本次循环请求到的搜索结果网页相对于所述更新内容条目提取模块上一次循环请求到的搜索结果网页更新的所述关键字对应的内容条目;记录模块,用于若提取到更新的内容条目,则以本次循环处理时间作为该内容条目的更新时间,记录相应目标网站、所述关键字、该内容条目以及该更新时间的对应关系;更新时间对比模块,用于对比目标网站之间更新所述关键字对应的相同内容条目的更新时间;更新差异数据生成模块,用于根据对比结果生成目标网站之间更新所述关键字对应的相同内容条目的更新差异数据。上述网页内容更新速度对比方法和装置,循环向各个目标网站请求关键字对应的搜索结果网页,并提取搜索结果网页更新的内容条目,从而可监测到目标网站是否更新了内容条目以及更新了哪些内容条目,上述方法和装置将本次循环处理时间作为更新的内容条目的更新时间,该时间实际相当于该更新的内容条目被监测到的时间,由于上述方法和装置循环向各个目标网站请求关键字
对应的搜索结果网页,因此上述方法和装置监测到更新的内容条目的时间非常近似于该更新的内容条目实际发布的时间,该实际发布的时间相当于实际更新的时间,因此,上述方法和装置可以准确地获取到内容条目的更新时间,并根据准确的更新时间来对比目标网站之间网页内容的更新速度,从而可以获得准确的对比结果。附图说明图1为一个实施例中可运行本申请的网页内容更新速度对比方法的终端或服务器的部分结构框图;图2为一个实施例中的网页内容更新速度对比方法的流程示意图;图3为一个实施例中设置存储待对比关键字的过程的流程示意图;图4为一个实施例中图2中的步骤S206的流程示意图;图5为一个实施例中的网页内容更新速度对比方法的流程示意图;图6为一个实施例中的网页内容更新速度对比装置的结构示意图;图7为一个实施例中的网页内容更新速度对比装置的结构示意图;图8为一个实施例中更新内容条目提取模块的结构示意图;图9为一个实施例中的网页内容更新速度对比装置的结构示意图;图10为一个实施例中的网页内容更新速度对比装置的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。图1为一个实施例中可运行本申请的网页内容更新速度对比方法的终端或服务器的部分结构框图。如图1所示,在一个实施例中,该服务器包括通过系统总线连接的处理器、存储介质、内存和网络接口;其中,网络接口用于与网络进行通信,内存用于缓存数据,存储介质中存储有操作系统、数据库以及用于实现本申请所述的网页内容更新速度对比方法的软件指令;数据库可用于存储
待对比关键字等本申请所述的网页内容更新速度对比方法所需要数据的或者中间处理过程产生的数据;处理器协调各部件的工作并执行这些指令以实现本申请所述的网页内容更新速度对比方法。本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的终端或服务器的限定,具体的终端或服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。如图2所示,在一个实施例中,一种网页内容更新速度对比方法,包括以下步骤:步骤S202,获取待对比关键字。在一个实施例中,待对比关键字的数量可包括一个或多个。当待对比关键字的数量包括多个时,可分别对每一个待对比关键字进行如下步骤S204至步骤S212所述的处理过程。下述过程中涉及到将两个内容条目进行比较时,指的是将同一关键字对应的内容条目进行比较。在一个实施例中,待对比关键字可被预先进行设置并进行存储。在一个实施例中,可搜索指定领域或指定类别热度超过阈值的关键字作为待对比关键字。例如,可搜索视频类别热度超过阈值的视频名作为待对比关键字,其中,视频名可对应但不限于电视剧名称或电影名称等。在另一个实施例中,可获取指定网络排行榜中排行在前预设位的关键字作为待对比关键字。例如,可搜索音乐排行榜排行在前预设位音乐名称作为待对比关键字,等等。在一个实施例中,在步骤202之前,上述网页内容更新速度对比方法还包括设置存储待对比关键字的过程;如图3所示,在一个实施例中,该过程包括以下步骤:步骤S302,获取预设的网页内容分类类别。在一个实施例中,网页内容分类类别包括但不限于视频、小说、音乐、新闻等。步骤S304,向各个目标网站请求网页内容。在一个实施例中,目标网站的URL信息可被预先设置并进行存储。在一个实施例中,可向各个目标网站请求网站首页的网页内容。具体的,可向各个目标网站发送包含网站首页的URL地址的网页拉取请求,并接收各个目标网站返回的首页对应的源代码。步骤S306,爬取各个目标网站的网页内容中各个类别对应的关键字。在一个实施例中,可从各个目标网站的首页源代码中提取各个类别对应的网页URL地址。进一步的,可向目标网站发送包含类别对应的网页URL地址的网页拉取请求,并接收目标网站返回的类别对应的网页源代码。该过程相当于用户打开目标网站的首页,进一步在首页点击类别对应的链接,从而浏览器接收到目标网站返回的类别对应的网页源代码。在一个实施例中,可在源代码中提取本文档来自技高网
...
网页内容更新速度对比方法和装置

【技术保护点】
一种网页内容更新速度对比方法,包括以下步骤:获取待对比关键字;循环向各个目标网站请求所述关键字对应的搜索结果网页;分目标网站提取本次循环请求到的搜索结果网页相对于上一次循环请求到的搜索结果网页更新的所述关键字对应的内容条目;若提取到更新的内容条目,则以本次循环处理时间作为该内容条目的更新时间,记录相应目标网站、所述关键字、该内容条目以及该更新时间的对应关系;对比目标网站之间更新所述关键字对应的相同内容条目的更新时间;根据对比结果生成目标网站之间更新所述关键字对应的相同内容条目的更新差异数据。

【技术特征摘要】
1.一种网页内容更新速度对比方法,包括以下步骤:获取待对比关键字;循环向各个目标网站请求所述关键字对应的搜索结果网页;分目标网站提取本次循环请求到的搜索结果网页相对于上一次循环请求到的搜索结果网页更新的所述关键字对应的内容条目;若提取到更新的内容条目,则以本次循环处理时间作为该内容条目的更新时间,记录相应目标网站、所述关键字、该内容条目以及该更新时间的对应关系;对比目标网站之间更新所述关键字对应的相同内容条目的更新时间;根据对比结果生成目标网站之间更新所述关键字对应的相同内容条目的更新差异数据。2.根据权利要求1所述的网页内容更新速度对比方法,其特征在于,所述获取待对比关键字的步骤包括:获取预设的网页内容分类类别;向各个目标网站请求网页内容;爬取各个目标网站的网页内容中各个类别对应的关键字;在提取到的关键字中过滤重复的关键字;将过滤后剩余的关键字存储为待对比关键字。3.根据权利要求1所述的网页内容更新速度对比方法,其特征在于,所述循环向各个目标网站请求所述关键字对应的搜索结果网页的步骤包括:每间隔预设时长向各个目标网站请求所述关键字对应的搜索结果网页,所述预设时长不超过阈值。4.根据权利要求1所述的网页内容更新速度对比方法,其特征在于,所述分目标网站提取本次循环流程请求到的搜索结果网页相对于上一次循环流程请求到的搜索结果网页更新的所述关键字对应的内容条目的步骤包括:提取本次循环请求到的各个搜索结果网页中所述关键字对应的最新的内容条目;分目标网站比较提取到的最新的内容条目与最近记录的内容条目是否相
\t同;获取与最近记录的内容条目不同的所述提取到的最新的内容条目作为相应目标网站的所述更新的内容条目。5.根据权利要求1至4任一所述的网页内容更新速度对比方法,其特征在于,还包括以下步骤:提取所述内容条目的特征标识;在记录内容条目以及比较内容条目的步骤中,以内容条目的特征标识为准进行记录及比较。6.一种网页内容更新速度对比装置,其特征在于,包括对比关键字获取模块,用于获取待对比关键字;关键字搜索网页请求模块,用于循环向各个...

【专利技术属性】
技术研发人员:赵田
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1