设置率确定方法和装置制造方法及图纸

技术编号:15690895 阅读:238 留言:0更新日期:2017-06-24 03:39
本申请公开了一种设置率确定方法和装置。其中,该方法包括:对目标网站的访问日志进行解析,确定出目标网站中被访问的网页;从被访问的网页中识别出目标网页,统计出第一网页数量;对被访问的网页中除目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,第二网页数量为存在返回首页链接的网页的数量;以及根据被访问的网页的网页总数、第一网页数量以及第二网页数量计算得到目标网站上的返回首页链接的设置率。本申请解决了现有技术中通过人工方式来确定网页上是否设置了返回首页链接,导致计算返回首页链接设置率的效率低且工作量大的技术问题。

Setting rate determining method and apparatus

The present invention discloses a setting rate determining method and device. Among them, the method includes: the access log of the target site analysis, determined by access to the target web pages; recognize the target page from the accessed page, the statistics analysis of the first page number; other pages in the target outside of a web page is accessed in the web page source code, the statistics of second the number of web pages, the page number is second, the number of web pages is to return to the home page of the link; and the calculated rate of return set back to the home page link target sites on the web page, depending on the total number of the accessed first the number of web pages and second page number. The present invention solves the technical problems of low efficiency and heavy workload in the prior art to determine whether or not the page has been returned to the home page by manual means, thereby causing the calculation of the setting rate of the returned home page link.

【技术实现步骤摘要】
设置率确定方法和装置
本申请涉及互联网领域,具体而言,涉及一种设置率确定方法和装置。
技术介绍
在互联网领域,为了提高网站的导航效果,通常会在网站中的网页上设置返回首页链接,用户在浏览网站的过程中可以直接通过该链接返回到网站的首页。网站返回首页链接设置率指的是网站中设置返回首页链接的网页占全部网页的比值。返回首页链接设置率这一指标在很大程度上反应了网站的用户体验情况,也是评价网站绩效的一项重要指标。目前,通常是通过人工搜索的方式来确定网页上是否设置了返回首页链接。具体地,通过人工登陆访问网站,查看该网站的网页上是否设置了返回首页链接,进而统计设置了返回首页链接的网页数,计算返回首页链接设置率。然而,这种通过人工方式来确定网页上是否设置了返回首页链接,导致计算返回首页链接设置率的效率低且工作量大。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种设置率确定方法和装置,以至少解决现有技术中通过人工方式来确定网页上是否设置了返回首页链接,导致计算返回首页链接设置率的效率低且工作量大的技术问题。根据本申请实施例的一个方面,提供了一种设置率确定方法,包括:对目标网站的访问日志进行解析,确定出所述目标网站中被访问的网页;从所述被访问的网页中识别出目标网页,统计出第一网页数量,其中,所述第一网页数量为所述目标网页的数量,所述目标网页为所述被访问的网页中设置有返回首页链接的网页;对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,所述第二网页数量为存在返回首页链接的网页的数量;以及根据所述被访问的网页的网页总数、所述第一网页数量以及所述第二网页数量计算得到所述目标网站上的所述返回首页链接的设置率。进一步地,对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析包括:通过爬虫程序爬取所述被访问的网页中除所述目标网页之外的其他网页;从所述被访问的网页中除所述目标网页之外的其他网页中查询所述返回首页链接。进一步地,从所述被访问的网页中识别出目标网页包括:从所述目标网站的访问日志中查询出目标访问日志,其中,所述目标访问日志为访问所述目标网站的首页页面的日志;对所述目标访问日志进行解析,提取出访问所述目标网站的首页页面的访问来源;判断所述访问来源的网页是否为所述目标网站中除所述首页页面之外的其他网页;在所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页时,确定所述访问来源的网页为所述目标网页。进一步地,判断所述访问来源的网页是否为所述目标网站中除所述首页页面之外的其他网页包括:判断所述访问来源的网页的统一资源定位符中包含的域名是否与所述目标网站的域名相同;在所述访问来源的网页的统一资源定位符中包含的域名与所述目标网站的域名相同时,确定所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页。进一步地,对所述目标访问日志进行解析,提取出访问所述目标网站的首页页面的访问来源包括:从所述目标访问日志中解析出目标字段,其中,所述目标字段为记录有上一跳网页的统一资源定位符的字段。根据本申请实施例的另一方面,还提供了一种设置率确定装置,包括:确定单元,用于对目标网站的访问日志进行解析,确定出所述目标网站中被访问的网页;第一统计单元,用于从所述被访问的网页中识别出目标网页,统计出第一网页数量,其中,所述第一网页数量为所述目标网页的数量,所述目标网页为所述被访问的网页中设置有返回首页链接的网页;第二统计单元,用于对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,所述第二网页数量为存在返回首页链接的网页的数量;以及计算单元,用于根据所述被访问的网页的网页总数、所述第一网页数量以及所述第二网页数量计算得到所述目标网站上的所述返回首页链接的设置率。进一步地,所述第二统计单元包括:爬取模块,用于通过爬虫程序爬取所述被访问的网页中除所述目标网页之外的其他网页;第一查询模块,用于从所述被访问的网页中除所述目标网页之外的其他网页中查询所述返回首页链接。进一步地,所述第一统计单元包括:第二查询模块,用于从所述目标网站的访问日志中查询出目标访问日志,其中,所述目标访问日志为访问所述目标网站的首页页面的日志;提取模块,用于对所述目标访问日志进行解析,提取出访问所述目标网站的首页页面的访问来源;判断模块,用于判断所述访问来源的网页是否为所述目标网站中除所述首页页面之外的其他网页;确定模块,用于在所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页时,确定所述访问来源的网页为所述目标网页。进一步地,所述判断模块包括:判断子模块,用于判断所述访问来源的网页的统一资源定位符中包含的域名是否与所述目标网站的域名相同;确定子模块,用于在所述访问来源的网页的统一资源定位符中包含的域名与所述目标网站的域名相同时,确定所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页。进一步地,所述提取模块具体用于从所述目标访问日志中解析出目标字段,其中,所述目标字段为记录有上一跳网页的统一资源定位符的字段。根据本申请实施例,对目标网站的访问日志进行解析,确定出目标网站中被访问的网页,从被访问的网页中识别出目标网页,统计出第一网页数量,其中,第一网页数量为目标网页的数量,目标网页为被访问的网页中设置有返回首页链接的网页,对被访问的网页中除目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,第二网页数量为存在返回首页链接的网页的数量,根据被访问的网页的网页总数、第一网页数量以及第二网页数量计算得到目标网站上的返回首页链接的设置率,通过从被访问的网页中识别出目标网页以及对网页的源代码进行解析,确定出存在返回首页链接的网页,并分别统计这两类网页的数量,从而计算出目标网站的返回首页链接的设置率,相对于现有技术中通过人工打开网页查看网页并进行统计的方式,提高了效率,降低了工作量,解决了现有技术中通过人工方式来确定网页上是否设置了返回首页链接,导致计算返回首页链接设置率的效率低且工作量大的技术问题。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的设置率确定方法的流程图;图2是根据本申请实施例的设置率确定装置的示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤本文档来自技高网
...
设置率确定方法和装置

【技术保护点】
一种设置率确定方法,其特征在于,包括:对目标网站的访问日志进行解析,确定出所述目标网站中被访问的网页;从所述被访问的网页中识别出目标网页,统计出第一网页数量,其中,所述第一网页数量为所述目标网页的数量,所述目标网页为所述被访问的网页中设置有返回首页链接的网页;对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,所述第二网页数量为存在返回首页链接的网页的数量;以及根据所述被访问的网页的网页总数、所述第一网页数量以及所述第二网页数量计算得到所述目标网站上的所述返回首页链接的设置率。

【技术特征摘要】
1.一种设置率确定方法,其特征在于,包括:对目标网站的访问日志进行解析,确定出所述目标网站中被访问的网页;从所述被访问的网页中识别出目标网页,统计出第一网页数量,其中,所述第一网页数量为所述目标网页的数量,所述目标网页为所述被访问的网页中设置有返回首页链接的网页;对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,所述第二网页数量为存在返回首页链接的网页的数量;以及根据所述被访问的网页的网页总数、所述第一网页数量以及所述第二网页数量计算得到所述目标网站上的所述返回首页链接的设置率。2.根据权利要求1所述的方法,其特征在于,对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析包括:通过爬虫程序爬取所述被访问的网页中除所述目标网页之外的其他网页;从所述被访问的网页中除所述目标网页之外的其他网页中查询所述返回首页链接。3.根据权利要求1所述的方法,其特征在于,从所述被访问的网页中识别出目标网页包括:从所述目标网站的访问日志中查询出目标访问日志,其中,所述目标访问日志为访问所述目标网站的首页页面的日志;对所述目标访问日志进行解析,提取出访问所述目标网站的首页页面的访问来源;判断所述访问来源的网页是否为所述目标网站中除所述首页页面之外的其他网页;在所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页时,确定所述访问来源的网页为所述目标网页。4.根据权利要求3所述的方法,其特征在于,判断所述访问来源的网页是否为所述目标网站中除所述首页页面之外的其他网页包括:判断所述访问来源的网页的统一资源定位符中包含的域名是否与所述目标网站的域名相同;在所述访问来源的网页的统一资源定位符中包含的域名与所述目标网站的域名相同时,确定所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页。5.根据权利要求4所述的方法,其特征在于,对所述目标访问日志进行解析,提取出访问所述目标网站的首页页面的访问来源包括:从所述目标访问日志中解析出目标字段,其中,所述目标字段为记录有上一跳网页的统一资源定位符的字段。6....

【专利技术属性】
技术研发人员:李新国崔维福吴茜
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1