The present invention discloses a setting rate determining method and device. Among them, the method includes: the access log of the target site analysis, determined by access to the target web pages; recognize the target page from the accessed page, the statistics analysis of the first page number; other pages in the target outside of a web page is accessed in the web page source code, the statistics of second the number of web pages, the page number is second, the number of web pages is to return to the home page of the link; and the calculated rate of return set back to the home page link target sites on the web page, depending on the total number of the accessed first the number of web pages and second page number. The present invention solves the technical problems of low efficiency and heavy workload in the prior art to determine whether or not the page has been returned to the home page by manual means, thereby causing the calculation of the setting rate of the returned home page link.
【技术实现步骤摘要】
设置率确定方法和装置
本申请涉及互联网领域,具体而言,涉及一种设置率确定方法和装置。
技术介绍
在互联网领域,为了提高网站的导航效果,通常会在网站中的网页上设置返回首页链接,用户在浏览网站的过程中可以直接通过该链接返回到网站的首页。网站返回首页链接设置率指的是网站中设置返回首页链接的网页占全部网页的比值。返回首页链接设置率这一指标在很大程度上反应了网站的用户体验情况,也是评价网站绩效的一项重要指标。目前,通常是通过人工搜索的方式来确定网页上是否设置了返回首页链接。具体地,通过人工登陆访问网站,查看该网站的网页上是否设置了返回首页链接,进而统计设置了返回首页链接的网页数,计算返回首页链接设置率。然而,这种通过人工方式来确定网页上是否设置了返回首页链接,导致计算返回首页链接设置率的效率低且工作量大。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种设置率确定方法和装置,以至少解决现有技术中通过人工方式来确定网页上是否设置了返回首页链接,导致计算返回首页链接设置率的效率低且工作量大的技术问题。根据本申请实施例的一个方面,提供了一种设置率确定方法,包括:对目标网站的访问日志进行解析,确定出所述目标网站中被访问的网页;从所述被访问的网页中识别出目标网页,统计出第一网页数量,其中,所述第一网页数量为所述目标网页的数量,所述目标网页为所述被访问的网页中设置有返回首页链接的网页;对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,所述第二网页数量为存在返回首页链接的网页的数量;以及根据所述被访问的网页的网 ...
【技术保护点】
一种设置率确定方法,其特征在于,包括:对目标网站的访问日志进行解析,确定出所述目标网站中被访问的网页;从所述被访问的网页中识别出目标网页,统计出第一网页数量,其中,所述第一网页数量为所述目标网页的数量,所述目标网页为所述被访问的网页中设置有返回首页链接的网页;对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,所述第二网页数量为存在返回首页链接的网页的数量;以及根据所述被访问的网页的网页总数、所述第一网页数量以及所述第二网页数量计算得到所述目标网站上的所述返回首页链接的设置率。
【技术特征摘要】
1.一种设置率确定方法,其特征在于,包括:对目标网站的访问日志进行解析,确定出所述目标网站中被访问的网页;从所述被访问的网页中识别出目标网页,统计出第一网页数量,其中,所述第一网页数量为所述目标网页的数量,所述目标网页为所述被访问的网页中设置有返回首页链接的网页;对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析,统计出第二网页数量,其中,所述第二网页数量为存在返回首页链接的网页的数量;以及根据所述被访问的网页的网页总数、所述第一网页数量以及所述第二网页数量计算得到所述目标网站上的所述返回首页链接的设置率。2.根据权利要求1所述的方法,其特征在于,对所述被访问的网页中除所述目标网页之外的其他网页的源代码进行解析包括:通过爬虫程序爬取所述被访问的网页中除所述目标网页之外的其他网页;从所述被访问的网页中除所述目标网页之外的其他网页中查询所述返回首页链接。3.根据权利要求1所述的方法,其特征在于,从所述被访问的网页中识别出目标网页包括:从所述目标网站的访问日志中查询出目标访问日志,其中,所述目标访问日志为访问所述目标网站的首页页面的日志;对所述目标访问日志进行解析,提取出访问所述目标网站的首页页面的访问来源;判断所述访问来源的网页是否为所述目标网站中除所述首页页面之外的其他网页;在所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页时,确定所述访问来源的网页为所述目标网页。4.根据权利要求3所述的方法,其特征在于,判断所述访问来源的网页是否为所述目标网站中除所述首页页面之外的其他网页包括:判断所述访问来源的网页的统一资源定位符中包含的域名是否与所述目标网站的域名相同;在所述访问来源的网页的统一资源定位符中包含的域名与所述目标网站的域名相同时,确定所述访问来源的网页是所述目标网站中除所述首页页面之外的其他网页。5.根据权利要求4所述的方法,其特征在于,对所述目标访问日志进行解析,提取出访问所述目标网站的首页页面的访问来源包括:从所述目标访问日志中解析出目标字段,其中,所述目标字段为记录有上一跳网页的统一资源定位符的字段。6....
【专利技术属性】
技术研发人员:李新国,崔维福,吴茜,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。