计算站内搜索有效度的方法及装置制造方法及图纸

技术编号:14891663 阅读:44 留言:0更新日期:2017-03-29 00:30
本发明专利技术公开了一种计算站内搜索有效度的方法及装置,涉及互联网技术领域,为解决人工统计网站的站内搜索有效度的方式效率低的问题而发明专利技术。本发明专利技术的方法包括:获取站点的访问日志,访问日志中记录有用户访问站点的访问信息;从访问信息中提取用户访问的页面的统一资源定位符URL;从页面的URL中查找搜索结果页的URL,将搜索结果页的URL的数量确定为M,搜索结果页为用户通过站内搜索访问的网页页面,其中包含根据站内搜索条件筛选出的目标页面的页面链接;根据访问信息判断用户是否点击过页面链接,将用户点击页面链接的次数确定为N;计算N与M的比值,获得站内搜索有效度。本发明专利技术适合应用在计算网站站内搜索有效度的过程中。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种计算站内搜索有效度的方法及装置
技术介绍
随着Web2.0带来的海量信息井喷式涌现,企业自身对信息架构、管理、发布的需求,以及用户对信息的组织、查询、可寻性的要求越来越高,于是出现了站内搜索。其中网站站内搜索有效度是评价网站绩效的一项重要指标,它反应的是用户在网站通过站内搜索找到目标页面(内容)的成功率。目前,站内搜索的有效度的计算是通过人工的方式实现的,具体的需要人工设置关键词多次登录访问目标网站进行搜索,然后统计得到目标站点的站内搜索有效度。在上述站内搜索有效度计算中,专利技术人发现:人工统计耗时较长;而且若每隔一段时间都需要统计站内搜索有效度,则需要一直重复进行劳动;人工统计属于抽样统计,不能准确反应网站真实的站内搜索有效度。综上所述,人工统计网站的站内搜索有效度的方式效率低。
技术实现思路
本专利技术提供了一种计算站内搜索有效度的方法及装置,能够解决人工统计网站的站内搜索有效度的方式效率低的问题。为解决上述技术问题,一方面,本专利技术提供了一种计算站内搜索有效度的方法,该方法包括:获取站点的访问日志,所述访问日志中记录有用户访问所述站点的访问信息;从所述访问信息中提取用户访问的页面的统一资源定位符URL;从所述页面的URL中查找搜索结果页的URL,将所述搜索结果页的URL的数量确定为M,所述搜索结果页为用户通过站内搜索访问的网页页面,其中包含根据站内搜索条件筛选出的目标页面的页面链接;根据所述访问信息判断用户是否点击过所述页面链接,将用户点击所述页面链接的次数确定为N;计算N与M的比值,获得所述站内搜索有效度。另一方面,本专利技术还提供了一种计算站内搜索有效度的装置,该装置包括:获取单元,用于获取站点的访问日志,所述访问日志中记录有用户访问所述站点的访问信息;提取单元,用于从所述获取单元获取的所述访问信息中提取用户访问的页面的统一资源定位符URL;查找单元,用于从所述提取单元提取的所述页面的URL中查找搜索结果页的URL,将所述搜索结果页的URL的数量确定为M,所述搜索结果页为用户通过站内搜索访问的网页页面,其中包含根据站内搜索条件筛选出的目标页面的页面链接;判断单元,用于根据所述获取单元获取的所述访问信息判断用户是否点击过所述页面链接,将用户点击所述页面链接的次数确定为N;计算单元,用于计算所述判断单元获得的N与所述查找单元获得的M的比值,获得所述站内搜索有效度。本专利技术提供的计算站内搜索有效度的方法及装置,能够在目标站点部署可以捕获日志的程序来获取用户的访问信息,从用户访问信息中提取出用户进行站内搜索的数量M和用户进行了有效的站内搜索的次数N,并计算N与M的比值,从而获得站内搜索有效度。与现有技术相比,本专利技术可以自动获取用户的访问信息,并根据访问信息自动计算站内搜索有效度,无需人工登录目标站点进行手动搜索操作,能够大大减少统计的时间,也可以保证统计结果的准确性,所以可以解决人工统计网站的站内搜索有效度的方式效率低的问题。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种计算站内搜索有效度的方法流程图;图2示出了本专利技术实施例提供的另一种计算站内搜索有效度的方法流程图;图3示出了本专利技术实施例提供的一种计算站内搜索有效度的装置的组成框图;图4示出了本专利技术实施例提供的另一种计算站内搜索有效度的装置的组成框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。为解决现有技术中解决人工统计网站的站内搜索有效度的方式效率低的问题,本专利技术实施例提供了一种计算站内搜索有效度的方法,如图1所示,该方法包括:101、获取站点的访问日志,访问日志中记录有用户访问站点的访问信息。站点的访问日志里,记录了所有用户对该站点访问的所有信息,包括哪个用户使用什么IP、在什么时间、用什么操作系统、什么浏览器、什么分辨率显示器访问了站点的哪个页面,是否访问成功。因此,为了计算站内搜索有效度,就需要获取站点的访问日志,为后面的提取访问日志中的有用信息作准备。本实施例中的站点指代的是具有站内搜索的一类网站,比如新浪网、央视网等,但不包括像百度、360等带有搜索引擎的网站。102、从访问信息中提取用户访问的页面的统一资源定位符URL。从步骤101中获得的访问信息中提取用户访问的页面的统一资源定位符(UniformResourceLocator,简称URL)。URL是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。也就是说,互联网上每个页面都对应了唯一的URL,因此提取用户访问的页面的URL也是为后面判断用户是否访问了一些特定页面作准备工作。103、从页面的URL中查找搜索结果页的URL,将搜索结果页的URL的数量确定为M,搜索结果页为用户通过站内搜索访问的网页页面,其中包含根据站内搜索条件筛选出的目标页面的页面链接。由步骤102已经提取得到了用户访问的所有的页面的URL,然后就可以设定条件从中筛选出某些特定的页面的URL。本实施例中某些特定的页面指站点中用户访问过的搜索结果页。具体的实现方法是:在用户访问的所有的页面的URL中找出搜索结果页的URL,然后将所有搜索结果页的URL的数量进行统计,记为M。M也就是用户进行站内搜索的数量。本实施例中的搜索结果页的URL是具有一定共性的许多URL,而不是一个绝对的URL。104、根据访问信息判断用户是否点击过页面链接,将用户点击页面链接的次数确定为N。由步骤103知道搜索结果页中包含根据站内搜索条件筛选出的目标页面的页面链接,然后根据用户点击页面链接的情况来确定用户点击页面的次数N。具体的确定规则为:如果用户点击了搜索结果页中的某一个页面链接,或者是某几个页面链接,均记录用户点击页面链接的次数记为1。用户点击页面链接的次数的判断依据是在搜索结果页中是否进行了点击页面链接的行为,与在同一个搜索结果页中进行了几次点击页面链接的行为没有关系,即如果有点击链接的行为就记录1次,如果没有就不记录。通常用户在搜索结果页中进行了点击页面链接的行为就认为用户通过搜索结果页找到了目标页面,即进行了一次有效搜索。105、计算N与M的比值,获得站内搜索有效度。站内搜索有效度是指用户在站点通过站内搜索找到目标页面的成功率,因此通过计算步骤104中获得的有效搜索的次数与步骤103中获得的用户进行站内搜索的数量M的比值来得到。本实施例中计算的站内搜索有效度是指某个时间区域内的站内搜本文档来自技高网...
计算站内搜索有效度的方法及装置

【技术保护点】
一种计算站内搜索有效度的方法,其特征在于,所述方法包括:获取站点的访问日志,所述访问日志中记录有用户访问所述站点的访问信息;从所述访问信息中提取用户访问的页面的统一资源定位符URL;从所述页面的URL中查找搜索结果页的URL,将所述搜索结果页的URL的数量确定为M,所述搜索结果页为用户通过站内搜索访问的网页页面,其中包含根据站内搜索条件筛选出的目标页面的页面链接;根据所述访问信息判断用户是否点击过所述页面链接,将用户点击所述页面链接的次数确定为N;计算N与M的比值,获得所述站内搜索有效度。

【技术特征摘要】
1.一种计算站内搜索有效度的方法,其特征在于,所述方法包括:获取站点的访问日志,所述访问日志中记录有用户访问所述站点的访问信息;从所述访问信息中提取用户访问的页面的统一资源定位符URL;从所述页面的URL中查找搜索结果页的URL,将所述搜索结果页的URL的数量确定为M,所述搜索结果页为用户通过站内搜索访问的网页页面,其中包含根据站内搜索条件筛选出的目标页面的页面链接;根据所述访问信息判断用户是否点击过所述页面链接,将用户点击所述页面链接的次数确定为N;计算N与M的比值,获得所述站内搜索有效度。2.根据权利要求1所述的方法,其特征在于,所述获取站点的访问日志,包括:在所述站点侧部署日志获取程序;运行所述日志获取程序获取所述站点的访问日志。3.根据权利要求1所述的方法,其特征在于,所述从所述页面的URL中查找搜索结果页的URL,包括:将所述页面的URL与预设的正则表达式进行匹配,所述正则表达式用于描述检测搜索结果页的URL的检测规则;将与所述正则表达式匹配的页面的URL确定为所述搜索结果页的URL。4.根据权利要求3所述的方法,其特征在于,所述将与所述正则表达式匹配的页面的URL确定为所述搜索结果页的URL,包括:将主机名字段与所述正则表达式中记录的域名相同的URL,确定为所述搜索结果页的URL。5.根据权利要求3所述的方法,其特征在于,所述将与所述正则表达式匹配的页面的URL确定为所述搜索结果页的URL,包括:将主机名字段与所述正则表达式中记录的域名相同,并且路径字段内
\t容与所述正则表达式中记录的路径内容相同的URL,确定为所述搜索结果页的URL。6.根据权利要求3所述的方法,其特征在于,在所述将所述页...

【专利技术属性】
技术研发人员:李新国
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1