检索关键字分析系统和方法技术方案

技术编号:2872733 阅读:230 留言:0更新日期:2012-04-11 18:40
一种包括计算机可用介质的产品,所述计算机可用介质具有包含于其中的计算机可读程序代码装置,所述计算机可读程序代码装置包括:    使计算机根据使指示访问请求者的第一标识数据和表示要访问内容的第二标识数据相联系的Web访问日志,抽取表示相同请求者进行的连续访问的访问顺序的计算机可读程序代码装置,Web访问日志使表示检索系统的第二标识数据和请求者输入检索系统的检索关键字相联系;    使计算机从Web访问日志抽取检索关键字的计算机可读程序代码装置;和    使计算机根据定性评价规则,计算访问顺序的定性评价值,并产生表示检索关键字和定性评价值之间关系的第一关系数据的计算机可读程序代码装置,所述定性评价规则根据访问状态,确定检索系统的检索结果的定性评价值。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及分析Web浏览人员(下面简称为“浏览人员”)输入WWW(万维网)检索系统(下面称为“检索系统”),以便搜索WWW中的目标Web页或Web站点的检索关键字的特征的。
技术介绍
因特网中的访问目标的例子是Web页和Web站点。出于各种目的,包括广播、信息提供和定单接收,运转Web页和Web站点。为了有效实现这样的目的,分析和研究Web页和Web站点,以便有效实现这样的目的。例如,分析员通过了解哪一其它Web站点访问了分析目标Web站点,确定关于横幅广告,目录站点中的发布以及参与一流(prize)站点的策略。分析员通过了解执行了哪一检索,以及是否通过检索引擎访问了分析目标Web站点,确定内容的改进方针。分析并研究Web页和Web站点的一种方法是使用Web访问日志的Web访问日志分析,Web访问日志保存何时以及如何访问了哪一Web页。Web访问日志主要有两种。第一种Web访问日志是记录在单一或多个Web服务器中的Web访问日志(狭义Web访问日志)。第二种Web访问日志是保存单个或者多个浏览人员对各种Web页或Web站点的访问的Web访问日志。作为第二种Web访问日志,例如存在保存WWW观众研究公司从面板(panel)(监视器)收集的,每个面板对Web页或Web站点的访问的访问日志。下面提及的Web访问日志指的是第一种Web访问日志。例如,Web访问日志分析研究访问Web页或Web站点的浏览人员(用户、访问者)的数目如何随着时间或工作日而变化。在Web访问日志分析中,可调查浏览器或计算机OS的种类。在Web访问日志分析中,可调查浏览人员如何在单一Web站点内或多个Web站点之间表现其浏览过程。例如,阐明浏览人员已浏览Web页A,随后浏览Web页B的路径分析包含在Web访问日志分析中。另一方面,为了支持对因特网上的Web页或Web站点的浏览,存在以检索结果页的形式表示Web页(下面称为“关键字相关页”)或Web站点(下面称为“关键字相关站点”)的一系列信息(例如关键字相关页或关键字相关站点的统一资源定位符(URL)、摘要信息、链接信息等)的检索系统。这种检索系统被广泛使用。图1表示了使用检索系统的典型Web页的转换例子。如果在检索关键字输入屏幕1上通过浏览人员的浏览器输入检索关键字,那么指示检索开始,随后,检索系统抽取关于关键字相关页的链接2a-2c。随后,向浏览人员显示指示关于抽取的关键字相关页的链接2a-2c的检索结果页2。如果点击检索结果页2上的任意链接,那么在浏览人员的浏览器上显示点击的链接的关键字相关页。例如,点击链接2a,显示关键字相关页3。如果采用检索系统,关键字和包括其输入日期和时间的其它信息被记录在Web服务器的Web访问日志中。于是,能够实现利用Web访问日志,对检索关键字的分析(下面称为“检索关键字分析”)。例如在检索关键字分析中,调查某一检索关键字已被输入多少次。例如,调查在检索结果页上是否实际点击了检索结果。例如,调查对应于某一检索关键字,抽取了多少关键字相关页。日本专利申请KOKAI公开No.2002-123517公开检索关键字分析技术、商业工具、非商业工具和服务。在Web访问日志分析中,利用参考信息等,在访问分析目标Web站点之前进行Web站点分析,以及进行对应于每个检索关键字的浏览人员数目的分析。但是,传统的Web站点访问日志分析不能使分析员了解浏览人员是否对分析目标Web站点满意,或者在分析目标Web站点中获得了多大的成功(目的)。例如,假定分析目标Web站点打算提高产品的销量。如果根据检索引擎的检索结果,访问分析目标Web站点,那么传统的Web访问日志能够获得输入检索引擎的每个检索关键字的浏览人员的数目。但是,即使存在许多浏览人员,可能也不会从分析目标Web站点购买任何产品。即使只存在不多的浏览人员,他们中的多数可能会购买该产品。从而,分析员不能判断输入检索关键字的浏览人员是否对分析目标Web站点满意,以及浏览人员输入的哪个检索关键字实现了该Web站点的目的。例如,传统的Web访问日志分析能够调查对应于某一检索关键字,已抽取了多少关键字相关页。从防止浏览人员所需的一些Web页被遗漏的观点来看,分析员会断定抽取的关键字相关页越多,浏览人员对检索结果就越满意,反之,抽取的关键字相关页越少,浏览人员对检索结果就越不满意。但是,抽取的关键字相关页的数目并不直接表示浏览人员的满意度。实际上,在一些情况下,抽取的关键字相关页的数目越小,浏览人员越容易选择所需链接,从而浏览人员的需要被满足,满意度越高。即,如果以检索结果的形式向浏览人员呈现满足其需要的关键字相关页,那么当抽取的关键字相关页的数目越小时,浏览人员对检索结果越满意。从而,分析员不能根据传统的Web访问日志分析,判断浏览人员是否对检索结果满意。例如,通过调查检索结果页上关键字相关页的链接是否被实际点击,以及如果点击了任意链接,那么点击的是哪个关键字相关页链接,能够了解浏览人员在检索结果页上选择了哪个关键字相关页。但是,按照传统的Web访问日志分析,分析员极难判断访问的关键字相关页是否包含浏览人员所需的内容,以及浏览人员是否对结果满意(定性评价检索结果)。
技术实现思路
本专利技术的目的在于提供充分消除由相关现有技术的局限性和缺陷引起的一个或多个问题的方法和设备。根据本专利技术的第一方面,检索关键字分析程序使计算机实现访问顺序检测单元,所述访问顺序检测单元根据使WWW中的访问人员标识数据和受访人员标识数据相联系的Web访问日志,抽取指示同一访问人员的连续访问的访问顺序,并把表示访问顺序抽取结果的访问顺序数据记录在记录介质中;关键字抽取单元,如果在Web访问日志中,指示WWW中的检索系统的访问目的地标识数据和访问人员输入检索系统的检索关键字相关,那么所述关键字抽取单元抽取检索关键字,并记录指示检索关键字抽取结果的关键字数据;评价值计算单元,所述评价值计算单元根据定义用于计算与WWW中的检索系统的检索结果对应的定性评价值的标准的定性评价规则,计算和记录在记录介质中的访问顺序数据指示的访问顺序对应的定性评价值,并记录表示在由记录于记录介质中的关键字数据指示的检索关键字的访问顺序中输入的检索关键字和定性评价值之间的关系的关系数据。于是,易于掌握检索系统根据输入的检索关键字,得到的检索结果的定性评价值。根据本专利技术的第一方面,访问顺序抽取单元和关键字抽取单元并行工作。在本专利技术的第一方面中,评价值计算单元不仅可计算定性评价值,而且可以根据定义计算关于检索系统的检索结果的定量评价值的标准的定量评价规则,计算和记录介质中记录的访问顺序数据指示访问顺序对应的定量评价值,并记录表示在由记录于记录介质中的关键字数据指示的检索关键字的访问顺序中输入的检索关键字、定性评价值和定量评价值之间的关系的关系数据。于是,易于掌握和检索系统根据输入的检索关键字,得到的检索结果有关的定性评价值和定量评价值,以及定性评价值和定量评价值之间的关系。根据本专利技术的第二方面,检索关键字分析程序使计算机实现访问顺序抽取单元,所述访问顺序抽取单元根据使WWW中的访问人员标识数据和访问目的地标识数据相联系的Web访问日志,抽取指示同一访问人员的连续访问的访问顺序,并把表本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:平博司飯田晴彥平井潤
申请(专利权)人:株式会社东芝
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利