文件检索装置以及文件检索方法制造方法及图纸

技术编号:7581737 阅读:187 留言:0更新日期:2012-07-19 12:49
一种文件检索装置及文件检索方法,实施方式中的文件检索装置,具备:存储装置,该存储装置存储:结构化文件数据;抽出语句信息,包含在结构化文件数据中包含的每个语句的、抽出源的结构化文件数据的标识符与抽出源的结构化文件数据中的属性;以及方式判断规则,包含每个属性的检索方式和显示形式。此外,实施方式的文件检索装置,输入检索语句,在抽出语句信息中存在与检索语句一致的语句的情况下,参照抽出语句信息,判断检索语句的属性,根据判断出的属性,参照方式判断规则,判断对结构化文件数据进行检索的检索方式和检索结果的显示形式,通过判断出的检索方式,根据检索语句,进行文件检索,通过判断出的显示形式,输出检索结果。

【技术实现步骤摘要】

本专利技术涉及。
技术介绍
随着文件的电子化及万维网(World Wide Web,简称WWW)的普及,文件检索在日常生活及各种业务中被广泛使用。例如,通过利用互联网的检索服务,用户仅输入关键字即可收集在全球网页上记载的信息。此外,文件检索除了互联网的检索服务以外,还应用于以企业及政府机关的文件管理或信息共享为目的的系统,及用于个人信息整理的工具等。文件检索通过输入关键字等的检索请求来执行。作为文件检索的输出结果,例如输出文件标题一览。用户从输出的文件一览中选择感兴趣的文件并确认文件内容,从而获得 目息。例如,在呼叫中心(call center),操作员通过文件检索来检索过去事例。,若该检索时的手续少、即能够高效地进行文件检索,则操作员能够一边参照关联的过去事例一边应对询问,因此能够提高工作效率。有一些用来减少文件检索的步骤及手续以提高工作效率的方法。作为这些方法中的一个,有如下方法,即在互联网的检索服务中,除了执行用于输出一览形式的检索结果的检索处理的按钮(button)之外,还准备有用来直接显示检索结果第I位的文件的内容的按钮。但是,仅当用户在事前知道检索结果的第I位是正确文件时,该方式才会有效。此外,还有如下方法,即利用Web检索中的过去的操作履历,推荐与作为检索请求而输入的关键字对应的Web站点。该方法中,利用输入的关键字来判断在过去的检索中频繁参照的Web站点,在该关键字的输入结束的时刻、并且在执行检索处理之前,以气球 (吹务出)形式等来推荐上述Web站点。通过该方法,能够实现在检索请求的输入刚刚结束之后推荐记载有用户要求的信息的文件。但这是仅在将对象限定于Web检索、且能利用大量操作日志(log)的环境下有效的方法。即,在面向无法使用如Web检索那样的大量操作日志的企业内部及个人的文件检索中,无法有效地发挥作用。此外,需要用户输入检索请求的关键字直到关键字的最后为止。
技术实现思路
实施方式的文件检索装置,具备存储装置,该存储装置存储结构化文件数据; 抽出语句信息,包含在结构化文件数据中包含的每个语句的、抽出源的结构化文件数据的标识符以及抽出源的结构化文件数据中的属性;以及方式判断规则,包含每个属性的检索方式和显示形式。此外,实施方式的文件检索装置,输入检索语句,在抽出语句信息中存在与检索语句一致的语句的情况下,参照抽出语句信息,判断检索语句的属性,根据判断出的属性,参照方式判断规则,判断对结构化文件数据进行检索的检索方式和检索结果的显示形式,通过判断出的检索方式,根据检索语句,进行文件检索,通过判断出的显示形式,输出检索结果。附图说明图I是表示第一实施方式的文件检索装置的整体结构的一例的图。图2是表示第一实施方式的文件检索装置的检索画面的一例的图。图3是表示第一实施方式的文件检索装置的文件数据的一例的图。图4是表示第一实施方式的文件检索装置的文件结构信息的一例的图。图5是表示第一实施方式的文件检索装置的抽出语句信息的一例的图。图6是表示第一实施方式的文件检索装置的方式判断规则表的一例的图。图7是表示第一实施方式的文件检索装置的文件检索处理的一例的流程图。图8是表示第一实施方式的文件检索装置的方式判断处理的一例的流程图。图9是表示被输出到第一实施方式的文件检索装置的输出部的检索结果画面的一例的图。图10是表示被输出到第一实施方式的文件检索装置的输出部的检索结果画面的-例的图。程图。图。图11是表示第二实施方式的文件检索装置的整体结构的一例的图。图12是表示第二实施方式的文件检索装置的检索方式指定画面的一例的图。图13是表示第二实施方式的文件检索装置的检索方式指定区域的一例的图。图14是表示第三实施方式的文件检索装置的整体结构的一例的图。图15是表示第三实施方式的文件检索装置的查询(query)选择处理的一例的流图16是表示第三实施方式的文件检索装置的图标(icon)的一例的图。图17是表示第三实施方式的文件检索装置的检索画面的一例的图。图18是表示第四实施方式的文件检索装置的检索画面的一例的图。图19是表示第四实施方式的文件检索装置的查询候补生成处理的一例的流程图20是表示第四实施方式的文件检索装置的查询选择处理的一例的流程图。具体实施例方式以下,参照附图,说明本专利技术的实施方式。(第一实施方式)图I表示本专利技术第一实施方式的文件检索装置的整体结构。本实施方式的文件检索装置具备输入部11、文件检索部12、输出部15、文件存储部16、文件结构存储部17、抽出语句存储部18、方式判断规则存储部19。输入部11进行作为检索请求的字符串的输入。即,用户利用输入部11输入的字符串作为检索请求而被发送到文件检索部12,进行文件检索。输入部11例如是键盘和鼠标,用于用户的输入及指示等。具体而言,在显示器所显示的输入画面中显示用户通过键盘输入的输入字符串,通过作为输入部11的鼠标点击输入画面上的“发送”按钮,从而向本实施方式的文件检索装置发送。文件检索部12将从输入部11输入的字符串(以下称为输入字符串)变换为检索查询,根据该检索查询来检索在文件存储部16中存储的文件数据。文件检索部12具备抽出语句判断部13和方式判断部14。抽出语句判断部13判断输入字符串是否存储在抽出语句存储部18中。方式判断部14根据抽出语句判断部13的判断结果,判断检索方式和显示形式。例如,输入字符串是存储在后述抽出语句存储部18中的语句的情况下,文件检索部12根据存储在抽出语句存储部18中的该语句的属性,判断检索方式和显示形式。根据判断出的检索方式,文件检索部12进行文件存储部16的文件数据的检索。此外,根据判断出的显示形式,将检索结果输出到输出部15。输出部15例如是液晶显示器等显示装置。另外,作为输出部15的液晶显示器预先显示检索画面100。图2示出检索画面100的一例。如图2所示,检索画面100具有用于输入检索请求的输入框101、检索结果显示区域102和输入按钮103。用户利用输入部11输入的检索请求即字符串被显示在输入框101 中,若利用作为输入部11的鼠标点击输入按钮103,则该字符串被输入到文件检索部12,执行文件检索。检索结果显示区域102显示文件检索的结果。文件存储部16对文件检索装置的检索对象的文件数据和文件数据的结构信息进行存储。即,文件存储部16存储的文件数据是包含基于标签(tag)赋予等的结构信息的数据。此外,文件存储部16存储的文件数据包含例如网页文件、业务上作成的文件、专利公报等的数据。本实施方式中,文件存储部16以用XML(Extensible Markup Language,可扩展标示语言)来表现文件的结构信息的形式对文件数据进行存储。图3是在文件存储部16中存储的文件数据的一例。图3所示的文件数据,其文件 ID 是 34281,构成要素是「/doc/header/categoryJ >「/doc/header/title J 以及「/doc/ body/section/title」、「/doc/body/section/description」。Γ/doc/header/categoryJ 表不文件数据的类别(category)。「/doc/header/ title」表示文件数据的标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
...

【专利技术属性】
技术研发人员:仲野亘真锅俊彦国分智晴稻叶真纯
申请(专利权)人:株式会社东芝东芝解决方案株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术