信息处理装置、文档检索方法制造方法及图纸

技术编号:2855850 阅读:155 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供信息处理装置、文档检索方法。在以多个数据库为对象进行文档检索时,可以在短时间以适当量输出适宜的检索结果的检索技术。为了解决该课题,本发明专利技术的信息处理装置具备以下的构成。即,是以多个数据库为对象进行文档检索的信息处理装置,包括:检索在上述多个数据库中被存储在任意的数据库中的文档的部件;记录给被存储在上述多个数据库中的文档的访问信息的部件;使用上述访问信息抽出上述被检索的文档和访问顺序的最近的文档,基于该访问顺序,算出和上述被检索的文档的关联度的部件;可以把上述被检索的文档,和由算出了上述关联度的文档作为检索结果输出的部件。

【技术实现步骤摘要】

本专利技术涉及电子文档的管理技术,特别涉及进行电子文档检索的检索技术。
技术介绍
在企业和机关的办公室中,办公环境的网络化、数字化不断进展,把各种文档利用文字处理软件、电子数据表软件、图像软件等软件作为电子文档保管。此外,也进行用扫描器等的设备把纸文档转换为电子文档并进行保管。这样在办公室中需要保管许多的电子文档,因此,在许多办公室中导入文档管理系统,谋求电子文档的有效的管理(例如,参照特开2000-315210号公报)。但是,在一个数据库中处理的文档数是有限的,当登记文档数增大时,分割数据库,分成多个数据库进行管理。此外,如果以巨大的文档数为对象进行检索,则因为检索效率差(需要检索时间),所以还有准备分散数据库环境的情况。进而,起初作为文档管理系统的运用方针,还有以部署单位分割数据库,或者针对每个文档的种类分割数据库运用的情况。因此,重要的是在文档管理系统中的电子文档的检索时,考虑以多个数据库为对象进行。在此,作为进行被分散后的多个数据库的检索的文档管理系统,例如考虑图3所示的系统。在该图中,301~303是文档管理服务器,305是客户机,相互经由网络304连接。另外,在该图中为了简单说明,文档管理服务器和数据库是1∶1相对应,此外,卷服务器省略。在这样的文档管理系统中,当从客户机305发出检索指示的情况下,各文档管理服务器以与各个服务器连接的数据库为对象进行检索,在客户机305中,把在各文档管理服务器中的检索结果归拢在一起的结果作为最终的检索结果显示给用户。但是,当使用这样的检索方式进行多个数据的检索的情况下,存在以下的问题。首先,在上述文档管理系统中如果构成是逐次对各数据库进行各文档管理服务器的检索,则检索处理需要的时间与检索对象数据库数相应增大。另一方面,当如各文档管理服务器301、302、303各自并行进行检索那样构成的情况下,虽然可以避免这样的问题,但必须等待检索处理时间中最花时间的来自数据库的检索结果,在处理时间的缩短中存在限度。进而,当对每个数据库检索时的评价的基准(评价算法)不同的情况下,在把最终的检索结果显示在客户机305上时,如果根据得分单纯联系起来,则不能得到适宜的排列(最终的检索结果)。此外,当数据库的数多的情况下,最终的检索结果的数也增大(例如,在与10个数据库连接的环境中,如果从1个数据库取得100件的检索结果,则最终的检索结果显示1000件)。这样在以多个数据库为对象进行检索时,当使用以往的检索方式的情况下,存在三个问题,第一,随着检索对象的数据库的增加处理时间增长,第二,作为最终结果存在不能得到适宜的结果的情况,第三,随着检索对象的数据库的增加最终结果增大。本专利技术就是鉴于上述问题而完成的,其目的在于提供一种在以多个数据库为对象进行文档检索时,可以在短时间以适当量输出适宜的检索结果的检索技术。
技术实现思路
为了实现上述目的本专利技术的信息处理装置具备以下那样的构成。即,是以多个数据库为对象进行文档检索的信息处理装置,包含在上述多个数据库中检索存储在任意的数据库中的文档的检索部件; 记录给被存储在上述多个数据库中的文档的访问信息的记录部件;使用上述服务信息抽出由上述检索部件检索出的文档和访问顺序中最近的文档,基于该访问顺序,算出与用上述检索部件检索的文档的关联度的算出部件;可以把用上述检索部件检索的文档、由上述算出部件算出了关联度的文档作为检索结果输出的输出部件。如果采用本专利技术,则在由多个数据组成的分散数据库环境中进行文档检索时,可以在短时间适量地输出适宜的检索结果。本专利技术的其它特征与优点,根据结合附图的以下说明将会明白,其中,在附图中对同样或相似的部分附加相同的参照标号。附图说明附图包含在说明书中,构成其一部分,表示本专利技术的实施方式,并与上面所给出的概括说明和下面给出的其优选方式的详细说明一起用于阐述本专利技术的原理。图1是用于说明本专利技术的一种实施方式的信息处理装置的功能构成的方框图。图2是展示具备本专利技术的一种实施方式的信息处理装置的文档管理系统构成的图。图3是展示进行多个数据库的检索的文档管理系统的一个例图。图4是展示文档管理客户端软件的画面构成的一个例图。图5是展示在文档管理客户端软件中的,文档更新时的用户接口的一个例图。图6是展示本专利技术的一种实施方式中的文档管理服务器具备的数据库的一个例图。图7是展示关联文档访问信息的一个例图。图8是展示关联文档访问信息的一个例图。图9是展示由检索结果整形单元输出的检索结果的一个例图。图10是说明关联文档访问信息的更新处理流程的流程图。图11是用于说明图10的流程图的具体例子的图。图12是展示从单一数据库的检索结果中生成包含关联文档的检索结果的处理流程的流程图。图13是展示一次检索结果一览的一个例图。图14是展示求关联度的处理流程的流程图。图15是展示根据访问时间确定加权的表的一例的图。图16是展示最终命中一览表的合成处理流程的流程图。图17是用于说明同一关联文档的例子的图。图18是用于说明在编辑规定的文档中有对其它的文档进行访问的图。图19是展示表示检出状态的关联文档访问信息的一个例图。图20是展示表示检出状态的关联文档访问信息的一个例图。图21是展示求解相对在编辑中的文档被访问过的文档的关联度的处理流程的流程图。图22是展示表示在文档间进行了复制的状态的关联文档访问信息的一个例图。图23是展示依照编辑的状态在关联度上进行加权的处理流程的流程图。图24是展示求解访问了文档的全部用户的关联度的合计的处理流程的流程图。图25是用于说明每个用户的关联度求法的图。具体实施例方式下面参照附图对本专利技术的优选实施方式进行详细说明。<文档管理系统的构成> 图2是展示具备本专利技术的一个实施方式的信息处理装置(文档管理服务器)的文档管理系统构成的图。在该图中,201是文档管理服务器,具有数据库202。文档管理服务器201把在文档管理系统内的保管场所、实际文档数据的保存场所、制成日期、更新日期、所有人等的文档属性、记录着用户的操作和访问的日志保持在数据库202中。203是文档卷服务器,保管文档的实际数据。在此保管的数据被实施压缩处理高效率地保管。用网络204连接客户机PC205和206和文档管理服务器201、文档卷服务器203。从客户机PC205、206通过在此未图示的文档管理客户端软件,在服务器中保管文档数据,或者从服务器取得文档数据。例如,说明从客户机PC205向文档管理系统登记文档数据的情况。在客户机PC205上,起动文档管理客户端软件,和文档管理服务器201连接。如果指定文档管理系统内的文档夹,对文档管理客户端软件进行文档数据登记指示,则文档管理服务器201判定是否有对文档夹的访问权,或者是否有只存储该文档的容量等是否可以容许文档登记,在可以登记的情况下,把该文档的制成日期、更新日期、所有人等的属性信息存储在文档管理服务器201内的数据库202中,把该文档的实际数据存储在文档卷服务器203中。此时,实际文档数据的文档卷服务器203的保存场所被通知给文档管理服务器201,并保存该信息。进而,进行了文档登记的记录也作为日志保持。此外,在客户机PC205上,经由文档管理客户端软件取得从文档卷服务器203中选择出的文本文档来自技高网
...

【技术保护点】
一种信息处理装置,以多个数据库为对象进行文档的检索,其特征在于包括:检索在上述多个数据库中被存储在任意的数据库中的文档的检索部件;记录对被存储在上述多个数据库中的文档的访问信息的记录部件;使用上述访问信息抽出由上述检 索部件检索的文档和访问顺序最近的文档,基于该访问顺序,算出与由上述检索部件检索的文档的关联度的算出部件;可以把由上述检索部件检索的文档,和由上述算出部件算出了关联度的文档作为检索结果输出的输出部件。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:水野贵史
申请(专利权)人:佳能株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1