文档信息处理装置、文档信息处理方法和计算机可读介质制造方法及图纸

技术编号:2838521 阅读:161 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供文档信息处理装置、文档信息处理方法和计算机可读介质。文档信息处理装置包括:保持单元,其为各个用户保持对应于多个要素信息的关注概率权重;选择单元,其通过使用所述多个要素信息的关注概率权重,从文档组中选择被推断为应关注的文档;以及呈现单元,其呈现与所述选择单元使用的所述多个要素信息中的至少一个对应的信息。

【技术实现步骤摘要】

本专利技术涉及用于估计各个用户对于所处理文档的关注度的文档信息处理装置。
技术介绍
近年来,使用计算机的文档管理已经非常普遍,用户查看的文档的数量也增大了。在这种情况下,需要一种查找用户应该关注的文档的技术。例如,JP-A-2005-182804(在此使用术语“JP-A”表示“未审查已公开的日本专利申请”)公开了如下的技术从用户读取(查看)的文档中提取关键字,并且呈现包含该关键字的文档作为用户应该关注的文档的候选项。然而,用户实际应该关注的文档不一定包含所提取的关键字。对文档进行关注的要素不应限于关键字。然而,在上述相关技术中,很难对除关键字以外的其他要素进行分析。
技术实现思路
因此,本专利技术的目的是提供一种文档信息处理装置,该文档信息处理装置可以从不仅是有限的关键字的各种要素中分析用户关注文档的要素。(1)根据本专利技术的第一方面,文档信息处理装置包括保持单元,其为各个用户保持对应于多个要素信息的关注概率权重;选择单元,其通过使用所述多个要素信息的关注概率权重,从文档组中选择被推断为应关注的文档;以及呈现单元,其呈现与所述选择单元使用的所述多个要素信息中的至少一个对应的信息。(2)如条目(1)中所述的文档信息处理装置,该文档信息处理装置包括附加确定单元,其基于预定的附加准则从要素信息候选项中选择要素信息,基于选择的要素信息来计算关注概率权重,并且将关注概率权重保持在保持单元中。(3)根据本专利技术的第二方面,一种文档信息处理方法包括以下步骤为各个用户保持对应于多个要素信息的关注概率权重;通过使用所述多个要素信息的关注概率权重,从文档组中选择被推断为应关注的文档;并且呈现与所述多个要素信息中的至少一个对应的信息。(4)根据本专利技术的第三方面,提供了一种计算机可读介质,该计算机可读介质存储有一程序,该程序使得计算机执行用于估计各个用户对于所处理文档的关注度的处理,所述处理包括以下步骤为各个用户保持对应于多个要素信息的关注概率权重;通过使用所述多个要素信息的关注概率权重,从文档组中选择被推断为应关注的文档;并且呈现与所述多个要素信息中的至少一个对应的信息。附图说明基于下列附图详细描述本专利技术的示例性实施例,在附图中图1是示出根据本专利技术实施例的文档信息处理装置的示例结构的框图;图2是示出根据本专利技术实施例的文档信息处理装置的示例的功能框图;图3是示出根据本专利技术实施例的文档信息处理装置产生并使用的贝叶斯网络的示例的概念图;以及图4是示出根据本专利技术实施例的文档信息处理装置为各个用户保持的各条要素信息的关注概率权重的示例的示意图。具体实施例方式现在参照附图,其示出了本专利技术的示例性实施例。根据本专利技术实施例的文档信息处理装置由控制部11、存储部12、通信部13、操作部14、以及显示部15构成。控制部11是CPU等的程序控制装置,并且根据存储在存储部12中的程序而工作。在本实施例中,控制部11对用户进行认证,并且为各个经认证用户保持对于文档的操作历史信息。操作历史信息例如包括读取(查看)操作、打印操作、删除操作等,并且还保持操作执行日期和时间的信息。控制部11针对可以从所操作的文档中提取的要素信息,为各个用户产生关注概率权重(称为用户简档信息)的信息(建立简档处理)。此外,控制部11基于要素信息使用用户简档信息来从所处理的多个文档中选择被估计为应注意的文档,并且将用于确定关于所使用要素信息的至少一部分的要素信息的信息呈现给用户(要素呈现处理)。稍后详细描述控制部11的建立简档处理和要素呈现处理。存储部12被实现为包括RAM、ROM等的存储器件,以及硬盘等的盘装置。存储部12保持控制部11执行的程序。存储部12还用作控制部11的工作存储器。通信部13是网络接口等,用于根据从控制部11输入的命令通过网络获取文档并且将该文档存储在存储部12中。操作部14是键盘、鼠标等,并且接收用户操作并将命令操作的内容输出到控制部11。显示部15是显示器等,其根据从控制部11输入的命令来显示信息。由于控制部11执行建立简档处理和关注度计算处理,由此本实施例的文档信息处理装置通过软件提供如图2所示的功能。即,如图2所示,本实施例的文档信息处理装置在功能上由简档建立部21、简档信息保持部22、文档操作处理部23、文档选择部24、要素估计部25、以及信息呈现部26组成。假设控制部11预先对用户进行认证并且获取用于识别用户的信息。为进行认证,众所周知地,可以使用多种方法,例如使用用户名和密码的方法,因此这里将不再详细对认证进行讨论。简档建立部21形成如下的贝叶斯网络其包含从预定的要素信息候选项中选择的各条要素信息作为节点。该贝叶斯网络包括关于用户的命令操作内容的节点和表示对象文档应被用户注意的节点。如图3所示,贝叶斯网络在概念上形成网络。在要素信息的各个节点中彼此相关联地设置关注概率权重的信息。例如,如果对象文档是专利文献,则可以采用从文档中提取的关键字信息、著录信息中包括的申请人信息、国际专利分类号和其他的分类信息、专利技术人姓名等作为要素信息候选项。如图4所示,简档信息保持部22为各个用户保持一简档数据库,该简档数据库将用于识别要素信息的节点的信息(描述要素信息的字符串,例如,“申请人是A”等)与关注概率权重的信息彼此相关联地关联起来。在从文档操作处理部23接收到用户对于文档的命令操作内容时,简档建立部21提取与要操作的文档相关的要素信息,并且改变与用于识别用户的信息相关联地存储在简档信息保持部22中的与提取的要素信息对应的节点的关注概率权重。例如,如果文档操作处理部23输出的信息包括用户的读取(查看)开始日期和时间以及结束日期和时间,则简档建立部21根据该信息计算用户的读取(查看)时间。其从读取(查看)的文档中提取与贝叶斯网络中包括的节点对应的要素信息。例如,简档建立部21提取关键字、分类信息等。基于读取(查看)时间越长则关注概率越高的假设,简档建立部21根据预定的方法来增大与提取的要素信息对应的节点的关注概率权重。为了增大关注概率权重,例如可以使用以下各种方法按给定比率增大关注概率权重的方法、将关注概率权重增大对应于读取(查看)时间的量的方法。例如,可以采用如电子邮件重要性估计方法等的众所周知的方法来作为响应于用户操作对贝叶斯网络进行更新的方法。例如,文档操作处理部23响应于用户的命令操作而通过网络获取文档数据并且在显示部15上显示该文档数据。在接收到对文档的用户命令操作(读取(查看)开始命令、读取(查看)结束命令、删除命令等)的输入时,文档操作处理部23将表示命令操作的信息与表示命令操作的日期和时间的日期和时间信息一起输出到简档建立部21。可以从日历IC等(未示出)获取日期和时间信息。文档选择部24在预定的定时(例如用户指定的定时)从网络或者预定的文档数据库中获取进行处理的文档组。例如,可以按从最新存储日期和时间开始的顺序来获取存储在预定URL(统一资源定位符)中的预定数量的文档。可以获取存储在文档数据库(未示出)中的所有文档作为处理对象。文档选择部24从获取作为处理对象的各文档中提取与简档建立部21形成的贝叶斯网络中包括的节点对应的要素信息。其使用与所提取的要素信息相关联的关注概率权重的信息来计算各个文档是应关注文档的概率(关注概率)。文档选择本文档来自技高网...

【技术保护点】
一种文档信息处理装置,该文档信息处理装置包括:保持单元,其为各个用户保持对应于多个要素信息的关注概率权重;选择单元,其通过使用所述多个要素信息的关注概率权重,从文档组中选择被推断为应关注的文档;以及呈现单元,其呈现与 所述选择单元使用的所述多个要素信息中的至少一个对应的信息。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:加藤典司磯崎隆司
申请(专利权)人:富士施乐株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1