文档组分析设备、文档组分析方法及文档组分析系统技术方案

技术编号:2858944 阅读:173 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种文档组分析设备、文档组分析方法、文档组分析系统、程序,及记录介质,其通过在成功案例和失败案例之间分离有因果关系的文档并将用于分析成功和失败的要素的信息进行显示,来识别业务成功和失败出现分歧之处。其中,在文档数据库中按搜索条件搜索文档,多个文档,该文档数据库基于文档的种类保存有因果关系的文档组。从文档数据库中提取搜索到的文档和与搜索到的文档有因果关系的文档。将该提取的有因果关系的文档分割成组。将属于每一组的文档按文档的种类进行分类。

【技术实现步骤摘要】

本专利技术一般涉及文档组分析设备、文档组分析方法、文档组分析系统、程序,及记录介质,并且特别涉及搜索有因果关系的文档组的技术,以及基于搜索结果进行文本挖掘(text-mining)。
技术介绍
为了成功完成业务,分析过去往往是重要的。典型地,要计划商务会议时,参考过去的相似案例是有用的。有一种通过输入搜索条件搜索想要的内容的技术,其中检索和呈现满足搜索条件的文档(也就是显示和打印)。有时发生这种情况,虽然事件显得彼此相似,但是将上述事件分为成功的和失败的,以及另一种情况,即成功的途径是不同的。过去的历史不可能被充分采用,除非知道“为何一些成为好的”和“为何一些成为坏的”。为了充分采用过去的经验,不得不将文档组分类为“成功”的和“失败”。根据传统技术,在短时间内很难做到正确地辨别两者。即使文档组被分为“成功”和“失败”,分析为何某个业务成为好的或者错误的是必需的。目前,没有专门的技术来这样进行分析,而且这样的分析是手动执行的。
技术实现思路
由于如上所述的现有状况而提出本专利技术,且旨在提供一种文档组分析设备、文档组分析方法、文档组分析系统、程序,及记录介质,用于充分地排除由现有技术的局限和缺点所导致的一个或多个问题。本专利技术特别旨在提供将有因果关系的文档组分类为成功事件和失败事件的文档组分析设备、文档组分析方法、文档组分析系统、程序,及记录介质,并且提供用于分析成功和失败因素的信息。将在后面的说明中阐明本专利技术的特征和优点,且部分地将由说明和附图变得明显,或者可能根据说明书中提供的教导实施本专利技术来进行认识。借助在说明书中用完整、清楚、简明和确切的术语特别指出的文档组分析设备、文档组分析方法、文档组分析系统、程序,及记录介质,使得本领域的普通技术人员实施本专利技术,将实现和达到本专利技术的目的以及其它特征和优点。为了获得这些和其它优点和依照本专利技术的目的,如这里具体和概括地说明,本专利技术提供如下。用于解决问题的手段本专利技术提供文档组分析设备,其包括搜索单元,其根据搜索条件在文档数据库中搜索文档,和相关文档组提取单元,其提取满足搜索条件的文档,以及所有与从文档数据库中搜索到的文档有因果关系的文档。文档组分析设备进一步包括文档组分类单元,其将有因果关系的文档捆绑成一组,并根据属于该组的文档种类对文档进行分类。文档组分析设备进一步包括状态转换图产生单元,其生成状态转换图,其中将文档的种类作为节点,并将以种类的形式生成的文档作为状态转换键。其中,节点以因果关系的顺序进行连接。文档组分析设备进一步包括提取关键事件的关键事件提取单元。本专利技术进一步提供分析导致成功和失败的因素的方法,其中根据搜索条件从文档数据库中搜索和检索(第一)文档,检索与该(第一)文档有因果关系的(第二)文档,将第一和第二文档分成组,每组包括有因果关系的文档,也就是,根据代表相同业务的不同阶段,将组中的文档按文档种类进行分类,且显示分类的结果和相关文档的内容,以便分析成功和失败的因素。本专利技术进一步提供文档组分析系统,其包括文档数据服务器、客户机、以及文档组分析服务器。本专利技术进一步提供计算机可执行程序,用于计算机执行文档组分析设备的功能,或者可选择地执行文档组分析系统的功能。本专利技术进一步提供存储该程序的计算机可读记录介质。专利技术效果根据本专利技术,将获得下面的效果。(1)不仅检索满足搜索条件的文档,还检索其它有因果关系的文档,且重建业务流的历史,便于以传统的形式分析信息。(2)一般来说,在草拟表格文档(表格)的业务中,如果商务谈判成功地进行到订立合同,通常生成整组表格文档(表格)。相反地,如果业务不成功,则不生成所有的表格。在货物出售业务的情况中,例如,业务流如下。“顾客信息注册文档->标书->估价->合同->发货单”。如果业务失败,则不生成所有的文档,且文档历史看起来是“顾客信息注册文档->标书”,以及“顾客信息注册文档->标书->估价”。因此,借助对根据表格的种类搜索的文档组进行分组,可以正确地分类目的业务。(3)根据本专利技术,生成状态转换图,其中以图形显示成功或失败,提供易于对于在成功和失败之间的分支点进行分析的信息。作为分析的辅助信息,提供关键事件以便于分析。例如,如果当业务失败时数据项“竞争者”常常示出“公司A”,可以确定如果在预期的业务中公司A参与竞争,失败的概率是很高的。进一步,如果将不具有普遍性的项目指定为划分成功和失败的因素,可以减少分析的时间和努力,并且可以删去无用信息的表示。(4)当将有因果关系的表格文档组置于与业务相关的文档组时,在许多情况下,已经以清楚的形式管理表格文档,可以清楚地分开业务的成功和失败。因而,不需要工作流数据库的新引入,且不需要将“成功”和“失败”的附加信息附在业务表格上。为此,本专利技术的文档组分析设备,或者文档组分析系统可以以最小的成本引入。附图说明图1是示出根据本专利技术的实施例(实施例1和实施例2)的文档组分析系统的结构的方框图;图2是示出在文档数据库中存储的文档的基本数据结构的示例的表;图3是示出作为顾客信息注册文档的表格A的数据项的示例的表;图4是示出标书的表格B的数据项的示例的表;图5是示出估价的表格C的数据项的示例的表;图6是示出合同的表格D的数据项的示例的表; 图7是示出发货单的表格E的数据项的示例的表;图8是示出填有数据的顾客信息注册文档的示例的表;图9是示出填有数据的标书的示例的表;图10是示出填有数据的估价的示例的表;图11是示出填有数据的合同的示例的表;图12是示出填有数据的发货单的示例的表;图13是示出填有数据的顾客信息注册文档的另一个示例的表;图14是示出填有数据的标书的另一个示例的表;图15是示出填有数据的估价的另一个示例的表;图16是示出填有数据的顾客信息注册文档的另一个示例的表;图17是示出填有数据的顾客信息注册文档的另一个示例的表;图18是示出填有数据的顾客信息注册文档的另一个示例的表;图19是示出根据本专利技术的实施例1的文档组分析系统的客户机和文档组分析服务器的功能性结构的方框图;图20是示出按表格组分类文档的结果的示例的表格{按因果关系对文档进行分组,以及按表格列表对文档组进行分类};图21是示出分类结果的客户机的显示屏的示例;图22是示出根据本专利技术的实施例2的文档组分析系统的客户机和文档组分析服务器的功能性结构的方框图;图23是示出在状态转换图中的节点和状态转换键之间的关系的图表;图24A是示出与表格组有关的节点图生成过程的起始节点和结束节点的图表;图24B是示出与表格组有关的节点图生成过程的图表,其中分别相应于表格A、B、C、D,E的节点NA、NB、NC、ND,及NE被连接起来;图24C是示出与表格组有关的节点图生成过程的图表,其中起始节点和结束节点被添加到图24B的节点图中;图24D是示出完成表格组的节点图生成过程的图表,在其中插入转换键;图24E是示出另一个表格组的节点图的图表;图25是示出状态转换图的示例的图表;图26是示出按表格组对状态转换进行分类的结果的表,在该状态转换图中状态转换键在分支节点之前; 图27是为了解释提取关键事件的提取方法的表;图28示出了在客户机上显示关键事件提取本文档来自技高网...

【技术保护点】
一种文档组分析设备,包括:搜索单元,其被配置为在保存有因果关系的文档组的文档数据库中搜索由搜索条件指定的文档;以及相关文档组提取单元,其被配置为提取由搜索条件指定的文档,以及提取所有与由搜索条件指定的和由搜索单元搜索到的文档 有因果关系的文档。

【技术特征摘要】
JP 2004-2-27 054838/041.一种文档组分析设备,包括搜索单元,其被配置为在保存有因果关系的文档组的文档数据库中搜索由搜索条件指定的文档;以及相关文档组提取单元,其被配置为提取由搜索条件指定的文档,以及提取所有与由搜索条件指定的和由搜索单元搜索到的文档有因果关系的文档。2.如权利要求1所述的文档组分析设备,进一步包括文档组分类单元,被配置为从由相关文档组提取单元提取的文档中收集有因果关系的文档,将收集的文档分为一组;以及以按文档的种类对收集和分组的文档进行分类。3.如权利要求2所述的文档组分析设备,进一步包括状态转换图产生单元,其被配置为生成状态转换图;其中按因果关系依次连接节点,每个节点与文档的种类之一相关联,且由属于与节点N1相关联的文档种类的文档表示从某个节点N1到另一个节点N2的状态转换键,将属于每个由文档组分类单元生成的类的文档组建成单个状态转换图,并合并在文档种类的单个状态转换图的转换模式中的共同部分。4.如权利要求3所述的文档组分析设备,进一步包括关键事件提取单元,其被配置为提取数据项作为关键事件;其中如果从一个节点的转换被分支为两个或多个后继节点,将始于分支节点的状态转换键和分支节点之前的一个或多个状态转换键组成的文档组成一组,对于每一个后续节点建立这样的组,对包含在每组文档中的数据项的值进行比较,且如果数据项的值仅存在于一组中,则将该数据项提取作为关键事件。5.如权利要求4所述的文档组分析设备,其中该文档具有信息,该信息是关于数据项是否为每种文档的关键事件提取的对象,且仅当数据项的信息表示该数据项是关键事件提取的对象时,关键事件提取单元执行提取。6.如权利要求1所述的文档组分析设备,其中文档组包括关于...

【专利技术属性】
技术研发人员:小岛裕一
申请(专利权)人:株式会社理光
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1