文档检索和分类方法及其装置制造方法及图纸

技术编号:2882466 阅读:223 留言:0更新日期:2012-04-11 18:40
在文档检索和分类系统中,在文件数据库中根据用户输入的检索条件执行检索操作,从而可以获得想要检索的文件;允许用户根据通过检索操作所检索到的文件输入多个分类的分类标准;该分类标准被转换成检索条件。计算由分类标准转换而来的检索条件和由通过检索操作所检索到的文件之间的相似性。然后,参考相似性计算每一个通过检索操作所检索到的文件的属性,从而对各检索到的文件进行分类,使之具有最高的属性。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种从贮存一系列电子文件数据的数据库中搜索所需文件的文档检索及其分类方法。此外,本专利技术还涉及执行本专利技术中的文档检索及其分类方法的一种文档检索及其分类系统。本专利技术适用于储存在数据库中的不同种类的文档信息,例如装配在字处理器上的存储设备、办公计算机、个人计算机等等,以及可加载到它们上的信息存储媒体。数据通信领域最近的发展,包括电子邮件、电子目录和电子出版物,为用户提供了大量的文档信息。此外,互联网用户的数目也在急剧增长。这样,从如此巨大的数据库中搜索或收集所需文件的要求便不断增长。同时,对精选出的所需文件进行分类的需要也在增长。然而根据传统的文档检索和分类系统,检索条件和分类标准通常是预先固定的或根据用户的喜好确定。在这方面,传统的文档检索和分类系统在检索条件和分类标准的立足点上是固定不变的。本专利技术的目的之一在于提高文档检索和分类的灵活性。本专利技术的另一个目的是允许用户任意改变检索条件和分类标准的立足点。本专利技术的另一个目的是允许用户根据他们对检索结果的即刻判断来执行检索和分类操作。本专利技术的另一个目的是实现自动分类来支持用户的智力活动。为完成上述及其他相关的目标,本专利技术提供第一类文档检索和分类系统,它包括允许用户输入检索条件和分类标准的输入输出装置。检索装置用于在文件数据库中根据包含任意字的检索条件执行检索操作,以及计算由检索操作和检索条件检索到的文件之间的相似性。检索结果存储装置用于存储由检索操作所检索到的文件。分类标准转换装置用来将分类标准转换为检索条件。分类标准由一组任意字来表达。检索结果分类装置用来按照多个分类标准对由检索操作检索到的文件进行分类。这样,本专利技术就能够提供一种灵活的文档检索和分类系统,从而可以协助文档检索和分类期间的智力活动。根据本专利技术的最佳实施例,检索装置响应用户通过输入/输出装置输入的检索条件,并根据用户输入的检索条件在文件数据库中执行检索操作。检索结果存储装置存储通过检索装置的检索操作所检索到的文件。分类标准转换装置响应用户通过输入/输出装置输入的多个分类标准,并根据输入的分类标准产生转换所得的检索条件。检索装置计算转换所得的检索条件和通过检索操作所检索到的并储存在检索结果存储装置中的文件之间的相似性。而且,检索结果分类装置参考检索装置根据每一分类标准所计算出的相似性,计算每一个通过检索操作所检索到的文件的属性,从而进行文献分类。通过这种安排,当用户在检索操作时脑中出现这样的词时,他们就能够任意地输入检索条件。而且,用户能够随心所欲地对检索结果进行任意分类。根据本专利技术的最佳实施例,输入/输出装置允许用户输入多个分类标准,每一个都包含一组任意字,然后分类标准转换装置将这一组任意字转换成检索条件。通过这种安排,用户能够输入脑中出现的任意字作为分类标准(也就是分类立足点)。这样,设置分类立足点就有了很大的灵活性。根据本专利技术的最佳实施例,文档检索和分类系统又进一步包含了一种关键字查找装置,来将关键字从一个任意的句子或文件中提取出来。在这种情况下,关键字查找装置响应用户通过输入/输出装置输入的任意的句子所表达的多个分类标准,并将关键字从输入的句子中提取出来。然后分类标准转换装置将提取出来的那一组关键字转换成检索条件。通过这种安排,用户能够直接输入属于有意作为分类标准字段的任意一个句子,这使得表达多个分类立足点成为可能。这样,分类立足点多方面的设置就能够灵活地实现。根据本专利技术的最佳实施例,指定/输出装置允许用户指定多个文件作为分类标准。这些指定文件从通过检索操作所检索到的文件中选出。关键字查找装置将关键字从这些指定文件中提取出来。然后,分类标准转换装置将提取出来的这组关键字转换成检索条件。通过这种安排,当用户已经证实了通过检索操作所检索到的文件后,用户就能够选择检索到的文件的全部或部分来表达分类立足点。这样,分类立足点的设置就可以轻易实现。此外,本专利技术提供第二类文档检索和分类系统,它包含一个允许用户输入检索条件的输入/输出装置。检索装置用于在文件数据库中根据包含任意字的检索条件执行检索操作,以及计算由检索操作和检索条件所检索到的文件之间的相似性。检索结果存储装置用于存储由检索操作所检索到的文件。关键字查找装置用于将关键字从通过检索操作所检索到的文件中提取出来。关键字自动分类装置用于将提取出的关键字分到一系列群中去。分类标准转换装置用来将分类标准转换为检索条件。每一项分类标准都是一组分到各个群中去的关键字。检索结果分类装置用来按照多个分类标准对由检索操作所检索到的一组文件进行分类。这样,本专利技术就能够提供一个自动文档检索和分类系统,从而可以协助文档检索和分类期间的智力活动。根据本专利技术的最佳实施例,检索装置响应用户通过输入/输出装置输入的检索条件,并根据用户输入的检索条件在文件数据库中执行检索操作。检索结果存储装置存储检索装置通过检索操作所检索到的文件。关键字查找装置用于将关键字从通过检索操作所检索到的文件中提取出来。关键字自动分类装置自动将提取出来的关键字分到一系列群中去。分类标准转换装置产生由分类标准修改所得的检索条件,各个分类标准都是一组分到各个群中的关键字。检索装置计算转换所得的检索条件和通过检索操作所检索到的并储存在检索结果存储装置中的文件之间的相似性。然后,检索结果分类装置参考检索装置根据每一分类标准所计算的相似性,计算每个通过检索操作所检索到的文件的属性,从而进行文献分类。通过这种安排,可以自动将检索结果中内在的分类立足点提取出来,而不用依赖用户输入分类标准。用户可以自动获得意想不到的分类立足点,不需要特别的努力。结果便可以有效地协助文献分类工作。此外,本专利技术提供第一类文档检索和分类方法,它包含以下几步在文件数据库中根据用户输入的检索条件执行检索操作,从而可以获得想要检索到的文件;允许用户根据通过检索操作所检索到的文件输入多个分类的分类标准;将分类标准转换成检索条件;计算由分类标准和通过检索操作所检索到的文件得到的转换所得的检索条件之间的相似性;以及参考此相似性,计算通过检索操作所检索到的文件的属性,从而对各检索到的文件进行分类,使之具备最高的属性。通过这种方法,当用户在检索操作时脑中出现这样的词时,他们就能够任意地输入检索条件。而且,用户能够随心所欲地对检索结果进行任意分类。这样,本专利技术就能够支持文档检索和分类期间的智力活动。根据本专利技术的最佳实施例,当用户为了各个分类的分类标准而输入一组任意字时,输入的该任意字就被转换成检索条件,而且转换所得的检索条件和通过检索操作所检索到的文件之间的相似性也会被计算。通过这种方法,用户能够输入脑中出现的任意字作为分类标准(也就是分类立足点)。这样,设置分类立足点就有了很大的灵活性。根据本专利技术的最佳实施例,用户输入一个任意的句子作为各个分类的分类标准时,该句子中的关键字就被提取出来,提取出来的该组关键字被转换成检索条件,然后计算转换所得的检索条件和通过检索操作所检索到的文件之间的相似性。通过这种方法,用户能够直接输入属于有意作为分类标准的字段的任意一个句子,这使得表达多个分类立足点成为可能。这样,分类立足点多方面的设置就能够灵活地实现。根据本专利技术的最佳实施例,用户在通过检索操作所检索到的文件之中指定多个文件作为各个分本文档来自技高网...

【技术保护点】
文档检索和分类系统包含:允许用户输入检索条件和分类标准的输入/输出装置;在文件数据库中根据包含任意字的所述检索条件执行检索操作,以及计算由检索操作和所述检索条件所检索到的文件之间的相似性的检索装置;存储所述通过检索操作检索到的文 件的检索结果存储装置;将分类标准转换成检索条件的分类标准,由一组任意字表示;按照多个分类标准对所述由检索操作检索到的文件进行分类的检索结果分类装置。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:野口直彦菅野祐司佐藤光弘伊藤快福重贵雄稻叶光昭
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1