当前位置: 首页 > 专利查询>派特拉公司专利>正文

扩展分类索引以及分类文档的检索制造技术

技术编号:2829999 阅读:406 留言:0更新日期:2012-04-11 18:40
索引和检索分类文档的系统,其在文档记录中插入先前应用的分类的关键字、标题或定义,将得到的记录提供给搜索引擎(200)。检索者可以从分类系统中通过关键字检索而无需检索分类编码。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及已应用分类编码和方案的文档的索引和检索,具体涉及专利文档的索引和检索。
技术介绍
知识产权机构使用一个或多个分类和/或索引方案对申请和文档进行分类是标准做法。例如,美国专利商标局(USPTO)对其专利申请使用美国专利分类(USPC)系统和国际专利分类(IPC)系统。类似的,欧洲专利局对其专利申请使用欧洲分类系统(ECLA)和IPC,日本专利局(JPO)对其专利申请使用文件索引系统(FI)和F-Terms系统。 更宽泛的,信息和数据库供应者常常开发不同的编码方案,在他们的服务中提供且建立索引的文档中应用这些方案。例如,由Reed Elsevier制造的数据库BIOBASE中使用了专有分类编码系统ESBIOBASE[ONLINE]。[2004-03-17查询获得]。信息地址<http://www.cas.org/ONLINE/DBSS/esbiobasess.html> 这些分类和索引系统对于快速检索和处理信息是不可或缺的。它们是高效审查专利申请的必要工具。它们的应用结合了高度的智能输入。 但不幸的是,多数分类和索引系统十分深奥复杂。有效的使用需要高级别的培训。例如,欧洲专利局审查员在允许在无指导情况下使用ECLA系统进行在先技术检索前要接受两年的ECLA培训。美国专利分类和日本F-Term系统也有类似的复杂度。 此外,即使在专利信息领域内,对三方专利局的熟练检索需要检索者对每个国家或地区分类系统的分别学习和检索。换句话说,检索者需要学习ECLA以检索EPO文档,学习美国分类以检索美国专利文档,学习FI和F-term系统以检索JPO文档。甚至这样做所需的工具和资源也缺乏。例如,在JPO F-term系统中没有英文索引。在最近的一次研讨会中(FUJI,Yoshihiro的报告“Providing Japanesepatent information to non-Japanese users”(“为非日本用户提供日本专利信息”)Far East Meets West in Vienna EPIDOS Users’Meeting onJapanese Patent Information,2003-10-23,Vienna,Austria(Post-presentation discussion)),一位JPO专利审查员建议使用如下过程来为所检索的特定概念确定合适的FI类首先,在EPO网站(http://v3.espacenet.com/eclasrch?CY=ep&LG=en)上确定合适的ECLA类。其次,假定ECLA和FI之间基本相同,然后在JPO网站(http://www4.ipdl.jpo.go.jp/Tokujitu/tjftermenb.ipdl)检索相应的FI类。这个过程很繁琐且易出错。 结果是,分类和索引系统的优势无法为更广大的用户和信息专业人员掌握。 另一方面,因特网上提供的基于全文的专利检索服务飞速增长,使得外行和信息专业人员同样逐渐依赖关键字进行检索。关键字检索有它的优势,易于使用,但是术语的变化很容易导致漏掉文档。此外,内嵌在文档分类上的知识产权产品完全丢失了。 在相关领域,DIALOG上的D&B Duns市场标识数据库(http://library.dialog.com/bluesheets/html/bl0516.html)提供检索SIC描述符作为一个检索域。TRADEMARKSCAN提供检索国际分类 描述符 作为 一 个 检 索域(http://library.dialog.com/bluesheets/html/bl0669.html)。 附图说明 图1文档服务器-搜索引擎-客户环境的概念描述 图2根据本专利技术的文档服务器网站的典型硬件和软件配置 图3英国的公共搜索引擎 图4传统的分类文档 图5根据本专利技术的分类文档 图6根据本专利技术的插入第二种语言分类信息的分类文档 图7根据本专利技术的分类信息表格 图8根据优选实施例的分类信息表格 图9根据第4实施例的生成文档存储的过程 图10在文档中插入分类信息的过程 图11根据第5实施例的生成文档存储的过程 图12根据优选实施例的生成文档存储的过程 要解决的问题 本专利技术旨在使分类检索为信息用户所用,而无需强迫用户学习细节,具体而言,是不同分类系统的编码方案和格式。
技术实现思路
本专利技术提供通过搜索引擎对分类文档进行检索和索引,其中部分分类编码用从分类系统的清单和定义中获得的插入的术语、关键字、标题或定义进行了补充。 本专利技术的一方面是用于分类文档的索引和检索的系统,该系统包含至少一个连接至文档存储的服务器计算机,所述文档存储包含至少一个从文档汇总得到的静态文档,其中至少已经应用了一种分类系统编码,所述文档包含至少一个从所述编码标题或定义得到的关键字;以及服务器计算机与至少一个搜索引擎系统之间的连接。此外,静态文档可以是HTML或XML格式。此外,从该分类系统得到的术语可以使用与该文档存储中文档不同的语言。此外,该文档存储中的文档可以是专利文档。此外,服务器计算机与客户计算机之间可以相连。 本专利技术的另一方面是用于分类文档索引和检索的系统,该系统包含至少一个与文档存储相连的服务器计算机,所述文档存储包含至少一个从文档汇总得到的静态文档,其中至少已经应用了一种分类系统编码,所述静态文档包含至少一个与所述编码的标题和/或定义对应的检索关键字;数据库系统,包含至少一个从所述分类系统编码的标题和/或定义得到的术语;服务器计算机与至少一个搜索引擎系统之间的连接;将所述术语动态插入该静态文档中以及响应于该搜索引擎系统发出的请求,将结果文档传回该搜索引擎系统的装置。此外,该静态文档可以使用HTML、XML、PDF或MSWord格式。此外,从该分类系统得到的术语可以使用与该文档存储中文档不同的语言。此外,该文档存储中的文档可以是专利文档。此外,服务器计算机与客户计算机之间可以相连。 本专利技术的另一方面是用于分类文档索引和检索的计算机处理方法,其包含如下的方法步骤响应搜索引擎系统的请求,从文档存储获得文档,所述文档存储包含至少一个从文档汇总得到的静态文档,其中已经应用了至少一种分类系统编码,所述文档包含至少一个从所述编码得到的标题或定义的术语;将所述文档传送给该搜索引擎系统。此外,该静态文档可以是HTML、XML、PDF或MSWord格式。此外,从该分类系统得到的术语可以使用与该文档存储中文档不同的语言。此外,该文档存储中的文档可以是专利文档。此外,服务器计算机与客户计算机之间可以相连。 本专利技术的另一方面是用于分类文档索引和检索的计算机处理方法,其包含如下方法步骤“响应搜索引擎系统的请求从文档存储获得文档,所述文档存储包含至少一个从文档汇编得到的静态文档,其中已经应用了至少一种分类系统编码,所述文档包含至少一个与所述编码标题和/或定义对应的检索码;从数据库检索至少一个从所述分类系统编码的标题和/或定义得到的术语;将所述术语动态插入该静态文档;以及将该结果文档传送给该搜索引擎系统。此外,该静态文档可以是HTML或XML格式。此外,从本文档来自技高网
...

【技术保护点】
索引和检索分类文档的系统,该系统包括,至少一台服务器计算机;至少一个文档汇总,所述文档汇总包含至少一个文档,所述文档根据预定义分类方案分类,所述预定义分类方案包含分类编码,所述分类编码包含标题和定义;至少一个服务器网页应用程序;以及至少一个搜索引擎系统;其中所述服务器计算机与所述搜索引擎相连,并且其中所述服务器网页应用程序从所述文档汇总传输文档至所述搜索引擎;其中所述文档增加至少一个分类编码标题或分类编码定义。

【技术特征摘要】
【国外来华专利技术】US 2004-10-8 10/960,7251.索引和检索分类文档的系统,该系统包括,至少一台服务器计算机;至少一个文档汇总,所述文档汇总包含至少一个文档,所述文档根据预定义分类方案分类,所述预定义分类方案包含分类编码,所述分类编码包含标题和定义;至少一个服务器网页应用程序;以及至少一个搜索引擎系统;其中所述服务器计算机与所述搜索引擎相连,并且其中所述服务器网页应用程序从所述文档汇总传输文档至所述搜索引擎;其中所述文档增加至少一个分类编码标题或分类编码定义。2.根据权利要求1的索引和检索分类文档的系统,其中所述文档为一种格式,所述格式从包括下列格式的组中选取HTML、XML、PDF和MSWord。3.根据权利要求1的索引和检索分类文档的系统,其中所述文档使用第一语言,其中至少一个分类编码标题或分类编码定义使用第二语言。4.根据权利要求1的索引和检索分类文档的系统,其中该系统进一步包括至少一台客户端计算机,其中所述客户端计算机与所述服务器计算机相连。5.索引和检索分类文档的系统,该系统包括,至少一台服务器计算机,至少一个文档汇总,所述文档汇总包含至少一个文档,所述文档根据预定义分类方案分类,所述预定义分类方案包含分类编码,所述分类编码包含标题和定义,所述文档进一步包含至少一个检索关键字,其中所述检索关键字对应所述分类编码标题或分类编码定义的至少一个,至少一个服务器网页应用程序,以及至少一个搜索引擎系统,其中所述服务器计算机与所述搜索引擎相连,并且其中所述服务器网页应用程序从所述文档汇总传输文档至所述搜索引擎;以及装置,用于将所述术语动态插入至所述文档,以创建加上标签的文档,其中所述插入操作是响应于来自所述搜索引擎的请求,其中所述加上标签的文档被传输至所述搜索引擎。6.根据权利要求5的索引和检索分类文档的系统,其中所述文档为一种格式,所述格式从包括下列格式的组中选取HTML、XML、PDF和MSWord。7.根据权利要求5的索引和检索分类文档的系统,其中所述文档使用第一语言,其中所述术语使用第二语言。8.根据权利要求5的索引和检索分类文档的系统,其中该系统进一步包含至少一台客户端计算机,其中所述客户端计算机与所述服务器计算机相连。9.根据权利要求1的索引和检索分类文档的系统,其中该系统进一步包含至少一台客户端计算机,其中所述客户端计算机与所述服务器计算机相连,其中所述加上标签的文档被传输至所述客户端计算机。10.索引和检索分类文档的计算机化方法,包含从文档汇总中检索文档,所述文档根据预定义的分类方案分类,所述预定义分类方案包含分类编码,所述分类编码包含标题和定义,其中所述检索操作响应于来自搜索引擎的请求,并且其中所述文档增加至少一个分类编码标题或分类编码定义,以及将所述文档传输至所述搜索引擎。11.根据权利要求10的索引和检索分类文档的计算机化方法,其中所述文档为一种格式,所述格式从包括下列格式的组中选取HTML、XML、PDF和MSWord。12.根据权利要求10的索引和检索分类文档的计算机化方法,其中所述文档使用第一语言,并且其中至少一个分类编码标题或分类编码定义使用第二语言。13.根据权利要求10的索引和检...

【专利技术属性】
技术研发人员:A恩格尔
申请(专利权)人:派特拉公司
类型:发明
国别省市:US[美国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1