目标检索电子文献集合中多章节文献的方法、系统和设备技术方案

技术编号:8026915 阅读:191 留言:0更新日期:2012-11-29 13:02
本发明专利技术涉及用于高效和有效地检索电子文献集合的方法、系统和产品。在该集合中的各个文献事先被划分成子章节,为各个文献中的各章节中的一个或者其组合生成一个静态文献向量。针对提交至文献集合的查询字符串生成动态文献向量。基于查询的参数,通过将动态文献向量与所选静态文献向量进行比较,来选择各个文献的子章节。基于落入动态文献向量的范围内的所有相关的静态文献向量,生成IP文献的汇编。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及电子文献集合,并响应于查询的接收,检索电子文献集合。更具体地,本专利技术涉及对每篇文献的多个章节进行分类,并响应于集合中的文献的所分类章节,有效处理查询。
技术介绍
所有用于注册或审查的知识产权文献(包括专利、商标和版权申请)必须提交给指定受理这些申请的政府机构。提交给政府专利部门以用于审查的专利申请必须满足某些要求,这些要求包括每件专利必须被认为是新颖的、实用的和非显而易见的。即使不是全部,但大多数的国外专利部门都采用相似的标准。为了恰当地准备用于审查的专利申请,知晓相关
中的先前专利(即,现有技术)是有益的,这是因为一项专利技术仅授予一项专 利权。确定现有技术的过程被称为专利检索。专利检索的结果通常有助于随后专利申请的任何撰写人将精力集中到能被授权的主题上,并有助于制定一套合理的策略,以实现该专利技术人或者专利权所有人的目标。众所周知,在技术革命进入到当今的电子信息时代之前,通过人工进行专利检索。检索者将浏览专利公开内容,并根据专利分类系统来确定该专利公开内容的分类位置,并然后进行检索。随着信息技术的到来,由于所有的专利和出版的专利申请仅以电子形式存在,所以不再使用纸质检索。即使对于电子形式的专利文献,仍然可以采用与手工检索类似的方式,对电子专利数据库进行检索。可以采用不同级别的检索,以获得不同的结果。例如,可以采用新颖性检索以确定是否提交专利申请。可以采用产品确权检索以确定产品是否被目前专利的权利要求所覆盖。可以采用无效检索以判断专利提出的权利要求是否有效,等等。过去的电子检索工具不支持不同级别的检索。因而,检索人(也称为检索者)需要承担如下工作量根据检索的范围,在检索时限制专利文献中需要浏览的章节。由于数据库中的专利和公布的专利申请的数量不断增加,所以每次检索需要浏览更多的专利和公布的专利申请,从而增加了检索的工作量。因此,检索者需要使用一种用来减轻检索及相关检索范围方面的工作量的工具。该工具应当能够使检索者在检索过程中均衡利用专利文献的不同章节,从而更高效和有效地得到精确的和期望的检索结果。
技术实现思路
本专利技术包括用于高效和有效地检索诸如专利文献等知识产权文献的集合的方法、系统和广品。一方面,本专利技术提供了一种用于检索电子文献集合的计算机方法。对知识产权文献的集合进行汇编,其中所述集合中的各个所述知识产权文献包括多个章节。例如,在为所述进行集合编制索引时,为所述集合中的各个专利文献获得至少一个文献向量。所述文献向量的所述获得包括为所述集合中的各个文献生成至少一个静态文献向量。在向所述集合提交查询时,基于与查询输入一起提交的字符串生成动态文献向量。通过向集合提交查询输入,将所述查询输入有关的所述动态文献向量与所述集合中的各个静态文献向量进行比较。基于所述动态文献向量与所述集合中的所述静态文献向量的所述比较,返回关联专利文献的汇编。另一方面,本专利技术提供了一种计算机系统,所述计算机系统设有处理器,所述处理器与存储介质通信,在所述存储介质上保存电子文献集合。所述电子文献集合是专利或者其它知识产权文献的汇编。基于专利文献的特性,所述集合中的各个所述专利文献具有多个章节。在编制索引时,为集合中的各个专利文献获得至少一个文献向量。所述文献向量的所述获得包括为所述文献集合中的各个专利文献生成至少一个静态文献向量。在查询时,基于查询输入中的字符串数据,生成动态文献向量。在生成所述动态文献之后,向所述电子专利文献集合提交所述查询输入。响应于向所述专利文献集合提交的所述查询输入,与输入管理器通信的查询管理器将所述动态文献向量与所述集合中的各个静态文献向量相比较。在所述查询管理器所进行的所述提交之后,基于所述动态文献向量与所述静态文献向量的所述比较,返回关联专利文献的汇编。·又一方面,本专利技术提供了一种具有计算机可读载体的产品,所述计算机可读载体包括用于检索计算机存储器上的电子文献集合的计算机程序指令。所述计算机可读载体包括在文献集合上执行的计算机程序指令。所述指令用于对所述专利文献的集合进行汇编。所述集合中的各个所述专利文献划分成多个章节。在为所述集合编制索引时,提供用于为所述集合中的各个专利文献获得至少一个文献向量的指令。所述获得包括为所述文献集合中的各个专利文献生成至少一个静态文献向量。在向所述集合提交查询时,提供用于基于查询输入中的字符串数据生成动态文献向量的指令。在生成所述动态文献向量之后,向所述电子文献集合提交所述查询,以便将所述动态文献向量与所述集合中的各个静态文献向量进行比较。通过提交所述查询,基于所述动态文献向量与所述集合中的所述静态文献向量的所述比较,返回的关联专利文献的汇编。通过下面结合附图而对本专利技术的优选实施例进行的详细描述,将更清楚地了解本专利技术的其它特征和优点。附图说明这里参照的附图构成说明书的一部分。除非明确说明,附图所示的特征仅用于说明本专利技术的某些实施例,但并不是说明本专利技术的所有实施例。另外,这不含有与之相反的意思。图I是表示检索电子文献集合的流程图,更具体地,是表示检索与专利和专利出版物有关的集合的流程图;图2是表示向专利文献集合提交查询的整体过程的流程图;图3是表示使用停止词(stop word)以进一步解析专利文献集合中的静态文献向量的过程的流程图;图4是表示针对集合中的各个专利文献生成多个文献向量的过程的流程图;图5是表示本专利技术的优选实施例的向具有多个文献向量的文献集合提交查询的过程的流程图,并建议将本图印刷在公告专利的扉页上;图6是表示所采用的用于向电子合提交查询的一组工具的框图;以及图7是用于指定用户输入以检索电子文献集合的图形用户界面的框图。具体实施例方式应容易理解,这里,可以通过不同的配置来布置和设计本专利技术的如在附图中概述及图示的组件。因此,如附图所示,下文对本专利技术的设备、系统和方法的详细说明仅是选自本专利技术的有代表性的实施例,而不是要限制本专利技术要求保护的范围。本说明书中描述的功能单元称作管理器。管理器可以在诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑器件等可编程硬件器件中实现。管理器也可以在由各种处理器执行的软件中实现。例如,由可执行代码构成的等同管理器可以包括一个或多个物理块或逻辑块的计算机指令,这些计算机指令可以被构建成例如对象、程序、函数或其他结构。 尽管如此,等同管理器的可执行文件无需物理地放置在一起,而是可以包括存储在不同位置的不同指令,当这些指令逻辑地联合在一起时,则它们组成管理器并实现管理器的规定目标。事实上,由可执行代码构成的管理器可以是一条指令或多条指令,甚至可以分布于多个不同的代码段、不同的应用程序、及多个不同的存储器中。同样地,这里,操作数据可以在管理器的范围内进行等同和说明,其可以实施为任何适当的形式,也可以构建成任何适当类型的数据结构。操作数据可以集成为单个数据集合,或可以分布到包括不同存储器在内的不同位置,还可以至少部分地作为电子信号存在于系统或网络上。整个说明书中所提到的“所选实施例”、“一个实施例”或“实施例”意味着,结合该实施例所描述的特定特点、结构、或者特征包含在本专利技术的至少一个实施例中。因此,在整个说明书中的各处出现的用语“所选实施例”、“在一个实施例中”或“在实施例中”不一定是指同一个实施例。而且,在一个或多个实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:贾森·大卫·雷斯尼克兰迪·W·拉卡斯
申请(专利权)人:CPA软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1