响应来自用户的查询的方法和系统技术方案

技术编号:7344479 阅读:222 留言:0更新日期:2012-05-17 19:56
本发明专利技术公开了响应来自用户的查询的方法和系统。为了便于法律研究,诸如ThomsonWest的公司提供了基于订阅的在线信息检索系统。为了寻求提高这些以及相关的IR系统,本发明专利技术人意识到研究者常常忽略可能对他们有用的一些文档类型,诸如法律百科全书和论文。因此,本发明专利技术人设计了自动搜索不被用户查询特别当作目标的其它类型的文档的系统、方法和软件。一个示范系统自动地递交对于法律意见的用户查询给第一和第二数据库,第一数据库存储法律意见,并且第二数据库存储非意见文档,诸如来自WestKeyNumber系统的批注、来自美国法律报告的文章、和/或来自美国法学的文章。

【技术实现步骤摘要】

本专利技术的各种实施例涉及信息检索系统,诸如提供法律文档或其它相关内容的那些。
技术介绍
美国法律体系以及世界各地的一些其它法律体系很大程度上依赖于书面司法意见、书面法官宣判,以便明白地表达或解释支配(govern)争议解决的法律。每个司法意见不仅对解决特殊的法律争议重要,而且对在将来解决类似的争议或者案件重要。因为这点, 我们的法律体系内的法官和律师不断地对日益膨胀的大量的过去意见、或者案例法进行研究,找出与新争议的解决最相关的那些。为了便于这些搜索,St.Paul 的 West Publishing 公司,Minnesota (进行如 Thomson West那样的商业活动)从跨美国的各个法院收集司法意见,并且使得它们可以通过它的flfestlaw 信息检索系统以电子方式得到。(Westlaw是Thomson West的商标。)这些意见中的很多是带有对其它意见的文献目录引用或超链接来发表的,该其它意见是依赖于这些意见中的各种法律点或者是对这些意见中的各种法律点进行评判。引用和超链接使研究者能找到包含相关意见或者通过计算机网络容易地以电子方式访问的相关意见的印刷册。Westlaw系统使得用户能够搜索1亿多文档。本专利技术人所意识到的、对于该有效且非常成功的系统的至少一个问题是除了意见以外,还存在很多其它类型的文档,它们可能对法律研究者有用,但是常常被忽略。例如,一些用户没有充分利用West Key Number 系统,该系统提供了在司法意见中做出的法律点的分类概要(West Key Number是Hiomson West的商标)。称为批注(headnote)的概要被分类到90,000个以上不同的法律种类,并且可被用于各种目的,诸如评价法律意见与特定法律问题的相关度。其它的则忽略了次级资源,诸如美国法律报告(American Law R印orts,ALR),其包括大约4,000篇深入的学术文章,每篇都教授了关于一个独立的法律问题。因此,本专利技术人已经认识到对用于法律文档的信息检索系统的改进的需要。
技术实现思路
为了解决这个和/或其它需要,本专利技术人设计了响应于对法律意见的查询而便于相关非意见法律文档的检索的系统、方法和软件。一个示范系统自动将对于法律意见的用户查询递交给第一和第二数据库,第一数据库存储法律意见并且第二数据库存储非意见文档,诸如来自West Key Number系统的批注、来自美国法律报告的文章和/或来自美国法学 (American Jurisprudence)的文章。系统中的第一搜索引擎基于该查询而在第一数据库中搜索相关的法律意见。第二搜索引擎搜索第二数据库两次第一次基于用户查询以及第二次基于来自第一搜索引擎的结果。在一些实施例中,第一搜索引擎是常规的tf-idf (单文本词汇频率一逆文本频率)搜索引擎,以及第二搜索引擎是基于合成矢量的分类器。来自第一和第二数据库的结果都经由图形用户界面呈现给用户,该图形用户界面在分开的区域、窗格或窗口中显示结果。在其它实施例中,第二数据库提供了专题讨论文、州实践指南(state practice guides)、法令和/或法律评论文章以扩充案例法数据库的搜索。而且,其它实施例增加了法令搜索、规章搜索、次级(secondary)材料搜索以及新闻搜索。一些实施例为访问第二数据库的文档收取独立的或者附加的费用。附图说明图1是相应于本专利技术的一个或多个实施例的示范信息检索系统100的图2是相应于操作系统100以及本专利技术的一个或多个实施例的一种或多种示范方法的流程图;以及图3是相应于本专利技术的一个或多个实施例的示范查询窗口 300的复制; 图4是相应于本专利技术的一个或多个实施例的示范用户界面400的复制。图5是相应于本专利技术的一个或多个实施例的示范用户界面500的复制。图6是相应于本专利技术的一个或多个实施例的示范用户界面600的复制。图7是用于相应于本专利技术的一个或多个实施例的次级搜索模块的示范结构和工作流程图。图8是用于相应于本专利技术的一个或多个实施例的文本分类器的示范结构或工作流程图。具体实施例方式参考并结合上述图的本说明描述了专利技术的一个或多个具体实施例。这些被提供来不是限制而是仅仅例证和教授本专利技术的实施例足够详细地被示出和描述以使本领域的技术人员能实现或实践本专利技术。因此,在适当之处为避免混淆本专利技术,本说明将忽略本领域技术人员已知的一些信息。另外,本文档引入以下项作为参考2002年12月23日提交的美国临时专利申请 60/436,191(律师案号962. 021PRV) ;2001年12月21日提交的美国专利申请10/027,914(律师案号962.015US1);2002年12月30日提交的美国临时专利申请60/437,169 (律师案号962.016PRV)以及2003年6月19日提交的美国临时专利申请60/480,476 (律师案号 962. 016PR0)。本申请的一个或多个实施例可以组合或者另外通过参考申请中的教义来扩充而产生其它实施例。示范信息检索系统图1示出了示范在线信息检索系统100。系统100包括一个或多个数据库110、一个或多个服务器120以及一个或多个访问设备130。数据库110包括一组主数据库112和一组第二数据库114。在示范实施例中,主数据库112包括案例法数据库1121和法令数据库1122,其分别包括来自一个或多个地方、 州、联邦和/或国际管辖区域的司法意见和法令。次级数据库114,包含次级法律机关的法律文档或更普遍地从属于主数据库中司法或立法机关提供的那些的法律文档,该次级数据库包括ALR (美国法律报告)数据库1141、AMJUR数据库1142、West Key Number (KNUM)分类数据库1143、以及法律评论(LREV)数据库1144。其它实施例可能包括非法律数据库,其包括财政、科学或保健信息。此外,在一些实施例中,主和次级意味着搜索结果的呈现次序, 而不是必定意味着搜索结果的权威性或可信性。表现为一个或多个电子、磁或光数据存储设备的示范形式的数据库110包括或者另外与各自的索引(未示出)相关联。每个索引包括与相应的文档地址相关联的术语和短语、标识符和其它常规信息。数据库110经由诸如局域网、广域网、专用网或者虚拟专用网的无线或有线通信网络被耦合到或者能够被耦合到服务器120。服务器120通常代表用来服务于带有关联小应用程序、ActiveX控制、远程调用对象或者其它相关软件和数据结构的网页形式或者其它标记语言形式的数据的一个或多个服务器,以服务于不同“厚度(thickness)”的客户。更具体地,服务器120包括处理器模块 121、存储器模块122、订户数据库123、主搜索模块124、次级搜索模块125以及用户界面模块 126ο处理器模块121包括一个或多个本地或分布式处理器、控制器或虚拟机。在示范实施例中,处理器模块121采取任何便利的或者期望的形式。表现为一个或多个电子、磁或光数据存储设备的示范形式的存储器模块122存储订户数据库123、主搜索模块124、次级搜索模块125以及用户界面模块126。订户数据库123包括订户相关的数据,用于控制、掌管并管理数据库110的帐单到期即付(pay -as- you 一 go)或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
...

【专利技术属性】
技术研发人员:迈克尔·达恩卡利德·阿尔科法伊彼得·杰克逊
申请(专利权)人:汤姆森路透社全球资源公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术