用于自动地标识文档中的潜在重要事实的系统及方法技术方案

技术编号:16287577 阅读:109 留言:0更新日期:2017-09-26 01:52
本文公开了用于标识从电子储存库获得的电子法律文档中的潜在重要事实语句的系统及方法。系统包括处理设备以及与所述处理设备通信的存储介质。所述存储介质包括编程指令,所述编程指令致使所述处理设备:获得文档并且解析所述文档内的文本以基于与所述文档中的每一个段落相关联的标题以及所述段落的特征中的至少一项判定所述段落是事实段落、讨论段落还是结果段落。所述存储介质进一步包括编程指令,所述编程指令致使所述处理设备:提取所述事实段落中的每一个语句,指示受训语句分类器基于每一个语句的特征判定所述语句是潜在重要事实语句还是非重要事实语句,以及标识潜在重要事实语句。

System and method for automatically identifying potentially important facts in a document

Systems and methods for identifying potentially important factual statements in electronic legal documents obtained from an electronic repository are disclosed. The system includes a processing device and a storage medium in communication with the processing device. The storage medium includes programming instructions, the programming instruction causes the processing equipment: text document and parses the document based on each paragraph in the document related to the title and the features of the paragraph in at least one of the judges that the paragraph is actually a paragraph, the discussion results or paragraph paragraph. The storage medium further includes programming instructions, the programming instruction causes the processing equipment: extraction of each statement as mentioned in the paragraph, indicating the characteristics of each classifier trained statement statement determines that the statement is based on potentially important factual statements or non important facts and statements, identify potential important facts and statements.

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求于2014年11月19日提交的标题为“用于自动标识文档中的潜在重要事实的系统及方法(SystemsandMethodsforAutomaticIdentificationofPotentialMaterialFactsinDocuments)”第62/081,786号美国临时专利申请的优先权,该申请通过引用以其整体结合在此。
技术介绍

对于各种法律事务,经常需要确定文档的重要事实,诸如例如法院意见书、答辩文档、要求文档等等。当研究法律事务时,人们可能希望找到具有类似的重要事实模式的其他案例。有时,难以隔离文档中的重要事实并且需要理解上下文。因此,需要从与特定的法律意见书相关的文档自动地确定并获得类似的重要事实。专利技术背景本公开的实施例自动地标识判例法意见书中的事实段落以及确定事实段落中的潜在重要事实语句。
技术实现思路
在一个实施例中,一种用于标识从电子储存库获得的电子法律文档中的潜在重要事实语句的系统包括:处理设备;以及与所述处理设备通信的非瞬态处理器可读存储介质。所述非瞬态处理器可读存储介质包括一个或多个编程指令,当被执行时,所述编程指令致使所述处理设本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201580063042.html" title="用于自动地标识文档中的潜在重要事实的系统及方法原文来自X技术">用于自动地标识文档中的潜在重要事实的系统及方法</a>

【技术保护点】
一种用于标识从电子储存库获得的电子法律文档中的潜在重要事实语句的系统,所述系统包括:处理设备;以及非瞬态处理器可读存储介质,其与所述处理设备通信,所述非瞬态处理器可读存储介质包括一个或多个编程指令,所述一个或多个编程指令当被执行时致使所述处理器设备:从储存库获得电子法律文档,解析所述电子法律文档内的文本以基于与所述法律文档中的一个或多个段落中的每一个段落相关联的标题以及所述每一个段落的一个或多个特征中的至少一项判定所述每一个段落是事实段落、讨论段落还是结果段落,以及针对所述一个或多个段落中作为事实段落的每一个段落:提取所述事实段落中的一个或多个语句中的每一个语句,指示受训语句分类器基于所述一个...

【技术特征摘要】
【国外来华专利技术】2014.11.19 US 62/081,7861.一种用于标识从电子储存库获得的电子法律文档中的潜在重要事实语句的系统,所述系统包括:处理设备;以及非瞬态处理器可读存储介质,其与所述处理设备通信,所述非瞬态处理器可读存储介质包括一个或多个编程指令,所述一个或多个编程指令当被执行时致使所述处理器设备:从储存库获得电子法律文档,解析所述电子法律文档内的文本以基于与所述法律文档中的一个或多个段落中的每一个段落相关联的标题以及所述每一个段落的一个或多个特征中的至少一项判定所述每一个段落是事实段落、讨论段落还是结果段落,以及针对所述一个或多个段落中作为事实段落的每一个段落:提取所述事实段落中的一个或多个语句中的每一个语句,指示受训语句分类器基于所述一个或多个语句中的每一个语句的一个或多个特征来判定所述每一个语句是潜在重要事实语句还是非重要事实语句,以及基于判定从所述一个或多个语句标识一个或多个潜在重要事实语句。2.如权利要求1所述的系统,其中,所述每一个语句的所述一个或多个特征选自由以下各项组成的组:名词短语的数量、动词短语的数量、日期的数量、时间戳的数量、货币值的数量、下级法院行为的数量、当前法院行为的数量、原告行为的数量、法律短语的数量、法律概念的数量、非重要事实单词的数量以及非重要事实短语的数量。3.如权利要求1所述的系统,其中,所述受训语句分类器通过对所述一个或多个语句中的每一个语句运行自然语言解析器来判定所述一个或多个语句中的每一个语句是潜在重要事实语句还是非重要事实语句从而确定所述每一个语句的所述一个或多个特征。4.如权利要求1所述的系统,其中,所述受训语句分类器通过基于支撑向量机算法从训练数据中生成的受训模型对所述一个或多个特征打分来判定所述一个或多个语句中的每一个语句是潜在重要事实语句还是非重要事实语句。5.如权利要求1所述的系统,其中,所述受训语句分类器通过基于决策树算法从训练数据中生成的受训模型对所述一个或多个特征打分来判定所述一个或多个语句中的每一个语句是潜在重要事实语句还是非重要事实语句。6.如权利要求1所述的系统,其中,所述受训语句分类器通过基于朴素贝叶斯算法从训练数据中生成的受训模型对所述一个或多个特征打分来判定所述一个或多个语句中的每一个语句是潜在重要事实语句还是非重要事实语句。7.如权利要求1所述的系统,其中,所述受训语句分类器通过基于一组堆叠分类器算法从训练数据中生成的受训模型以及从一个或多个基分类器输出的数据对所述一个或多个特征打分来判定所述一个或多个语句中的每一个语句是潜在重要事实语句还是非重要事实语句。8.如权利要求1所述的系统,其中,所述标题是事实标题、讨论标题或结果标题。9.如权利要求1所述的系统,其中,所述段落的所述一个或多个特征选自由以下各项组成的组:所述段落的位置、案例的数量、法规的数量、过去时态动词的数量、当前法院单词的数量、下级法院单词的数量、法律短语的数量、被告单词的数量、原告单词的数量、日期的数量、信号单词的数量以及注脚的数量。10.一种用于标识从电子储存库获得的电子法律文档中的潜在重要事实语句的方法,所述方法包括:由处理设备从储存库获得电子法律文档;由所述处理设备解析所述电子法律文档内的文本以基于与所述法律文档中的一个或多个段落中的每一个段落相关联的标题以及所述每一个段落的一个或多个特征中的至少一项判定所述每一个段落是事实段落、讨论段落还是结果段落;以及针对所述一个或多个段落中作为事实段落的每一个段落:由所述处理设备提取所述事实段落中的一个或多个语句中的每一个语句,由所述处理设备指示受训语句分类器基于所述一个或多个语句中的每一个语句的一...

【专利技术属性】
技术研发人员:M·佩蒂亚拉G·奥斯古德J·A·迈尔斯
申请(专利权)人:里德爱思唯尔股份有限公司雷克萨斯尼克萨斯分公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1