用于执行法律简要分析的方法和系统技术方案

技术编号:37429610 阅读:29 留言:0更新日期:2023-04-30 09:49
一种方法,包含:在计算设备处接收电子文档,其中电子文档是包括多个段落的法律简要;从多个段落中标识一个或多个论据段落,其中一个或多个论据段落中的每一个论据段落包含一个或多个法律论据;基于所标识的论据段落的所选择的集合来对法律文档的语料库执行文本搜索;基于所标识的论据段落的所选择的集合来对法律文档的语料库执行语义搜索;组合文本搜索的结果和语义搜索的结果;并将所组合的结果呈现给用户。现给用户。现给用户。

【技术实现步骤摘要】
【国外来华专利技术】用于执行法律简要分析的方法和系统
[0001]相关申请的交叉引用
[0002]本申请要求2020年6月30日提交的标题为“法律简要分析系统和方法(Legal Brief Analysis Systems and Methods)”的美国临时申请No.63/046,148的优先权,其全部内容通过引用并入本文。


[0003]本公开总体上涉及文档搜索,并且更特别地涉及用于执行法律简要分析的方法和系统。

技术介绍

[0004]在起草法律简要时,律师或其他专业人士可能会呈现与多个法律主题相关的论据。这些论据典型地通过引用判例法和其他法律权威被加强。因此,针对与简要中所呈现的论据相关的主题执行判例法的搜索可以是可期望的。
[0005]当前存在多个用于搜索判例法的工具。然而,这些工具总体上需要用户输入要被搜索的法律主题。因此,可能需要法律简要的起草者在这些工具之一中顺序地执行与法律简要相关联的每个主题的搜索。自动地执行与法律简要中所讨论的所有法律主题相关的搜索并将搜索功能性集成到单词处理器或被用于撰写简要的其他程序中可能是优选的。...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:在计算设备处接收电子文档,其中所述电子文档是包括多个段落的法律简要;从所述多个段落中标识一个或多个论据段落,其中所述一个或多个论据段落中的每一个论据段落包含一个或多个法律论据;基于所标识的论据段落的所选择的集合来对法律文档的语料库执行文本搜索;基于所述所标识的论据段落的所选择的集合来对所述法律文档的语料库执行语义搜索;组合所述文本搜索的结果和所述语义搜索的结果;以及将所组合的结果呈现给用户。2.如权利要求1所述的方法,进一步包括:将所述多个段落转换为多个逻辑段落;以及从所述多个逻辑段落中标识所述一个或多个论据段落。3.如前述任一项权利要求所述的方法,其中,从所述多个段落中标识所述一个或多个论据段落包括:确定所述多个段落中的每个段落的特征嵌入;以及将每个段落的所述特征嵌入输入到经训练的机器学习模型中。4.如权利要求3所述的方法,其中,所述机器学习模型被训练以使用有监督学习技术、基于段落的特征嵌入来预测所述段落是否是论据段落。5.如权利要求4所述的方法,其中,所述机器学习模型使用包括来自法律简要的多个段落的训练数据来训练;其中,所述多个段落的子集被标记为论据段落。6.如权利要求3

5中的任一项所述的方法,其中,每个段落的所述特征嵌入基于所述段落中所包含的多个单词的术语频率

逆文档频率分数。7.根据权利要求3

6中的任一项所述的方法,其中,从所述多个段落中标识所述一个或多个论据段落进一步包括将与所述多个段落相关联的元数据输入到所述机器学习模型中。8.如前述任一项权利要求所述的方法,其中,执行所述文本搜索包括:将论据段落的文本与所述语料库的索引的文本进行比较;以及基于比较来返回所述语料库中的一个或多个文档的分数。9.如前述任一项权利要求所述的方法,其中,执行所述语义搜索包括:确定论据段落的一个或多个单词的向量表示;将所述论据段落的所述一个或多个单词的向量表示与所述语料库的索引的向量表示进行比较;以及基于比较来返回所述语料库中的一个或多个文档的分数。10.如权利要求9所述的方法,其中,将所述论据段落的所述一个或多个单词的向量表示与所述语料库的所述索引的向量表示进行比较包括:使用近似最近邻搜索标识所述语料库的多个文档;以及确定所述论据段落的所述一个或多个单词的向量表示与使用所述近似最近邻搜索所标识的文档的向量表示之间的余弦相似性。11.如前述任一项权利要求所述的方法,其中,组合所述文本搜索的结果和所述语义搜索的结果包括:
基于所述文本搜索来接收与所述语料库的第一多个文档中的每一个相关联的文本搜索分数,其中,所述文本搜索分数指示论据段落与所述语料库中的文档之间的文本相似性;基于所述文本搜索来接收与所述语料库的第二多个文档中的每一个相关联的语义搜索分数,其中,所述语义搜索分数指示论据段落与所述语料库中的文档之间的语义相似性;归一化所述文本搜索分数和所述语义搜索分数;以及基于所归一化的文本搜索分数和所归一化的语义搜索分数来对来自所述第一多个文档和所述第二多个文档的文档进行排名。12.如前述任一项权利要求所述的方法,其中,将所述所组合的结果呈现给所述用户包括:基于所组合的搜索结果来显示与所述语料库的一个或多个文档相关联的信息;以及其中,与所述语料库的所述一个或多个文档中的每一个相关联的所述信息被定位于与所述所标识的论据段落中使所述文档作为搜索结果被返回的段落相邻。13.如前述任一项权利要求所述的方法,进一步包括:显示与所组合的搜索结果相关联的多个法律概念;从所述用户接收不被包括在所述搜索结果中的、所述多个法律概念的所选择的集合;基于所述多个法律概念而不包括所述所述多个法律概念的所选择的集合来执行所述语料库的第二文本搜索和所述语料库的第二语义搜索;组合所述第二文本搜索的结果和所述第二语义搜索的结果;以及将所述第二文本搜索和所述第二语义搜索的所组合的结果呈现给所述用户。14.一种系统,包括:处理设备;以及非暂态处理器可读存储介质,所述非暂态处理器可读存储介质包括被存储在其上的一个或多个编程指令,当所述一个或多个编程指令被执行时,使所述处理设备:接收电子文档,其中所述电子文档是包括多个段落的法律简要;从所述多个段落中标识一个或多个论据段落,其中,所述一个或多个论据段落中的每一个论据段落包含一个或多个法律论据;基于所标识的论据段落的所选择的集合来对法律文档的语料库执行文本搜索;基于所述所标识的论据段落的所选择的集合来对所述法律文档的语料库执行语义搜索;组合所述文本搜索的结果和所述语义搜索的结果;以及将所组合的结果呈现给用户。15.如权利要求14所述的系统,其中,所述编程指令进一步使所述处理设备:将所述多个段落转换为多个逻辑段落;以及从所述多个逻辑段落中标识所述一个或多个论据段落。16.如权利要求14

15中的任一项所述的系统,其中,所述编程指令进一步使所述处理设备:确定所述多个段落的每个段落的特征嵌入;以及将每个段落的所述特征嵌入输入到经训练的机器学习模型中。17.如权利要求16所述的系统,其中,所述机器学习模型被训练以使用有监督学习技
术、基于段落的特征嵌入来预测所述段落是否是论据段落。18.如权利要求17所述的系统,其中,所述机器学习模型使用包括来自法律简要的多个段落的训练数据来训练,其中,所述多个段落的子集被标记为论据段落。19.如权利要求16

18中的任一项所述的方法,其中,每个段落的所述特征嵌入基于所述段落中所包含的多个单词的术语频率

逆文档频率分数。20.如权利要求16

19所述的系统,其中,所述编程指令进一步使所述处理设备将与所述多个段落相关联的元数据输入到所述机器学习模型中。21.如权利要求14

20中的任一项所述的系统,其中,所述编程指令进一步使所述处理设备通过以下步骤来执行所述文本搜索:将论据段落的文本与所述语料库的索引的文本进行比较;以及基于比较来返回所述语料库中的一个或多个文档的分数。22.如权利要求14

21中任一项所述的系统,其中,所述编程指令进一步使所述处理设备通过以下步骤来执行所述语义搜索:确定论据段落的一个或多个单词的向量表示;将所述论据段落的所述一个或多个单词的向量表示与所述语料库的索引的向量表示进行比较;以及基于所确定的余弦相似性来返回所述语料库中的一个或多个文档的分数。23.如权利要求22所述的系统,其中,将所述论据段落的所述一个或多个单词的向量表示与所述语料库的所述索引的向量表示进行比较包括:使用近似最近邻搜索标识所述语料库的多个文档;...

【专利技术属性】
技术研发人员:S
申请(专利权)人:雷克斯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1