基于案例文本的裁判规则知识抽取方法及系统技术方案

技术编号:30524862 阅读:56 留言:0更新日期:2021-10-27 23:09
本发明专利技术是一种以案例文本为知识来源的规则图谱构建方法,主要针对法院审理的刑事、民事、行政一审、二审、再审案件的裁判文书,根据裁判文书的业务内容特征、裁判文书制作规范、裁判文书半结构化特征、法律规则的构成特征、类型特征,设计了一种裁判规则图谱的信息模型,提出了一种构建法律术语的方法、一种识别规则的分类方法和一种识别规则类型的方法,最终实现裁判规则图谱的构建,输出XML结构化文档,使得计算机系统能够有效利用案例文本中存在的裁判规则来开展立法、执法和司法应用,并在裁判文书纠错、裁判文书质量评查、案件质量监督、司法办案法条推送等领域中发挥作用。监督、司法办案法条推送等领域中发挥作用。监督、司法办案法条推送等领域中发挥作用。

【技术实现步骤摘要】
基于案例文本的裁判规则知识抽取方法及系统


[0001]本专利技术涉及法律知识工程
,特别是涉及一种基于案例文本的裁判规则知识抽取方法及系统。

技术介绍

[0002]法律规则是采取一定的结构形式具体规定人们的法律权利、法律义务以及相应的法律后果的行为规范。法律规则一般在法律法规文本中以自然语言的方式来表示,但基于法律法规立法技术的要求,法律法规文本中的法律规则表述具有概括性和抽象性,相当于本体的存在,在法律适用中需要针对具体场景进行法律规则中的法律术语的操作化映射和推理,特别是在司法裁判过程中,为阐明当前案件的法律推理过程,需要将法律规则进一步操作化为具体规则,相当于针对本体的实体存在,以匹配当前案件的法律关系。在裁判文书中将这个过程记录下来,就形成更具有操作性的裁判规则。可以说,裁判规则是一个更具体和具有操作性的实体法律规则。在裁判文书中,裁判规则也是以自然语言的方式来表示,这种知识表示方式对于计算机系统来说不具有良好的可读性,需要将案例文本中存在的裁判规则以规则图谱的方式来重新表示。因此,从案例文本中抽取裁判规则图谱的技术,是实现计算机本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于案例文本的裁判规则知识抽取方法,其特征在于,包括:根据裁判文书的书写规范与文书结构,按诉讼程序的业务标准,将文书由粗到细切分为多层级的文本片,设计文书的切片模型;根据裁判规则可能出现的切片位置,利用中文本分层切片的成果基础上,采用基于规则和深度学习混合的算法模型,实现对裁判规则所在自然语言片段的切片模型的设计和算法实现;根据裁判规则的业务特征,设计裁判规则结构模型;在自有法律术语库基础上,针对法规文本语料、裁判文书文本语料,采用专家词库、基于规则的自举法和混合的模式,构建法律术语库;利用构建的法律术语库,基于深度学习的关系抽取模型,构建法律术语概念图谱,图谱采用标准的三元组存储;针对识别为“裁判规则”的裁判规则切片语料,根据裁判规则模型中的不同类型特征,融合法律术语库,采用基于规则和深度学习混合的方法,识别“裁判规则切片”中的法律术语之间的关系,并根据裁判规则结构模型,生成裁判规则切片语料中存在的裁判规则,并记录裁判规则与语料的链接关系;按照抽取的法律规则的类型,在对应的法律规则结构模型中进行存储。2.根据权利要求1所述的基于案例文本的裁判规则知识抽取方法,其特征在于,根据裁判文书的书写规范与文书结构,按诉讼程序的业务标准,将文书由粗到细切分为多层级的文本片,设计文书的切片模型,包括:总结司法文书书写规范和文书结构,将文书各段落按照逻辑关系划分出多层级的文本片,对裁判文书的一级文本片进行分析,包括“文本首部”、“当事人基本信息段”、“案件由来段”、“诉辩信息段”、“案件事实段”、“裁判分析过程段”、“判决结果段”和“文本尾部”;设计文书切片模型用以存储文书各逻辑段,每个逻辑段包含若干个细切片。根据每个段落所包含的细切片,设计文书切片模型,如图所示,每个细切片内容用字符串类型存储,并以包含的内容给文本片命名,例如“案件事实段”、“证据细切段”,整个切片模型采用树状结构存储。3.根据权利要求1所述的基于案例文本的裁判规则知识抽取方法,其特征在于,根据裁判规则可能出现的切片位置,利用中文本分层切片的成果基础上,采用基于规则和深度学习混合的算法模型,实现对裁判规则所在自然语言片段的切片模型的设计和算法实现,包括:总结裁判规则可能出现的目标切片位置,指向“案件事实推理段”、“证据认证段”、“事实争议焦点认定段”、“裁判要旨段”、“法律争议焦点认定段”;基于裁判规则的业务内涵、所在位置特征、语义特征,采用基于规则的NLP算法模型,实现对案例文本目标切片段落中的裁判规则切片的提取;对提取的裁判规则切片文本,在案件xml整体模型中,以“裁判规则切片”节点来存储,并同时记录切片的原文位置。4.根据权利要求1所述的基于案例文本的裁判规则知识抽取方法,其特征在于,根据裁判规则的业务特征,设计裁判规则结构模型,包括:结合裁判规则的构成要素、裁判规则的强制力属性、规范内容,设计裁判规则的结构模
型。5.根据权利要求4所述的基于案例文本的裁判规则知识抽取方法,其特征在于,结合裁判规则的构成要素、裁判规则的强制力属性、规范内容,设计裁判规则的结构模型,包括:设计标准裁判规则的结构模型,包括行为条件、行为模式、法律后果三组要素组成,每组要素组分成单因素和多因素两种类,在结构模型上支持两种类型的存储,并且设计多因素情况下因素之间的逻辑类型,行为条件、行为模式、法律后果的要素包括定性要素和定量要素两种类型,定量要素支持定量值和定量值区间两种模式,裁判规则的结构模型中的三组要素,行为条件、行为模式可以缺省其一;设计非标准裁判规则的结构模型,某一个行为条件、行为模式也可以作为上述结构模型中的法律后果要素,其他行为条件和行为模式作...

【专利技术属性】
技术研发人员:陈浩
申请(专利权)人:北京法意科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1