一种基于法理图规则引擎的法律概念识别方法技术

技术编号:22467663 阅读:33 留言:0更新日期:2019-11-06 11:29
本发明专利技术公开了一种基于法理图规则引擎的法律概念识别方法,本发明专利技术将代表法律专家知识的法律图和规则引擎结合起来,实现了逻辑关系推理的法律概念识别;本发明专利技术构建一个法律概念法理逻辑图,每个法律概念可以看成是法理图上的一个结点,法理图确定了法律概念间的逻辑关系,使用法理图来指导法律概念识别的逻辑正确性。本发明专利技术在生成法律概念规则树步骤中,将法律专家整理的规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性。本发明专利技术创造性的提出了BSFC算法,实现了法理图的广度优先条件遍历。

A method of legal concept recognition based on the rule engine of jurisprudential diagram

【技术实现步骤摘要】
一种基于法理图规则引擎的法律概念识别方法
本专利技术涉及自然语言分析处理
,涉及一种法律文本法律概念识别系统实现方法。
技术介绍
目前,实现类似法律概念识别这样的系统,主要是靠人工定义一套法律概念集,使用关键词定义其语义匹配模式,通过由关键词生成的正则表达式规则来匹配法律概念,这种方法由于其实现简单,准确性高等优势,为工业界普遍采用。但是,法律概念纷繁冗杂,需要考虑输入的法律文本是一个法律文书中的段落文本,还是一个口语化得法律问答文本;具体的案由和法律场景;法律概念之间的逻辑关系,如并列关系、互斥关系、推理关系等。综合考虑这些错综复杂的关系,才能实现一个较好的法律概念识别结果。现有技术中,这种方式的缺点是,简单基于正则表达式的模式匹配,准确率高,但是没有考虑法律概念间的逻辑依存和推理关系,得到的结果往往和最基本的逻辑相违背。究其原因是因为法律概念知识庞杂,很多法律概念存在互斥和推理的关系,一味的使用关键词匹配,不考虑它们之间的逻辑,就会出现明显的违背逻辑的情况。因此,本专利技术提供了一种基于法理图规则引擎的法律概念识别方法,以解决上述
技术介绍
中提出的问题。
技术实现思路
本专利技术的目的在于提供一种基于法理图规则引擎的法律概念识别方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于法理图规则引擎的法律概念识别方法,其特征在于,其包括以下步骤:(1)划分数据集:按照案由和场景将待处理的数据进行划分,这个是法律上的划分,方便后面处理;比如根据涉及的案由,法律文本可以分为刑事、民事、行政等。刑事案由,继续细分又可分成很多子类,如盗窃罪、抢劫罪、交通肇事罪等;民事案由又可以继续划分成离婚纠纷、合同纠纷等等。场景就是更加细分的问题域,比如民事案由下的离婚纠纷,可以根据具体情况继续划分,如请求财产分割、请求子女抚养权等(2)数据准备和预处理:法律专家使用法律概念编辑管理工具进行法律概念整理,主要是对法律概念识别的规则做基本限定,同时针对具体的法律场景,法律专家进行法律图的构建;(3)生成法律概念规则树:根据法律概念识别规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性;(4)集成法理图和规则树,生成法理图规则引擎;(5)在指定数据集上测试规则引擎;(6)抽样检查,并使用准确率、召回率、F1值进行评价;(7)如果评价结果未达标,则转到步骤(8),否则转到步骤(9);(8)调整规则树和法理图,转到步骤(4);(9)整理并交付数据。进一步,作为优选,在所述步骤(2)中,法律概念编辑管理工具至少能够实现法律概念的新建、修改、删除、查询功能。进一步,作为优选,在所述步骤(6)中,抽样检查采取两种抽样策略,一种是自助抽样,用于发现法律概念识别错误的样本;另一种是使用关联规则方法,用于发现未召回的错误样本。进一步,作为优选,在所述步骤(4)中,法理图上的结点包含场景结点、法律概念结点、逻辑结点、隐含的法律概念结点;其中场景结点表示一种细分的问题领域,比如离婚纠纷下分成请求分割财产、请求子女抚养权等具体的场景;法律概念结点指的是具体场景下的需要标注的法律概念,通常是专家总结的法律术语,比如请求分割财产场景下,‘房产’、‘婚前购买’、‘婚后购买’、‘房屋登记在一方名下’等等,都是属于法律概念。逻辑结点用于表示法理图上其他结点的关系,是一种边结点。如场景结点和法律概念结点之间的包含关系,法律概念结点和隐含的法律概念结点间的推理关系等。隐含的法律概念结点指的是那些不需要直接标注但能通过其他法律概念节点间接推理得到。如数值推理中,根据‘盗窃次数’的具体数值,可以推理出是否是‘多次盗窃’,交通肇事罪中,根据‘酒精含量’的具体数值,可以推理出是否是‘醉酒驾驶’。进一步,作为优选,在所述步骤(3)中,法律概念识别是对法律实践活动过程中产生的各种法律文件的内容进行概念识别,将非结构化或半结构化的法律文本转换成结构化的法律数据,并最终将这些法律数据用于支撑法条案例检索、法律问答、判案量刑、类案搜索需求。进一步,作为优选,规则引擎是应用系统中用来完成推理功能的模块,其包括调度器,执行器和一致性协调器三部分;调度器控制整个推理流程,使得推理可以按照一定的流程进行下去;执行器执行调度器所选定的动作,并且负责读取知识库中的知识和全局黑板中的信息;一致性协调器保持推理中间结果的一致性,主要用于反向推理中。进一步,作为优选,在所述步骤(4)中,对于法理图上的所有节点,采用基于广度优先遍历算法的基础上采用一种广度优先条件遍历算法,以便于在广度优先遍历的基础上,加入逻辑判断,针对逻辑结点的逻辑关系,确定其临接结点的遍历方式。与现有技术相比,本专利技术的有益效果是:(1)对每个法律概念构建规则树,定义法律概念的包括案由、场景、段落、关键词等限定规则,这部分用于实现单个法律概念的识别。同时,针对特定的场景,本专利技术构建一个法律概念法理逻辑图(以下简称法理图),每个法律概念可以看成是法理图上的一个结点,法理图确定了法律概念间的逻辑关系,使用法理图来指导法律概念识别的逻辑正确性(2)本专利技术在生成法律概念规则树步骤中,本专利技术将法律专家整理的规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性。在集成法理图和规则树,生成法理图规则引擎步骤中,实现了一个通用规则引擎框架,用于集成法律概念识别规则树和法理图的遍历逻辑,其中本专利技术创造性的提出了BSFC算法,实现了法理图的广度优先条件遍历。在抽样检查,并使用准确率、召回率、F1值进行评价步骤中,进行了抽样和评价,本专利技术创造性的使用关联规则挖掘方法,发现规则引擎未召回的法律文本样本,方便进一步的调整规则树和模型。附图说明图1为一种基于法理图规则引擎的法律概念识别方法的整体结构示意图;图2为一种基于法理图规则引擎的法律概念识别方法中的法律概念规则树的实施例结构示意图;图3为一种基于法理图规则引擎的法律概念识别方法中交通肇事法律概念识别法理逻辑结构图。图4为一种基于法理图规则引擎的法律概念识别方法的流程结构示意图;具体实施方式请参阅图1~4,本专利技术实施例中,一种基于法理图规则引擎的法律概念识别方法,其具体包括以下步骤:(1)划分数据集按照案由和场景将待处理的数据进行划分,这个是法律上的划分,方便后面处理;比如根据涉及的案由,法律文本可以分为刑事、民事、行政等。刑事案由,继续细分又可分成很多子类,如盗窃罪、抢劫罪、交通肇事罪等;民事案由又可以继续划分成离婚纠纷、合同纠纷等等。场景就是更加细分的问题域,比如民事案由下的离婚纠纷,可以根据具体情况继续划分,如请求财产分割、请求子女抚养权等(2)数据准备和预处理法律专家使用法律概念编辑管理工具进行法律概念整理,该工具实现法律概念的新建、修改、删除、查询等功能,,主要是对法律概念识别的规则做基本限定,比如交通肇事罪这个案由下面有一个法律概念酒后驾驶,对于这个法律概念,通常在‘一审指控’、‘本院认为’段落出现,并且法律文本中通常会包含‘酒后’‘饮酒’‘驾’等关键词出现,这些都是规则限定。同时针对具体的法律场景,法律专家进行法律图的构建。(3)生成法律概念规则树根据法律概念识别规则生成法律概念规则树,具体参见图2。计算机内部处理的规本文档来自技高网...

【技术保护点】
1.一种基于法理图规则引擎的法律概念识别方法,其特征在于,其包括以下步骤:(1)划分数据集:按照案由和场景将待处理的数据进行划分,这个是法律上的划分,方便后面处理;(2)数据准备和预处理:法律专家使用法律概念编辑管理工具进行法律概念整理,主要是对法律概念识别的规则进行编写,同时针对具体的法律场景,法律专家进行法律图的构建;(3)生成法律概念规则树和法理图:根据法律概念识别规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性;(4)集成规则树和法理图,生成法理图规则引擎;(5)在指定数据集上测试规则引擎;(6)抽样检查,并使用准确率、召回率、F1值进行评价;对于以上三个评价指标,先看一下混淆矩阵的概念

【技术特征摘要】
1.一种基于法理图规则引擎的法律概念识别方法,其特征在于,其包括以下步骤:(1)划分数据集:按照案由和场景将待处理的数据进行划分,这个是法律上的划分,方便后面处理;(2)数据准备和预处理:法律专家使用法律概念编辑管理工具进行法律概念整理,主要是对法律概念识别的规则进行编写,同时针对具体的法律场景,法律专家进行法律图的构建;(3)生成法律概念规则树和法理图:根据法律概念识别规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性;(4)集成规则树和法理图,生成法理图规则引擎;(5)在指定数据集上测试规则引擎;(6)抽样检查,并使用准确率、召回率、F1值进行评价;对于以上三个评价指标,先看一下混淆矩阵的概念实际/预测预测值=1预测值=0实际值=1TPFN实际值=0FPTN其中,TP表示真阳性,FP表示假阳性,FN表示假阴性,TN表示真阴性那么,准确率、召回率、F1值分别定义如下:准确率=(TP+TN)/(TP+TN+FN+TN)召回率=TP/(TP+FN)F1值=2*TP/(2*TP+FP+FN)(7)如果评价结果未达标,则转到步骤(8),否则转到步骤(9);(8)调整规则树和法理图,转到步骤(4);(9)整理并交付数据。2.根据权利要求1所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于,在所述步骤(2)、(3)、(4)中,法律概念规则编写和法理图的构建;法律概念规则的编写使用文本匹配规则编写语言,通过原子规则和逻辑组合生成复合规则;法理图的构建根据具体的案由和场景,采用推理、互斥等关系连接法律概念规则。3.根据权利要求2所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于一种可扩展的文本匹配的描述语言,其基于正则表达式的语法并加入了引用的功能,在这种可扩展的性在于在该文本中可以引用其他文本,增加表达的可复用性。4.根据权利要求2所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于,根据具体的案由和场景构建法理图,法理图上的结点包含场景结点、法律概念结点、逻辑结点、隐含的法律概念结点;其中场景结点表示一种细分的问题领域,比如离婚纠纷下分成请求分割财产、请求子女抚养权等具体的场景;法律概念结点指的是具体场景下的需要标注的法律概念,通常是专家总结的法律术语,比如...

【专利技术属性】
技术研发人员:倪有发杜向阳
申请(专利权)人:南京擎盾信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1