一种裁判文书的分析方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:29673537 阅读:16 留言:0更新日期:2021-08-13 21:55
本发明专利技术提供了一种裁判文书的分析方法、装置、计算机设备及存储介质,分析方法包括:从待分析裁判文书中获取待分析数据集;将所述待分析数据集分别输入至通用要素分析模型以及特征要素分析模型;基于通用要素分析模型确定所述待分析数据集中的通用要素信息,以及基于特征要素分析模型确定所述待分析数据集中的特征要素信息;所述通用要素信息为待分析裁判文书中所包含的基本信息;所述特征要素信息为待分析裁判文书中所包含的特定信息;基于所述通用要素信息以及特征要素信息输出分析结果。本发明专利技术将分析划分为通用要素和特征要素,可以根据不同的要素把握案件和矛盾的特征规律,找准法律风险点和治理盲区,分析社会治理中的热点、重点和难点问题。

【技术实现步骤摘要】
一种裁判文书的分析方法、装置、计算机设备及存储介质
本专利技术涉及自然语言处理领域,具体涉及一种裁判文书的分析方法、装置、计算机设备及存储介质。
技术介绍
随着中国裁判文书网、中国审判流程信息公开网、中国执行信息公开网、中国庭审公开网等司法公开四大平台的建成运行,司法案件从立案、审判到执行,全部重要流程节点实现信息化、可视化、公开化,构建出开放、动态、透明、便民的阳光司法机制。大数据不仅包含结构化的数据类型,同样包含非结构化的文本数据,由司法公开形成的以裁判文书为重要组成部分的司法大数据具有重要的分析研究价值。对裁判文书的分析研究,通常分为两个步骤,即检索案件和挖掘信息。现有的针对裁判文书的分析研究装置或系统,多以罪名、案由、审理法院等裁判文书固有的结构化字段信息为检索条件和分析对象,不包括裁判文书的文段中记载的非结构化的案情特征、裁判特征等重要信息。因此,上述方法可分析的内容单一,仅可以简单地概括案件数量、案由、审理法院等通用特征,但是随着社会发展,出现许多新型纠纷或案件(如高空抛物、新型金融纠纷等),传统的法律专业通用特征词汇可能缺乏此类案件的相关词汇,进而无法对非结构化的信息进行有效的分析。
技术实现思路
鉴于上述传统的文书分析方法可分析的内容单一问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种裁判文书的分析方法、装置、计算机设备及存储介质。依据本专利技术的一个方面,提供一种裁判文书的分析方法,所述方法包括:从待分析裁判文书中获取待分析数据集;将所述待分析数据集分别输入至通用要素分析模型以及特征要素分析模型;基于通用要素分析模型确定所述待分析数据集中的通用要素信息,以及基于特征要素分析模型确定所述待分析数据集中的特征要素信息;所述通用要素信息为待分析裁判文书中所包含的基本信息;所述特征要素信息为待分析裁判文书中所包含的特定信息;基于所述通用要素信息以及特征要素信息输出分析结果。优选的,所述方法还包括:将已知裁判文书依据案件类型进行分类并构造每一种案件类型的训练数据集;将所述训练数据集输入卷积神经网络以输出对应案件类型的特征关键词信息;所述特征关键词信息包括:特征关键词本体以及特征关键词的位置信息;基于所述特征关键词信息构建所述特征要素分析模型。优选的,基于特征要素分析模型确定所述待分析数据集中的特征要素信息包括:根据所述特征要素分析模型得到特征要素的正则表达式;其中,所述特征要素为一组特征关键词信息;基于所述正则表达式对所述待分析数据集进行识别以获得待分析数据集中的特征要素信息。优选的,构造每一种案件类型的训练数据集包括:获取一种案件类型所对应的已知裁判文书的词语信息,以及所述词语信息对应的位置信息;所述位置信息包括:段落信息以及语句信息;基于所述段落信息以及语句信息获取该词语信息的二维数组;将多个二维数组向量化以形成矩阵形式的训练数据集。优选的,从待分析裁判文书中获取待分析数据集前,所述方法包括:从待分析裁判文书中提取至少一个关键词信息;基于所述关键词信息确定所述待分析裁判文书与所述特征要素分析模型是否匹配;若是,则从待分析裁判文书中获取待分析数据集。优选的,从待分析裁判文书中提取至少一个关键词信息包括:通过以下公式获取待分析裁判文书中任意词语信息的关联比重:其中,表示该词语信息在待分析裁判文书中出现的词频,表示该词语信息在待分析裁判文书中出现的次数,表示待分析裁判文书中的全部词语信息的数量;表示待分析裁判文书的总数,表示待分析裁判文书中出现该词语信息的文书数;基于所述关联比重确定一个或多个关键词信息。优选的,基于所述关键词信息确定所述待分析裁判文书与所述特征要素分析模型是否匹配包括:计算所述关键词信息命中所述特征关键词信息的命中率;当所述命中率大于预设阈值时,则所述待分析裁判文书与所述特征要素分析模型匹配。依据本专利技术的另一个方面,提供一种裁判文书的分析装置,所述装置包括:第一获取单元,用于从待分析裁判文书中获取待分析数据集;数据输入单元,用于将所述待分析数据集分别输入至通用要素分析模型以及特征要素分析模型;数据分析单元,用于基于通用要素分析模型确定所述待分析数据集中的通用要素信息,以及基于特征要素分析模型确定所述待分析数据集中的特征要素信息;所述通用要素信息为待分析裁判文书中所包含的基本信息;所述特征要素信息为待分析裁判文书中所包含的特定信息;结果输出单元,用于基于所述通用要素信息以及特征要素信息输出分析结果。优选的,所述装置包括:第二获取单元,用于获取一种案件类型所对应的已知裁判文书的词语信息,以及所述词语信息对应的位置信息;所述位置信息包括:段落信息以及语句信息;第三获取单元,用于基于所述段落信息以及语句信息获取该词语信息的二维数组;第四获取单元,用于将多个二维数组向量化以形成矩阵形式的训练数据集。优选的,所述装置包括:信息提取单元,用于从待分析裁判文书中提取至少一个关键词信息;要素匹配单元,用于基于所述关键词信息确定所述待分析裁判文书与所述特征要素分析模型是否匹配;第五获取单元,用于若是,则从待分析裁判文书中获取待分析数据集。依据本专利技术的另一个方面,提供一种裁判文书的分析装置,一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项的方法。依据本专利技术的另一个方面,提供一种裁判文书的分析装置,一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述任一项的方法。本专利技术中一种裁判文书的分析方法可以快速高效地深入挖掘全量裁判文书中记录的信息,将分析方向划分为通用要素和特征要素,可以根据不同的要素把握案件和矛盾的特征规律,找准法律风险点和治理盲区,分析社会治理中的热点、重点和难点问题,从而以司法统计数据为依据,使研究者能够有针对性地从司法领域提出建议和对策,为科学决策提供数据支撑。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中一种裁判文书的分析方法流程图;图2为本专利技术实施例中一种裁判文书的分析方法流程图;图3为本专利技术实施例中一种裁判文书的分析装置结构示意图;<本文档来自技高网...

【技术保护点】
1.一种裁判文书的分析方法,其特征在于,所述方法包括:/n从待分析裁判文书中获取待分析数据集;/n将所述待分析数据集分别输入至通用要素分析模型以及特征要素分析模型;/n基于通用要素分析模型确定所述待分析数据集中的通用要素信息,以及基于特征要素分析模型确定所述待分析数据集中的特征要素信息;所述通用要素信息为待分析裁判文书中所包含的基本信息;所述特征要素信息为待分析裁判文书中所包含的特定信息;/n基于所述通用要素信息以及特征要素信息输出分析结果。/n

【技术特征摘要】
1.一种裁判文书的分析方法,其特征在于,所述方法包括:
从待分析裁判文书中获取待分析数据集;
将所述待分析数据集分别输入至通用要素分析模型以及特征要素分析模型;
基于通用要素分析模型确定所述待分析数据集中的通用要素信息,以及基于特征要素分析模型确定所述待分析数据集中的特征要素信息;所述通用要素信息为待分析裁判文书中所包含的基本信息;所述特征要素信息为待分析裁判文书中所包含的特定信息;
基于所述通用要素信息以及特征要素信息输出分析结果。


2.根据权利要求1所述的一种裁判文书的分析方法,其特征在于,所述方法还包括:
将已知裁判文书依据案件类型进行分类并构造每一种案件类型的训练数据集;
将所述训练数据集输入卷积神经网络以输出对应案件类型的特征关键词信息;所述特征关键词信息包括:特征关键词本体以及特征关键词的位置信息;
基于所述特征关键词信息构建所述特征要素分析模型。


3.根据权利要求2所述的一种裁判文书的分析方法,其特征在于,基于特征要素分析模型确定所述待分析数据集中的特征要素信息包括:
根据所述特征要素分析模型得到特征要素的正则表达式;其中,所述特征要素为一组特征关键词信息;
基于所述正则表达式对所述待分析数据集进行识别以获得待分析数据集中的特征要素信息。


4.根据权利要求2所述的一种裁判文书的分析方法,其特征在于,构造每一种案件类型的训练数据集包括:
获取一种案件类型所对应的已知裁判文书的词语信息,以及所述词语信息对应的位置信息;所述位置信息包括:段落信息以及语句信息;
基于所述段落信息以及语句信息获取该词语信息的二维数组;
将多个二维数组向量化以形成矩阵形式的训练数据集。


5.根据权利要求1所述的一种裁判文书的分析方法,其特征在于,从待分析裁判文书中获取待分析数据集前,所述方法包括:
从待分析裁判文书中提取至少一个关键词信息;
基于所述关键词信息确定所述待分析裁判文书与所述特征要素分析模型是否匹配;
若是,则从待分析裁判文书中获取待分析数据集。


6.根据权利要求5所述的一种裁判文书的分析方法,其特征在于,从待分析裁判文书中提取至少一个关键词信息包括:
通过以下公式获取待分析裁判文书中任意词语信息的关联比重:



其中,表示该词语信息在待分析裁判文书中出现的词频,表示该词语信息在...

【专利技术属性】
技术研发人员:许建峰孙福辉陈奇伟崔甲蓉王晓燕李晓慧李俊慧卓煜袁琳刘明胜
申请(专利权)人:人民法院信息技术服务中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1