【技术实现步骤摘要】
一种裁判文书的分析方法、装置、计算机设备及存储介质
本专利技术涉及自然语言处理领域,具体涉及一种裁判文书的分析方法、装置、计算机设备及存储介质。
技术介绍
随着中国裁判文书网、中国审判流程信息公开网、中国执行信息公开网、中国庭审公开网等司法公开四大平台的建成运行,司法案件从立案、审判到执行,全部重要流程节点实现信息化、可视化、公开化,构建出开放、动态、透明、便民的阳光司法机制。大数据不仅包含结构化的数据类型,同样包含非结构化的文本数据,由司法公开形成的以裁判文书为重要组成部分的司法大数据具有重要的分析研究价值。对裁判文书的分析研究,通常分为两个步骤,即检索案件和挖掘信息。现有的针对裁判文书的分析研究装置或系统,多以罪名、案由、审理法院等裁判文书固有的结构化字段信息为检索条件和分析对象,不包括裁判文书的文段中记载的非结构化的案情特征、裁判特征等重要信息。因此,上述方法可分析的内容单一,仅可以简单地概括案件数量、案由、审理法院等通用特征,但是随着社会发展,出现许多新型纠纷或案件(如高空抛物、新型金融纠纷等),传统的法律专业通用特征词汇可能缺乏此类案件的相关词汇,进而无法对非结构化的信息进行有效的分析。
技术实现思路
鉴于上述传统的文书分析方法可分析的内容单一问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种裁判文书的分析方法、装置、计算机设备及存储介质。依据本专利技术的一个方面,提供一种裁判文书的分析方法,所述方法包括:从待分析裁判文书中获取 ...
【技术保护点】
1.一种裁判文书的分析方法,其特征在于,所述方法包括:/n从待分析裁判文书中获取待分析数据集;/n将所述待分析数据集分别输入至通用要素分析模型以及特征要素分析模型;/n基于通用要素分析模型确定所述待分析数据集中的通用要素信息,以及基于特征要素分析模型确定所述待分析数据集中的特征要素信息;所述通用要素信息为待分析裁判文书中所包含的基本信息;所述特征要素信息为待分析裁判文书中所包含的特定信息;/n基于所述通用要素信息以及特征要素信息输出分析结果。/n
【技术特征摘要】
1.一种裁判文书的分析方法,其特征在于,所述方法包括:
从待分析裁判文书中获取待分析数据集;
将所述待分析数据集分别输入至通用要素分析模型以及特征要素分析模型;
基于通用要素分析模型确定所述待分析数据集中的通用要素信息,以及基于特征要素分析模型确定所述待分析数据集中的特征要素信息;所述通用要素信息为待分析裁判文书中所包含的基本信息;所述特征要素信息为待分析裁判文书中所包含的特定信息;
基于所述通用要素信息以及特征要素信息输出分析结果。
2.根据权利要求1所述的一种裁判文书的分析方法,其特征在于,所述方法还包括:
将已知裁判文书依据案件类型进行分类并构造每一种案件类型的训练数据集;
将所述训练数据集输入卷积神经网络以输出对应案件类型的特征关键词信息;所述特征关键词信息包括:特征关键词本体以及特征关键词的位置信息;
基于所述特征关键词信息构建所述特征要素分析模型。
3.根据权利要求2所述的一种裁判文书的分析方法,其特征在于,基于特征要素分析模型确定所述待分析数据集中的特征要素信息包括:
根据所述特征要素分析模型得到特征要素的正则表达式;其中,所述特征要素为一组特征关键词信息;
基于所述正则表达式对所述待分析数据集进行识别以获得待分析数据集中的特征要素信息。
4.根据权利要求2所述的一种裁判文书的分析方法,其特征在于,构造每一种案件类型的训练数据集包括:
获取一种案件类型所对应的已知裁判文书的词语信息,以及所述词语信息对应的位置信息;所述位置信息包括:段落信息以及语句信息;
基于所述段落信息以及语句信息获取该词语信息的二维数组;
将多个二维数组向量化以形成矩阵形式的训练数据集。
5.根据权利要求1所述的一种裁判文书的分析方法,其特征在于,从待分析裁判文书中获取待分析数据集前,所述方法包括:
从待分析裁判文书中提取至少一个关键词信息;
基于所述关键词信息确定所述待分析裁判文书与所述特征要素分析模型是否匹配;
若是,则从待分析裁判文书中获取待分析数据集。
6.根据权利要求5所述的一种裁判文书的分析方法,其特征在于,从待分析裁判文书中提取至少一个关键词信息包括:
通过以下公式获取待分析裁判文书中任意词语信息的关联比重:
其中,表示该词语信息在待分析裁判文书中出现的词频,表示该词语信息在...
【专利技术属性】
技术研发人员:许建峰,孙福辉,陈奇伟,崔甲蓉,王晓燕,李晓慧,李俊慧,卓煜,袁琳,刘明胜,
申请(专利权)人:人民法院信息技术服务中心,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。