一种基于司法大数据多特征映射的案件量预测方法及系统技术方案

技术编号:36785188 阅读:11 留言:0更新日期:2023-03-08 22:26
本发明专利技术公开了一种基于司法大数据多特征映射的案件量预测方法及系统。本方法为:1)收集所选法院司法案件的司法案件特征数据,包括结构化特征属性数据和非结构化文书特征属性数据;2)收集每一所选法院所对应城市的经济侧数据;3)利用所述司法案件特征数据、经济侧数据训练CNN

【技术实现步骤摘要】
一种基于司法大数据多特征映射的案件量预测方法及系统


[0001]本专利技术属于计算机软件技术及人工智能
,具体涉及一种基于司法大数据多特征映射的案件量预测方法及系统。

技术介绍

[0002]目前,最高人民法院已建成人民法院大数据管理和服务平台,实现了全国四级法院审判执行数据自下而上的实时汇聚并统一管理,形成了世界上最大、最丰富的司法大数据资源,人民法院利用传统的数据统计等手段实现了法院精细化管理。在司法大数据简单应用阶段,人民法院通过协议等技术手段与其他领域数据实现了互联互通、拓展融合,对于数据的挖掘进一步加强,通过通用的数据分析技术不仅能够分析某一区域的宏观情况,而且还可以就某一类特定案件或者某一特定要素,例如:时间、地域、人群等,进行多维度、多角度的详细分析,而且对于解决多因素关联和不确定性分析与预测很有优势。
[0003]在司法大数据的复杂应用中,传统的分析特定要素和案件之间的关联,并得出要素对于案件结果影响的数据分析方法,已不能满足分析类案特点、揭露纠纷根源和成因、为多元纠纷解决机制资源配置提供参考。在这种情况下,如何建立起案件、案由、罪名到当事人、案情、裁判、法官等要素,再到案件时间、空间、特征等变量的映射关系和量化计算模型,成为了有待解决的问题。
[0004]现有的司法大数据分析技术与模型主要是面向法院内部的审判管理以及针对案情的某一特征来进行汇总统计及可视化分析,主要是基于收结案数量来进行分析预测,其分析的数据主要是源于已有的司法信息化数据法标库,包括组织结构、人员构成、案件统计、立案信息、承办法官、审限变更情况等案情特征信息数据,能够分析的案件关联属性较为固定,一些和实际案情相关的数据并不能获取,而这些数据主要集中反映在司法卷宗或文书内容中;同时现有的一些对案件量的预测分析也主要是采用简单的神经网络技术,仅仅考虑较少的分析维度,如案件数量、经办法院等指标进行回归预测,预测的准确性还不够高,无法很好的通过分析预测、通过多维数据去反映更深层次的问题。

技术实现思路

[0005]针对现有技术中存在的问题,本专利技术的目的在于提供一种基于司法大数据多特征映射的案件量预测方法及系统。本专利技术主要利用人工智能神经网络技术来改进原有司法数据的获取及预测方法。本专利技术通过对更多的案件案情实体属性数据进行多维度的全面分析,更加准确预测相关案件量,在此基础上通过模型预测相关指标案件量,以此对经济社会运行难点和法院审判执行运行重点进行分析,为政府与法院的决策者提供更加科学的、全面的决策参考,从而达到辅助司法裁判、助力司法管理、化解矛盾纠纷、服务社会治理的研究目的。
[0006]本专利技术的技术方案为:
[0007]一种基于司法大数据多特征映射的案件量预测方法,其步骤包括:
[0008]1)收集所选法院司法案件的司法案件特征数据,包括结构化特征属性数据和非结构化文书特征属性数据;
[0009]2)收集每一所选法院所对应城市的经济侧数据;
[0010]3)利用所述司法案件特征数据、经济侧数据训练CNN

LightGBM预测模型;所述CNN

LightGBM预测模型包括对输入数据依次进行处理的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、Flatten层、LightGBM模型及输出层,所述输入层用于对输入数据按照地域和时间维度进行数据融合,并对融合后的数据进行归一化处理;所述卷积层用于对收到的数据进行特征提取和特征映射;所述池化层用于对第二卷积层的输出特征进行压缩;所述Flatten层对第二池化层输出的数据转换为一维数据;所述LightGBM模型用于对输入数据进行回归预测,预测结果经所述输出层输出;
[0011]4)将所选法院中一法院A的司法案件特征数据和该法院A所对应城市的经济侧数据输入训练后的CNN

LightGBM预测模型,预测得到该法院A未来一段时间内的案件量。
[0012]进一步的,训练所述CNN

LightGBM预测模型的方法为:
[0013]21)对结构化特征属性数据、非结构化文书特征属性数据和经济侧数据分别进行归一化;
[0014]22)将归一化后的结构化特征属性数据、非结构化文书特征属性数据和经济侧数据按照地域及法院划分为n个集合F={f1,f2,...,fn},n为所选法院总数,fn为第n个法院的结构化特征属性数据、非结构化文书特征属性数据和经济侧数据;将集合F按照设定时间周期划分多个案件特征集和案件量数据集Et,Xt;Et为第t个时间周期内所选n个法院对应的关联属性特征集数据集;对数据集{E1,E2,...,Et}求均值、标准差,得到归一化的关联属性特征数据集;Xt为第t个时间周期内所选n个法院的案件数量集;对数据集{X1,X2,...,Xt}求均值、标准差,得到归一化的历史案件数量;
[0015]23)将步骤22)所得归一化的历史案件数量和关联属性特征数据集输入到CNN模型中进行预训练,得到CNN模型中卷积层、池化层的参数;
[0016]24)将训练所得CNN模型中卷积层、池化层的参数作为所述第一卷积层、第二卷积层、池化层的参数并冻结,替换全连接层为LightGBM;然后利用步骤22)所得归一化的历史案件数量和关联属性特征数据集对所述CNN

LightGBM预测模型进行训练。
[0017]进一步的,所述CNN

LightGBM预测模型中的全连接层替换为LightGBM模型。
[0018]进一步的,通过人工智能命名实体识别技术,在所述司法案件的裁判文书中提取关联属性特征数据作为所述非结构化文书特征属性数据。
[0019]进一步的,所述非结构化文书特征属性数据包括案件的争议焦点、作案手段、作案动机。
[0020]进一步的,所述结构化特征属性数据包括案件特征属性数据和当事人属性特征数据;所述案件特征属性数据包括案件的经办法院、立案日期、案号、案件结案方式、审理周期、适用程序、审限信息、陪审信息;所述当事人属性特征数据包括当事人的年龄、性别、案件地位、职业。
[0021]进一步的,所述经济侧数据包括常驻人口数、城镇化人口数、民用汽车保有量、金融体量、旅游人口、GDP。
[0022]一种基于司法大数据多特征映射的案件量预测系统,其特征在于,数据获取单元
和CNN

LightGBM预测模型;其中,
[0023]数据获取单元,用于收集所选法院司法案件的司法案件特征数据,包括结构化特征属性数据和非结构化文书特征属性数据;以及收集每一所选法院所对应城市的经济侧数据;
[0024]CNN

LightGBM预测模型,包括对输入数据依次进行处理的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、Flatten层、LightGBM模型及输出层;所述输入层用于对输入数据按照地域和时间维度进行数据融合,并对融合后的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于司法大数据多特征映射的案件量预测方法,其步骤包括:1)收集所选法院司法案件的司法案件特征数据,包括结构化特征属性数据和非结构化文书特征属性数据;2)收集每一所选法院所对应城市的经济侧数据;3)利用所述司法案件特征数据、经济侧数据训练CNN

LightGBM预测模型;所述CNN

LightGBM预测模型包括对输入数据依次进行处理的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、Flatten层、LightGBM模型及输出层,所述输入层用于对输入数据按照地域和时间维度进行数据融合,并对融合后的数据进行归一化处理;所述卷积层用于对收到的数据进行特征提取和特征映射;所述池化层用于对第二卷积层的输出特征进行压缩;所述Flatten层对第二池化层输出的数据转换为一维数据;所述LightGBM模型用于对输入数据进行回归预测,预测结果经所述输出层输出;4)将所选法院中一法院A的司法案件特征数据和该法院A所对应城市的经济侧数据输入训练后的CNN

LightGBM预测模型,预测得到该法院A未来一段时间内的案件量。2.根据权利要求1所述的方法,其特征在于,训练所述CNN

LightGBM预测模型的方法为:21)对结构化特征属性数据、非结构化文书特征属性数据和经济侧数据分别进行归一化;22)将归一化后的结构化特征属性数据、非结构化文书特征属性数据和经济侧数据按照地域及法院划分为n个集合F={f1,f2,...,fn},n为所选法院总数,fn为第n个法院的结构化特征属性数据、非结构化文书特征属性数据和经济侧数据;将集合F按照设定时间周期划分多个案件特征集和案件量数据集Et,Xt;Et为第t个时间周期内所选n个法院对应的关联属性特征集数据集;对数据集{E1,E2,...,Et}求均值、标准差,得到归一化的关联属性特征数据集;Xt为第t个时间周期内所选n个法院的案件数量集;对数据集{X1,X2,...,Xt}求均值、标准差,得到归一化的历史案件数量;23)将步骤22)所得归一化的历史案件数量和关联属性特征数据集输入到CNN模型中进行预训练,得到CNN模型中卷积层、池化层的参数;24)将训练...

【专利技术属性】
技术研发人员:刘小龙李盼崔甲蓉李俊慧贾高峰卓煜李晗
申请(专利权)人:中国司法大数据研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1