一种基于时空关联性分析的法院收结案数量预测方法技术

技术编号:27602652 阅读:21 留言:0更新日期:2021-03-10 10:25
本发明专利技术公开了一种基于时空关联性分析的法院收结案数量预测方法,包括以下步骤:收集刑事案件收案数据,采集相关特征属性数据并构造属性数据集;进行预处理,得到刑事案件数量分布图和关联属性特征数据矩阵;挖掘基于地理空间距离的空间关联关系,得到第一空间表征向量;挖掘基于地区属性特征相似性的空间关联关系,得到第二空间表征向量;经过融合层得到第三空间表征向量;基于长短时记忆神经网络进行时间关联性分析,预测下一时刻刑事案件收案数量;训练基于时空关联预测的刑事案件数量预测模型,分析误差。本方法综合考虑了影响犯罪活动的其他有意义的指标特征,同时考虑时间和空间特征,提高了预测的准确性。提高了预测的准确性。提高了预测的准确性。

【技术实现步骤摘要】
一种基于时空关联性分析的法院收结案数量预测方法


[0001]本专利技术涉及智能化法院审判管理领域,尤其涉及一种基于时空关联性分析的法院收结案数量预测方法。

技术介绍

[0002]作为法院智能化管理与决策系统的重要内容之一,收结案数量的预测是智慧法院建设的关键环节,通过构建合理的审判管理决策系统,可以实现司法系统对人财物统一管理、司法人员动态调配的优化。
[0003]现有的司法案件收结案宏观态势研判系统集中于解决原始司法信息的收集、汇总、可视化模块,基于收结案数量这一单一维度,利用回归分析来拟合未来收结案数量的变化趋势。现阶段对法院决策支持方面的研究集中于司法数据,如案件数量、再犯性、位置等与外界环境指标,如自然因素、城市地理未知等之间的关联性,使用神经网络模型来对司法数据进行简单的预测。除了通过预测来提供决策管理,还有构建合理的指标评价体系衡量法官判案的公平性等指标。目前司法统计学中对收结案数量的预测研究还不是很充分,在对犯罪数量的预测问题中,仅仅只考虑案件数量这一单一指标进行自回归预测,预测的准确性还不够高。
[0004]因此,本领域的技术人员致力于开发一种基于时空关联性分析的法院收结案数量预测方法,同时考虑多种影响因素来进行预测,以提高预测的准确性。

技术实现思路

[0005]有鉴于现有技术的上述缺陷,本专利技术所要解决的技术问题是如何综合考虑多种影响因素来进行预测,以提高预测的准确性。
[0006]为实现上述目的,本专利技术提供了一种基于时空关联性分析的法院收结案数量预测方法,包括以下步骤:
[0007]步骤1、收集刑事案件收案数据,采集相关特征属性数据并构造属性数据集;
[0008]步骤2、对所述步骤1构造的所述属性数据集进行预处理,得到刑事案件数量分布图和关联属性特征数据矩阵;
[0009]步骤3、对所述刑事案件数量分布图和所述关联属性特征数据矩阵进行基于网格嵌入的空间关联性分析;
[0010]步骤4、基于长短时记忆神经网络进行时间关联性分析,预测下一时刻刑事案件收案数量;
[0011]步骤5、利用所述刑事案件数量分布图和所述关联属性特征数据矩阵,训练基于时空关联预测的刑事案件数量预测模型,分析误差。
[0012]进一步地,所述步骤1具体为:根据法院提供的审判质效评估报表确定司法指标和收案数量数据,从政府网站上采集刑事案件收案数据,收集与所述刑事案件发生有关的所述属性数据集;在时间维度上,所述属性数据集中所包括的每一个属性数据都是以天为单
位;在空间维度上,所述属性数据集的数据细粒度划分至一个城市的各个区县,采集与一个城市中各个区县刑事案件发生有关的所述属性数据集。
[0013]进一步地,所述步骤2包括以下步骤:
[0014]步骤2.1、将待研究的城市划分为n个互不重合的空间小网格,将所述城市表示成一个小网格集合G={g1,g2,...,g
n
},这n个所述小网格按经纬度排列构成一个一个I行J列的网格图;将数据以天为单位划分成一系列时间序列集合,时间序列集合定义为T={t1,t2,

,t
n
},时隙间的间隔相等;
[0015]步骤2.2、对每一个所述时隙,将所述属性数据集中每一个所述属性数据进行如下空间维度预处理:将各个所述小网格的指定时间间隔内的若干个刑事案件数量和与所述刑事案件相关联的所述属性数据集中的每一个所述属性数据分别进行累加,得到各个所述小网格在指定时间间隔的刑事案件数量数据和关联属性特征数据;构建一个前t时刻包括所述刑事案件数量数据和所述关联属性特征数据的历史记录值{X1,X2,...,X
t
}和和{E1,E2,...,E
t
},其中X
i
是i时刻该城市的刑事案件数量分布图,E
i
是i时刻该城市的关联属性特征数据矩阵;其中X
t
∈N
I
×
J
,每一个元素x
i,j
∈X
t
表示索引为第i行第j列地区的刑事案件收案数量;E
t
∈N
I
×
J
,每一个元素e
i,j
∈E
t
表示索引为第i行第j列地区的关联属性特征向量;
[0016]步骤2.3、根据观测数据集的{X1,X2,...,X
t
}和{E1,E2,...,E
t
}分别求得均值μ
x
、μ
e
和标准差σ
x
、σ
e
,从而得到归一化的历史刑事案件数量和归一化的关联属性特征数据集。
[0017]进一步地,所述步骤2.3中求均值μ
x
、μ
e
和标准差σ
x
、σ
e
的计算公式如下:
[0018][0019][0020][0021][0022][0023]。
[0024]进一步地,所述步骤3包括:
[0025]步骤3.1、利用地理空间关联性分析模块挖掘基于地理空间距离的空间关联关系,得到基于地理空间距离的第一空间表征向量Z
t

[0026]步骤3.2、利用特征空间相似性分析模块挖掘基于地区属性特征相似性的空间关联关系,得到基于属性特征相似性的第二空间表征向量D
t

[0027]步骤3.3、经过融合层将所述第一空间表征向量和所述第二空间表征向量拼接在一起得到一组基于网格嵌入的第三空间表征向量Y
t
=[Z
t
,D
t
]。
[0028]进一步地,步骤3.1具体为:利用卷积自编码器对每一个时隙的所述刑事案件数量
分布图X
i
进行卷积操作,经过多层卷积提取空间特征最终输出一个基于地理空间距离的第一空间表征向量
[0029]进一步地,步骤3.2具体为:基于每一个时隙的所述关联属性特征数据矩阵E
i
,利用余弦相似性来计算每个所述小网格对应的地区在刑事案件数量发展态势之间的相似关系,设定一个相似度阈值ε,余弦相似性大于所述阈值的两个地区之间有边相连,余弦相似性小于所述阈值的两个地区之间没有边相连,进而构造一个邻接矩阵;将所述邻接矩阵和所述关联属性特征数据矩阵作为图卷积的输入,图卷积网络的每一层卷积通过更新每一个节点的值来捕捉空间关联关系,最终输出一个基于属性特征相似性的第二空间表征向量
[0030]进一步地,所述步骤4具体为:
[0031]在所述基于长短时记忆神经网络的时间关联性分析中,将所述基于网格嵌入的第三空间表征向量{Y1,Y2,...,Y
t
}作为所述基于长短时记忆神经网络的输入,经过时间序列模块后得到下一时刻的所述基于网格嵌入的第三空间表征向量;将所述基于长短时记忆神经网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时空关联性分析的法院收结案数量预测方法,其特征在于,包括以下步骤:步骤1、收集刑事案件收案数据,采集相关特征属性数据并构造属性数据集;步骤2、对所述步骤1构造的所述属性数据集进行预处理,得到刑事案件数量分布图和关联属性特征数据矩阵;步骤3、对所述刑事案件数量分布图和所述关联属性特征数据矩阵进行基于网格嵌入的空间关联性分析;步骤4、基于长短时记忆神经网络进行时间关联性分析,预测下一时刻刑事案件收案数量;步骤5、利用所述刑事案件数量分布图和所述关联属性特征数据矩阵,训练基于时空关联预测的刑事案件数量预测模型,分析误差。2.如权利要求1所述的基于时空关联性分析的法院收结案数量预测方法,其特征在于,所述步骤1具体为:根据法院提供的审判质效评估报表确定司法指标和收案数量数据,从政府网站上采集刑事案件收案数据,收集与所述刑事案件发生有关的所述属性数据集;在时间维度上,所述属性数据集中所包括的每一个属性数据都是以天为单位;在空间维度上,所述属性数据集的数据细粒度划分至一个城市的各个区县,采集与一个城市中各个区县刑事案件发生有关的所述属性数据集。3.如权利要求2所述的基于时空关联性分析的法院收结案数量预测方法,其特征在于,所述步骤2包括以下步骤:步骤2.1、将待研究的城市划分为n个互不重合的空间小网格,将所述城市表示成一个小网格集合G={g1,g2,...,g
n
},这n个所述小网格按经纬度排列构成一个一个I行J列的网格图;将数据以天为单位划分成一系列时间序列集合,时间序列集合定义为T={t1,t2,

,t
n
},时隙间的间隔相等;步骤2.2、对每一个所述时隙,将所述属性数据集中每一个所述属性数据进行如下空间维度预处理:将各个所述小网格的指定时间间隔内的若干个刑事案件数量和与所述刑事案件相关联的所述属性数据集中的每一个所述属性数据分别进行累加,得到各个所述小网格在指定时间间隔的刑事案件数量数据和关联属性特征数据;构建一个前t时刻包括所述刑事案件数量数据和所述关联属性特征数据的历史记录值{X1,X2,...,X
t
}和和{E1,E2,...,E
t
},其中X
i
是i时刻该城市的刑事案件数量分布图,E
i
是i时刻该城市的关联属性特征数据矩阵;其中X
t
∈N
I
×
J
,每一个元素x
i,j
∈X
t
表示索引为第i行第j列地区的刑事案件收案数量;E
t
∈N
I
×
J
,每一个元素e
i,j
∈E
t
表示索引为第i行第j列地区的关联属性特征向量;步骤2.3、根据观测数据集的{X1,X2,...,X
t
}和{E1,E2,...,E
t
}分别求得均值μ
x
、μ
e
和标准差σ
x
、σ
e
,从而得到归一化的历史刑事案件数量和归一化的关联属性特征数据集。4.如权利要求3所述的基于时空关联性分析的法院收结案数量预测...

【专利技术属性】
技术研发人员:潘理王晓燕钱一婷
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1