一种测算全国各地文书公开率的方法技术

技术编号:31237299 阅读:20 留言:0更新日期:2021-12-08 10:21
本发明专利技术一种测算全国各地文书公开率的方法,使用了利用文书的最大案号的无偏估计算法,通过使用有限残缺的样本,对于整体样本进行有效的估计,再通过区域位置的定位,最终得到全国各地的司法透明度。本发明专利技术提供了一种较为有效、准确的司法透明度测算方法。准确的司法透明度测算方法。准确的司法透明度测算方法。

【技术实现步骤摘要】
一种测算全国各地文书公开率的方法


[0001]本专利技术涉及数据处理
,具体涉及一种测算全国各地文书公开率的方法。

技术介绍

[0002]无偏估计(unbiased estimate)是用样本统计量来估计总体参数时的一种无偏推断。估计量的数学期望等于被估计参数的真实值,则称此估计量为被估计参数的无偏估计,即具有无偏性,是一种用于评价估计量优良性的准则。无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。
[0003]在强调司法公开和司法透明的大背景下,使用一种客观公正的办法来对于全国各地的司法透明水平评价成为了最高法管理和学术研究共同密切关注的问题,但当前还缺少有效的测算方法。

技术实现思路

[0004]针对现有技术的不足,本专利技术旨在提供一种测算全国各地文书公开率的方法,结合了文书号和数学估计算法,测算出各地的司法文书公开率,从而获得各地的司法透明情况。
[0005]为了实现上述目的,本专利技术采用如下技术方案:
[0006]一种测算全国各地文书公开率的方法,具体过程为:
[0007]S1、获得原始文书集;
[0008]通过各地司法机构公开和与各地司法机构合作的方式获取到原始文书数据集;
[0009]S2、对步骤S1获得的原始文书数据集进行案号数据挖掘:
[0010]从各文书的内容中获取到对应的案号,从案号中获取相应的收案年度、法院代字、案件类型代字、案件编号;
[0011]从各文书的内容获取到相应的法院名称,进而获得该法院所属的省、市、区/县,从而得到该文书所属的省、市、区/县,然后根据各文书所属的省、市、区/县,得出各省、市、区/县下各个年度、各案件类型的案件编号列表,并对各个案件编号列表的案件编号进行去重,此时各个案件编号列表中的案件编号个数n为该省、市、区/县下该年度的该案件类型的公开案件总数量;
[0012]S3、测算全国各省、市、区/县下各年度的各案件类型的案件总量:
[0013]设对于某个法院、某年度、某案件类型的最大案件编号为C
all
,公开的文书的案件编号的递增序列为{k
i
},i=1,...,n,则C
all
的无偏估计为:
[0014][0015]根据各省、市、区/县下各年度的各案件类型的案件编号列表,通过无偏估计算法,预估得到各省、市、区/县下各年度的各案件类型的案件总量;
[0016]S4、计算目标区域的透明度指数:先计算该目标区域的公开案件数量,然后计算该
目标区域下的公开案件数量和预估案件总量的比值,即为透明度指数;
[0017]公开案件数量C
disclosed
的计算公式如下:
[0018][0019]其中:
[0020][0021]当计算的是目标区域在某个时间区间内的综合透明度指数时,公开文书总数量是该省、市、区/县在该时间区间内所有公开的文书的总量,已知案号的公开文书总数量是该省、市、区/县在该时间区间内可以挖掘到案号数据的公开的文书总数量,公开案件总数量是该省、市、区/县在该时间区间内所有案件类型的公开案件总数量的总和;当计算的是省、市、区/县在某个时间区间内某个案件类型的透明度指数时,公开文书总数量是该省、市、区/县在该时间区间内该案件类型公开的文书的总量,已知案号的公开文书总数量是该省、市、区/县在该时间区间内该案件类型下可以挖掘到案号数据的公开的文书总数量,公开案件总数量是该省、市、区/县在该时间区间内该案件类型的公开案件总数量。
[0022]进一步地,步骤S2中,利用清理算法对案件类型代字进行规整化,具体过程为:先通过特征提取或者正则提取的方式将案件类型代字找到,判断案件类型代字中是否含有设定的案件类型的表述,如果有,则统一将该案件类型代字规整为仅含对应的设定的案件类型的表述。
[0023]进一步地,步骤S2中,通过错误去重算法对法院代字进行规整,保证一个省、市、区/县下只对应唯一一个法院代字,具体过程为:如果一个省、市、区/县下有多个法院代字的时候,通过数据库自动统计的方式,采用使用频次最多的法院代字作为唯一的法院代字,并将其他法院代字规整为该唯一的法院代字。
[0024]进一步地,步骤S3中,将初步预估得到的案件数量,反向评估相应的案件编号递增序列的数据项的合理性,如果有不合理项就挑出不合理的数据,再重新进行无偏估计算法,预估得到最终的各省、市、区/县下各年度的各案件类型的案件总量。
[0025]进一步地,步骤S4中,目标区域的透明度的计算公式如下:
[0026][0027]即为目标区域下的预估案件总量。
[0028]本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述方法。
[0029]本专利技术提供一种电子设备,包括处理器和存储器,所述存储器用于存储计算机程序;所述处理器用于执行所述计算机程序时,实现上述方法。
[0030]本专利技术的有益效果在于:本专利技术使用了利用文书的最大案号的无偏估计算法,通过使用有限残缺的样本,对于整体样本进行有效的估计,再通过区域位置的定位,最终得到全国各地的司法透明度。本专利技术提供了一种较为有效、准确的司法透明度测算方法。
附图说明
[0031]图1为本专利技术实施例中方法的整体流程示意图;
[0032]图2为本专利技术实施例中步骤S2的具体流程示意图;
[0033]图3为本专利技术实施例中步骤S3的具体流程示意图.
具体实施方式
[0034]以下将结合附图对本专利技术作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围并不限于本实施例。
[0035]本实施例提供一种测算全国各地文书公开率的方法,如图1所示,具体过程为:
[0036]S1、获得原始文书集;
[0037]通过各地司法机构公开和与各地司法机构合作的方式获取到原始文书数据集,本实施例中只涉及民事、刑事、行政三种类型的一审案件和二审案件的文书。
[0038]S2、对步骤S1获得的原始文书数据集进行案号数据挖掘;如图2所示,具体过程为:
[0039]从各文书的内容中获取到对应的案号,案号一般由收案年度、法院代字、案件类型代字、案件编号构成,从而形成案件的唯一标识;从案号中获取相应的收案年度、法院代字、案件类型代字、案件编号。
[0040]从各文书的内容获取到相应的法院名称,进而获得该法院所属的省、市、区/县(可利用地图数据等方式获取法院的地理位置,从而获取其省、市、区/县),从而得到该文书所属的省、市、区/县,然后根据各文书所属的省、市、区/县,得出各省、市、区/县下各个年度、各案件类型的案件编号列表,并对各个案件编号列表的案件编号进行去重,此时各个案件编号列表中的案件编号个数n为该省、市、区/县下该年度的该案件类型的公开案件总数量。...

【技术保护点】

【技术特征摘要】
1.一种测算全国各地文书公开率的方法,其特征在于,具体过程为:S1、获得原始文书集;通过各地司法机构公开和与各地司法机构合作的方式获取到原始文书数据集;S2、对步骤S1获得的原始文书数据集进行案号数据挖掘:从各文书的内容中获取到对应的案号,从案号中获取相应的收案年度、法院代字、案件类型代字、案件编号;从各文书的内容获取到相应的法院名称,进而获得该法院所属的省、市、区/县,从而得到该文书所属的省、市、区/县,然后根据各文书所属的省、市、区/县,得出各省、市、区/县下各个年度、各案件类型的案件编号列表,并对各个案件编号列表的案件编号进行去重,此时各个案件编号列表中的案件编号个数n为该省、市、区/县下该年度的该案件类型的公开案件总数量;S3、测算全国各省、市、区/县下各年度的各案件类型的案件总量:设对于某个法院、某年度、某案件类型的最大案件编号为C
all
,公开的文书的案件编号的递增序列为{k
i
},i=1,...,n,则C
all
的无偏估计为:根据各省、市、区/县下各年度的各案件类型的案件编号列表,通过无偏估计算法,预估得到各省、市、区/县下各年度的各案件类型的案件总量;S4、计算目标区域的透明度指数:先计算该目标区域的公开案件数量,然后计算该目标区域下的公开案件数量和预估案件总量的比值,即为透明度指数;公开案件数量C
disclosed
的计算公式如下:其中:当计算的是目标区域在某个时间区间内的综合透明度指数时,公开文书总数量是该省、市、区/县在该时间区间内所有公开的文书的总量,已知案号的公开文书总数量是该省、市、区/县在该时间区间内可以挖掘到案号数据的公开的文书总数量,公开案件总数量是该省、市、区/县在该时间区间内所有案件类型...

【专利技术属性】
技术研发人员:张雨侠刘庄汪天翔
申请(专利权)人:深圳市大数据研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1