一种行政类文书号数据智能查漏的方法、系统及装置制造方法及图纸

技术编号:38458687 阅读:10 留言:0更新日期:2023-08-11 14:35
本发明专利技术公开了一种行政类文书号数据智能查漏的方法、系统及装置,属于行政数据查漏及数据处理技术领域,从报送数据中抽取文书号字段并遵循文书号字段的前后缀规则进行有效部分排序,实现同前缀不同有效部分的相邻文书号之间进行差值计算,得出最终的查漏结果;通过读取所有上报信息中的固定字段,进行文书号信息的收集、标准化、解析文书号和对比计算,实现瞒报计算;其中支持对特殊文书号的人工干预。本发明专利技术只需关注数据上报流程,无需再进行台账维护,准确率高,能够杜绝人为因素的干扰。能够杜绝人为因素的干扰。能够杜绝人为因素的干扰。

【技术实现步骤摘要】
一种行政类文书号数据智能查漏的方法、系统及装置


[0001]本专利技术涉及行政数据查漏及数据处理
,具体地说是一种行政类文书号数据智能查漏的方法、系统及装置。

技术介绍

[0002]在进行机关数据统计时,有可能存在瞒报的情况,传统查漏的方法是:被考核方在上报数据的同时上报本次报送数据的台账,考核系统会获取报送的台账信息与其同一时间段内真实上报的数据进行查漏对比,从而得出考核结果。
[0003]目前的上报台账方式容易出现台账数据作弊的问题。由于传统方案的台账维护行为主动性在于报送方,在对台账维护要求不严格的情况或报送方台账维护结果存在偏差时,查漏工作的考核结果正确率将得不到保证。

技术实现思路

[0004]本专利技术的技术任务是针对以上不足之处,提供一种行政类文书号数据智能查漏的方法、系统及装置,只需关注数据上报流程,无需再进行台账维护,准确率高,能够杜绝人为因素的干扰。
[0005]本专利技术解决其技术问题所采用的技术方案是:
[0006]一种行政类文书号数据智能查漏的方法,从报送数据中抽取文书号字段并遵循文书号字段的前后缀规则进行有效部分排序,实现同前缀不同有效部分的相邻文书号之间进行差值计算,得出最终的查漏结果;
[0007]通过读取所有上报信息中的固定字段,进行文书号信息的收集、标准化、解析文书号和对比计算,实现瞒报计算;其中支持对特殊文书号的人工干预。
[0008]通过本方法,针对文书号分析结果和单次考核结果,建立单位文书号瞒报多结果关联,多维度统计和分析瞒报情况。
[0009]优选的,所述文书号信息的收集,收集上报数据中的所有文书号接入逻辑处理流程,对重复收集到的文书号做重复性判断并剔除。
[0010]优选的,所述文书号信息的标准化,对收集的文书号进行单个文书号规范化处理,将中文小括号“()”,中文中括号“【】”,方括号“〔〕”和英文大括号“{}”进行规范化处理统一转换为英文小括号“()”;
[0011]将文书号中的空格、制表符“
”,换行符“\n”,(MacOS(一种操作系统名称)和Linux(一种操作系统名称))回车符“\r”,Windows(一种操作系统名称)的换行符“\r\n”替换为空白,并将(上述情况未提到的)所有的全角字符转换为半角字符。
[0012]进一步的,所述解析文书号,包括常规解析、自动推断和超限断言,
[0013]所述常规解析(无人工干预情况下),判断文书号是否为纯数字串,如果为纯数字串,其处理方式为默认截取后4位作为可计算的有效文书号;非纯数字串则对连续的数字组进行分割,取最后一组数字作为可计算的有效文书号;
[0014]所述自动推断,对于纯数字文书号,指定对前面8位进行年月日推断,推断出符合yyyy*/yyyy*MM/yyyy*MM*dd规则的日期并保留截取推断长度后的部分作为可计算的有效文书号,其中*代表日期分隔符;
[0015]所述超限断言,当纯数字串长度>=10时,判定此文书号为无效文书号并标记;每组数字中以0开头的部分会截取并单独存储为无效,0的位数作为还原文书号对齐原长度的补充;最后一组有效文书号的长度如果超过JAVA(一种编程语言)的Long(一种基本数据类型)类型所定义的长度则判定无效文书号并标记;
[0016]经过上述解析过程,一个文书号被处理最终会返回包括文书号原值、标准值、前后缀、分组依据、无效0位数、有效文书号、解析状态的关键参数并进行存储等待参与计算。
[0017]优选的,所述解析文书号,使用人工干预配置文书号处理依据进行规则扩充。
[0018]进一步的,所述对比计算,将收集、标准化、解析后的文书号放入有序集合并按照前缀相同的情况分组,每组前缀相同的文书号组各自进行排序,循环计算出相邻两个文书号的差值,并将所有差值进行储存和计算,累加每组文书号中存在的差值并初步得出单次考核结果。
[0019]优选的,所述人工干预,针对特定类型前缀的文书号进行自定义文书号后缀截取位数(有效位数)的特殊操作,在文书号解析过程中干预后将不进行自动推断相关的算法而是直接截取有效文书号并返回关键参数。
[0020]优选的,该方法应用于行政许可瞒报统计,实现过程如下:
[0021]1)、查询瞒报统计时间区间内所有许可机关统一社会信用代码信息;
[0022]2)、遍历每一个许可机关统一社会信信用代码,获取上报数据;
[0023]3)、对所述许可机关文书号只保留汉字、字母、数字并生成哈希值,进行去重处理;
[0024]4)、重复文书号的数据仅IN_TIME最新数据参与瞒报计算,去重后按照文书号升序排序;
[0025]5)、判断文书号是否包含数字;
[0026]6)、文书号包含数字则将文书号数字用标识符替换,获取分组信息,若有效顺序号不足则补0;
[0027]7)、根据分组信息计算,生成断号数据信息;
[0028]8)、判断文书号是否存在纯数字且未配置有效文书信息,若存在则判定为瞒报统计异常,介入人工分析;若不存在,则判断断号数据量是否超过上报数,超过则判定为瞒报统计异常,介入人工分析;
[0029]9)、查询确认断号数据是否上报,记录瞒报数据信息。
[0030]本专利技术还要求保护一种行政类文书号数据智能查漏的系统,包括文书号信息收集模块、标准化处理模块、文书号解析模块、对比计算模块以及人工干预模块,
[0031]该系统通过上述的行政类文书号数据智能查漏的方法实现行政类文书号数据智能查漏。
[0032]本专利技术还要求保护一种行政类文书号数据智能查漏的装置,包括至少一个存储器和至少一个处理器;
[0033]所述至少一个存储器,用于存储机器可读程序;
[0034]所述至少一个处理器,用于调用所述机器可读程序,能够执行上述的方法。
[0035]本专利技术的一种行政类文书号数据智能查漏的方法、系统及装置与现有技术相比,具有以下有益效果:
[0036]1、可以自由的配置人工干预的文书号解析依据,满足更多的文书号处理要求;
[0037]2、杜绝传统计算瞒报方式存在主动性产生的可能影响正确结果的行为,使得考核结果更规范、准确并且自动化程度更高,节省人力物力,提升服务提供者的服务效率;
[0038]3、借助本专利技术设计的文书号解析方法,正确分析单位类型文书号的填报规则,进一步监督数据报送质量。
[0039]4、针对文书号分析结果和单次考核结果,建立单位文书号瞒报多结果关联,多维度统计和分析瞒报情况。
附图说明
[0040]图1是本专利技术一个实施例提供的行政许可瞒报统计的操作流程示图。
具体实施方式
[0041]下面结合具体实施例对本专利技术作进一步说明。
[0042]本专利技术实施例提供了一种行政类文书号数据智能查漏的方法,从报送数据中抽取文书号字段并遵循文书号字段的前后缀规则进行有效部分排序,实现同前缀不同有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行政类文书号数据智能查漏的方法,其特征在于,从报送数据中抽取文书号字段并遵循文书号字段的前后缀规则进行有效部分排序,实现同前缀不同有效部分的相邻文书号之间进行差值计算,得出最终的查漏结果;通过读取所有上报信息中的固定字段,进行文书号信息的收集、标准化、解析文书号和对比计算,实现瞒报计算;其中支持对特殊文书号的人工干预。2.根据权利要求1所述的一种行政类文书号数据智能查漏的方法,其特征在于,所述文书号信息的收集,收集上报数据中的所有文书号接入逻辑处理流程,对重复收集到的文书号做重复性判断并剔除。3.根据权利要求1或2所述的一种行政类文书号数据智能查漏的方法,其特征在于,所述文书号信息的标准化,对收集的文书号进行单个文书号规范化处理,将中文小括号“()”,中文中括号“【】”,方括号“〔〕”和英文大括号“{}”进行规范化处理统一转换为英文小括号“()”;将文书号中的空格、制表符“\t”,换行符“\n”,回车符“\r”,Windows的换行符“\r\n”替换为空白,并将所有的全角字符转换为半角字符。4.根据权利要求3所述的一种行政类文书号数据智能查漏的方法,其特征在于,所述解析文书号,包括常规解析、自动推断和超限断言,所述常规解析,判断文书号是否为纯数字串,如果为纯数字串,其处理方式为默认截取后4位作为可计算的有效文书号;非纯数字串则对连续的数字组进行分割,取最后一组数字作为可计算的有效文书号;所述自动推断,对于纯数字文书号,指定对前面8位进行年月日推断,推断出符合yyyy*/yyyy*MM/yyyy*MM*dd规则的日期并保留截取推断长度后的部分作为可计算的有效文书号,其中*代表日期分隔符;所述超限断言,当纯数字串长度>=10时,判定此文书号为无效文书号并标记;每组数字中以0开头的部分会截取并单独存储为无效,0的位数作为还原文书号对齐原长度的补充;最后一组有效文书号的长度如果超过JAVA的Long类型所定义的长度则判定无效文书号并标记;经过上述解析过程,一个文书号被处理最终会返回包括文书号原值、标准值、前后缀、分组依据、无效0位数、有效文书号、解析状态的关键参数并进行存储等待参与计算。5.根据权利要求4所述的一种行政类文书号数据...

【专利技术属性】
技术研发人员:张栋胡大超王恒彭光高靖奇
申请(专利权)人:山东浪潮数字商业科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1