一种用于档案形成单位开放审核的方法及系统技术方案

技术编号:38905162 阅读:24 留言:0更新日期:2023-09-22 14:23
本发明专利技术提供了一种用于档案形成单位开放审核的方法及系统,涉及数据处理技术领域,包括:获取多级公开敏感词集合,并获得多个敏感值数据库,构建鉴定词典,进行开放时间鉴定,合格时对目标档案进行处理,并获得目标独热编码集合,计算获得多个累计独热值和多个累计敏感值,获得第一敏感鉴定系数,构建语义开放鉴定通道,并内嵌于敏感词开放鉴定通道,输入语义开放鉴定通道内,获得第二敏感鉴定系数,进行计算获得综合敏感鉴定系数,输入开放审核通道内,获得开放审核结果,包括开放、人工审核和不开放。本发明专利技术解决了传统的档案开放审核存在主要依赖于人工操作,其效率较低且易受主观因素影响,导致档案开放审核效率低、效果差的技术问题。问题。问题。

【技术实现步骤摘要】
一种用于档案形成单位开放审核的方法及系统


[0001]本专利技术涉及数据处理
,具体涉及一种用于档案形成单位开放审核的方法及系统。

技术介绍

[0002]档案开放审核是一个关键的环节,涉及公共信息资源的安全和利用,档案形成单位将建立的档案移交至综合档案馆,综合档案馆执行档案开放审核工作。但是在档案管理标准下,综合档案馆需要执行的档案开放审核工作过于复杂和庞大,所以需要档案形成单位在移交档案时,对档案进行预先的审核,以减少综合档案馆的档案开放审核工作量。
[0003]档案形成单位内传统的档案开放审核主要依赖于人工操作,其效率较低且易受主观因素影响,随着大数据、云计算和人工智能等技术的快速发展,自动化档案开放审核成为一种新的需求和趋势。然而现今常用的自动化档案开放审核的方法还存在着一定的弊端,例如鉴定误判率较高,对于档案开放审核的方法还存在着一定的可提升空间。

技术实现思路

[0004]本申请通过提供了一种用于档案形成单位开放审核的方法及系统,旨在解决现有的自动化档案开放审核存在鉴定效率低、误判率较高、效果差的技术问题。
[0005]鉴于上述问题,本申请提供了一种用于档案形成单位开放审核的方法及系统。
[0006]本申请公开的第一个方面,提供了一种用于档案形成单位开放审核的方法,所述方法包括:根据目标档案馆内的多级公开敏感内容,获取多级公开敏感词集合,并获得多级公开敏感内容的多个敏感值数据库,每个敏感值数据库内包括多个敏感词的敏感值;基于独热编码,构建鉴定词典,其中,所述鉴定词典内包括所述多级公开敏感词集合的多个敏感独热编码集合;对待进行鉴定的目标档案进行开放时间鉴定,在开放时间鉴定合格时,对所述目标档案进行处理,并根据所述鉴定词典,获得目标独热编码集合;筛选所述目标独热编码集合内的敏感独热编码,计算获得多个累计独热值和多个累计敏感值,输入敏感词开放鉴定通道内的第一鉴定分支和第二鉴定分支内,获得第一敏感鉴定系数;构建语义开放鉴定通道,并内嵌于所述敏感词开放鉴定通道,将所述目标独热编码集合输入所述语义开放鉴定通道内,获得第二敏感鉴定系数;对所述第一敏感鉴定系数和所述第二敏感鉴定系数进行计算,获得综合敏感鉴定系数,输入串行嵌入于所述语义开放鉴定通道的开放审核通道内,获得开放审核结果,所述开放审核结果包括开放、人工审核和不开放。
[0007]本申请公开的另一个方面,提供了一种用于档案形成单位开放审核的系统,所述系统包括:敏感值数据库获取模块,所述敏感值数据库获取模块用于根据目标档案馆内的多级公开敏感内容,获取多级公开敏感词集合,并获得多级公开敏感内容的多个敏感值数据库,每个敏感值数据库内包括多个敏感词的敏感值;鉴定词典构建模块,所述鉴定词典构建模块用于基于独热编码,构建鉴定词典,其中,所述鉴定词典内包括所述多级公开敏感词集合的多个敏感独热编码集合;开放时间鉴定模块,所述开放时间鉴定模块用于对待进行
鉴定的目标档案进行开放时间鉴定,在开放时间鉴定合格时,对所述目标档案进行处理,并根据所述鉴定词典,获得目标独热编码集合;第一系数获取模块,所述第一系数获取模块用于筛选所述目标独热编码集合内的敏感独热编码,计算获得多个累计独热值和多个累计敏感值,输入敏感词开放鉴定通道内的第一鉴定分支和第二鉴定分支内,获得第一敏感鉴定系数;第二系数获取模块,所述第二系数获取模块用于构建语义开放鉴定通道,并内嵌于所述敏感词开放鉴定通道,将所述目标独热编码集合输入所述语义开放鉴定通道内,获得第二敏感鉴定系数;系数计算模块,所述系数计算模块用于对所述第一敏感鉴定系数和所述第二敏感鉴定系数进行计算,获得综合敏感鉴定系数,输入串行嵌入于所述语义开放鉴定通道的开放审核通道内,获得开放审核结果,所述开放审核结果包括开放、人工审核和不开放。
[0008]本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:获取多级公开敏感词集合,并获得多个敏感值数据库,包括多个敏感词的敏感值,构建鉴定词典,包括多个敏感独热编码集合,进行开放时间鉴定,合格时对目标档案进行处理,并获得目标独热编码集合,筛选,计算获得多个累计独热值和多个累计敏感值,输入敏感词开放鉴定通道,获得第一敏感鉴定系数,构建语义开放鉴定通道,并内嵌于敏感词开放鉴定通道,输入语义开放鉴定通道内,获得第二敏感鉴定系数,进行计算获得综合敏感鉴定系数,输入开放审核通道内,获得开放审核结果,包括开放、人工审核和不开放。本申请通过融合公开敏感词的数量并引入敏感值计算,提升公开鉴定审核的准确性,提升的自动化档案开放审核误判率较高的技术问题,解决了传统的档案开放审核存在主要依赖于人工操作,其效率较低且易受主观因素影响,导致档案开放审核效率低、效果差的技术问题,实现了对档案数据的自动化敏感度评估和鉴定,减轻人工审核的负担,同时对文本进行语义分析,实现对文本主题的分析,实现多维融合鉴定,达到提升审核的精确性、提高审核工作效率的技术效果。
[0009]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0010]图1为本申请实施例提供了一种用于档案形成单位开放审核的方法流程示意图;图2为本申请实施例提供了一种用于档案形成单位开放审核的方法中获得多个敏感值数据库可能的流程示意图;图3为本申请实施例提供了一种用于档案形成单位开放审核的方法中获得多个敏感独热编码集合可能的流程示意图;图4为本申请实施例提供了一种用于档案形成单位开放审核的系统可能的结构示意图。
[0011]附图标记说明:敏感值数据库获取模块10,鉴定词典构建模块20,开放时间鉴定模块30,第一系数获取模块40,第二系数获取模块50,系数计算模块60。
具体实施方式
[0012]本申请实施例通过提供一种用于档案形成单位开放审核的方法,通过融合公开敏感词的数量并引入敏感值计算,提升公开鉴定审核的准确性,提升的自动化档案开放审核误判率较高的技术问题,解决了传统的档案开放审核存在主要依赖于人工操作,其效率较低且易受主观因素影响,导致档案开放审核效率低、效果差的技术问题,实现了对档案数据的自动化敏感度评估和鉴定,减轻人工审核的负担,同时对文本进行语义分析,实现对文本主题的分析,实现多维融合鉴定,达到提升审核的精确性、提高审核工作效率的技术效果。
[0013]在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
[0014]实施例一如图1所示,本申请实施例提供了一种用于档案形成单位开放审核的方法,所述方法包括:步骤S100:根据目标档案馆内的多级公开敏感内容,获取多级公开敏感词集合,并获得多级公开敏感内容的多个敏感值数据库,每个敏感值数据库内包括多个敏感词的敏感值;进一步而言,如图2所示,本申请步骤S100还包括:步骤S110:获取所述目标档案馆内的多级公开敏感内容,并构建获得多级公开敏感词集合;步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于档案形成单位开放审核的方法,其特征在于,所述方法包括:根据目标档案馆内的多级公开敏感内容,获取多级公开敏感词集合,并获得多级公开敏感内容的多个敏感值数据库,每个敏感值数据库内包括多个敏感词的敏感值;基于独热编码,构建鉴定词典,其中,所述鉴定词典内包括所述多级公开敏感词集合的多个敏感独热编码集合;对待进行鉴定的目标档案进行开放时间鉴定,在开放时间鉴定合格时,对所述目标档案进行处理,并根据所述鉴定词典,获得目标独热编码集合;筛选所述目标独热编码集合内的敏感独热编码,计算获得多个累计独热值和多个累计敏感值,输入敏感词开放鉴定通道内的第一鉴定分支和第二鉴定分支内,获得第一敏感鉴定系数;构建语义开放鉴定通道,并内嵌于所述敏感词开放鉴定通道,将所述目标独热编码集合输入所述语义开放鉴定通道内,获得第二敏感鉴定系数;对所述第一敏感鉴定系数和所述第二敏感鉴定系数进行计算,获得综合敏感鉴定系数,输入串行嵌入于所述语义开放鉴定通道的开放审核通道内,获得开放审核结果,所述开放审核结果包括开放、人工审核和不开放。2.根据权利要求1所述的方法,其特征在于,根据目标档案馆内的多级公开敏感内容,获取多级公开敏感词集合,并获得多级公开敏感内容的多个敏感值数据库,包括:获取所述目标档案馆内的多级公开敏感内容,并构建获得多级公开敏感词集合;根据所述多级公开敏感词集合的敏感程度,进行敏感值分配,获得多个敏感值集合;构建所述多级公开敏感词集合和多个敏感值集合的映射关系,获得所述多个敏感值数据库。3.根据权利要求1所述的方法,其特征在于,基于独热编码,构建鉴定词典,其中,所述鉴定词典内包括所述多级公开敏感词集合的多个敏感独热编码集合,包括:获取所述目标档案馆内档案的词集合和词总量,并将词总量记为N;基于N位寄存器,构建所述词集合内每个词的独热编码,获得所述鉴定词典;汇总所述多级公开敏感词集合内公开敏感词的独热编码,获得所述多个敏感独热编码集合。4.根据权利要求1所述的方法,其特征在于,筛选所述目标独热编码集合内的敏感独热编码,计算获得多个累计独热值和多个累计敏感值,输入敏感词开放鉴定通道内的第一鉴定分支和第二鉴定分支内,获得第一敏感鉴定系数,包括:筛选所述目标独热编码集合内的敏感独热编码,获得目标敏感独热编码集合;根据所述目标敏感独热编码集合和多个敏感独热编码集合,统计获取所述多级公开敏感内容的多个累计独热值,将所述目标独热编码集合对应的公开敏感词输入所述多个敏感值数据库,计算获得所述多级公开敏感内容的所述多个累计敏感值;根据所述多级公开内容的敏感程度,进行权重分配,获得包括多个权值的权重分配结果,分别对所述多个累计独热值和多个累计敏感值进行加权计算,获得总累计独热值和总累计敏感值;构建所述敏感词开放鉴定通道,所述敏感词开放鉴定通道包括第一鉴定分支和第二鉴定分支;
将所述总累计独热值和总累计敏感值输入所述第一鉴定分支和第二鉴定分支,对两个输出结果进行加权计算,获得所述第一敏感鉴定系数。5.根据权利要求4所述的方法,其特征在于,构建所述敏感词开放鉴定通道,包括:对所述目标档案馆的档案开放鉴定数据进行数据挖掘,获得样本总累计独热值集合、样本总累计敏感值集合和样本第一敏感鉴定系数集合;以总累计独热值为决策特征,基于所述样本总累计独热值集合,构建多层第一决策节点,每层第一决策节点对输入的总累计独热值进行二分类划分决策...

【专利技术属性】
技术研发人员:邹华徐志国秦岭蒋守国章瑾王楠宋永生臧萌周红李军郭晓华韦秀霞
申请(专利权)人:江苏联著实业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1