【技术实现步骤摘要】
一种用于档案形成单位开放审核的方法及系统
[0001]本专利技术涉及数据处理
,具体涉及一种用于档案形成单位开放审核的方法及系统。
技术介绍
[0002]档案开放审核是一个关键的环节,涉及公共信息资源的安全和利用,档案形成单位将建立的档案移交至综合档案馆,综合档案馆执行档案开放审核工作。但是在档案管理标准下,综合档案馆需要执行的档案开放审核工作过于复杂和庞大,所以需要档案形成单位在移交档案时,对档案进行预先的审核,以减少综合档案馆的档案开放审核工作量。
[0003]档案形成单位内传统的档案开放审核主要依赖于人工操作,其效率较低且易受主观因素影响,随着大数据、云计算和人工智能等技术的快速发展,自动化档案开放审核成为一种新的需求和趋势。然而现今常用的自动化档案开放审核的方法还存在着一定的弊端,例如鉴定误判率较高,对于档案开放审核的方法还存在着一定的可提升空间。
技术实现思路
[0004]本申请通过提供了一种用于档案形成单位开放审核的方法及系统,旨在解决现有的自动化档案开放审核存在鉴定效率低、误判率较高、效果差的技术问题。
[0005]鉴于上述问题,本申请提供了一种用于档案形成单位开放审核的方法及系统。
[0006]本申请公开的第一个方面,提供了一种用于档案形成单位开放审核的方法,所述方法包括:根据目标档案馆内的多级公开敏感内容,获取多级公开敏感词集合,并获得多级公开敏感内容的多个敏感值数据库,每个敏感值数据库内包括多个敏感词的敏感值;基于独热编码,构建鉴定词典,其中,所述鉴定 ...
【技术保护点】
【技术特征摘要】
1.一种用于档案形成单位开放审核的方法,其特征在于,所述方法包括:根据目标档案馆内的多级公开敏感内容,获取多级公开敏感词集合,并获得多级公开敏感内容的多个敏感值数据库,每个敏感值数据库内包括多个敏感词的敏感值;基于独热编码,构建鉴定词典,其中,所述鉴定词典内包括所述多级公开敏感词集合的多个敏感独热编码集合;对待进行鉴定的目标档案进行开放时间鉴定,在开放时间鉴定合格时,对所述目标档案进行处理,并根据所述鉴定词典,获得目标独热编码集合;筛选所述目标独热编码集合内的敏感独热编码,计算获得多个累计独热值和多个累计敏感值,输入敏感词开放鉴定通道内的第一鉴定分支和第二鉴定分支内,获得第一敏感鉴定系数;构建语义开放鉴定通道,并内嵌于所述敏感词开放鉴定通道,将所述目标独热编码集合输入所述语义开放鉴定通道内,获得第二敏感鉴定系数;对所述第一敏感鉴定系数和所述第二敏感鉴定系数进行计算,获得综合敏感鉴定系数,输入串行嵌入于所述语义开放鉴定通道的开放审核通道内,获得开放审核结果,所述开放审核结果包括开放、人工审核和不开放。2.根据权利要求1所述的方法,其特征在于,根据目标档案馆内的多级公开敏感内容,获取多级公开敏感词集合,并获得多级公开敏感内容的多个敏感值数据库,包括:获取所述目标档案馆内的多级公开敏感内容,并构建获得多级公开敏感词集合;根据所述多级公开敏感词集合的敏感程度,进行敏感值分配,获得多个敏感值集合;构建所述多级公开敏感词集合和多个敏感值集合的映射关系,获得所述多个敏感值数据库。3.根据权利要求1所述的方法,其特征在于,基于独热编码,构建鉴定词典,其中,所述鉴定词典内包括所述多级公开敏感词集合的多个敏感独热编码集合,包括:获取所述目标档案馆内档案的词集合和词总量,并将词总量记为N;基于N位寄存器,构建所述词集合内每个词的独热编码,获得所述鉴定词典;汇总所述多级公开敏感词集合内公开敏感词的独热编码,获得所述多个敏感独热编码集合。4.根据权利要求1所述的方法,其特征在于,筛选所述目标独热编码集合内的敏感独热编码,计算获得多个累计独热值和多个累计敏感值,输入敏感词开放鉴定通道内的第一鉴定分支和第二鉴定分支内,获得第一敏感鉴定系数,包括:筛选所述目标独热编码集合内的敏感独热编码,获得目标敏感独热编码集合;根据所述目标敏感独热编码集合和多个敏感独热编码集合,统计获取所述多级公开敏感内容的多个累计独热值,将所述目标独热编码集合对应的公开敏感词输入所述多个敏感值数据库,计算获得所述多级公开敏感内容的所述多个累计敏感值;根据所述多级公开内容的敏感程度,进行权重分配,获得包括多个权值的权重分配结果,分别对所述多个累计独热值和多个累计敏感值进行加权计算,获得总累计独热值和总累计敏感值;构建所述敏感词开放鉴定通道,所述敏感词开放鉴定通道包括第一鉴定分支和第二鉴定分支;
将所述总累计独热值和总累计敏感值输入所述第一鉴定分支和第二鉴定分支,对两个输出结果进行加权计算,获得所述第一敏感鉴定系数。5.根据权利要求4所述的方法,其特征在于,构建所述敏感词开放鉴定通道,包括:对所述目标档案馆的档案开放鉴定数据进行数据挖掘,获得样本总累计独热值集合、样本总累计敏感值集合和样本第一敏感鉴定系数集合;以总累计独热值为决策特征,基于所述样本总累计独热值集合,构建多层第一决策节点,每层第一决策节点对输入的总累计独热值进行二分类划分决策...
【专利技术属性】
技术研发人员:邹华,徐志国,秦岭,蒋守国,章瑾,王楠,宋永生,臧萌,周红,李军,郭晓华,韦秀霞,
申请(专利权)人:江苏联著实业股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。