一种基于赋能思维的工程档案智能收整方法及系统技术方案

技术编号:32517391 阅读:21 留言:0更新日期:2022-03-02 11:14
本发明专利技术公开了一种基于赋能思维的工程档案智能收整方法及系统,包括智能收集、智能分类、智能鉴定、智能组卷、智能编目及智能签证六个步骤,智能收集步骤包括自动接收、智能审核及自动登记;智能分类步骤包括归属类目划分和分类号确定;智能鉴定步骤包括保管期限划分与密级鉴定;智能组卷步骤包括智能辅助组卷、案卷排序与卷内文件排序;智能编目步骤包括自动生成页码和档号;智能签证步骤包括签证智能办理与签字智能鉴定。该方法主要面向工程档案收整工作的智能化,通过对实际问题进行挖掘,分析重点需求,主要融合数据、技术与知识等赋能要素,确保工程档案收整规范性,并有效提升工程档案的收整效率。程档案的收整效率。程档案的收整效率。

【技术实现步骤摘要】
一种基于赋能思维的工程档案智能收整方法及系统


[0001]本专利技术涉及档案管理
,具体涉及一种基于赋能思维的工程档案智能收整方法及系统。

技术介绍

[0002]工程档案作为支撑工程建设的重要信息资源,是整个项目管理过程中的关键组成部分,涉及招投标管理、监理、设计及改扩建等多个环节,文件种类复杂,参建单位较多。数字环境下,工程档案数量急剧增加、工程档案资源类型更为多样,手工的档案收整方式显露出程序繁琐、效率低下、重复性劳动多且极易出现疏漏等内生性问题。
[0003]随着这些问题的日益突显,采用智能化手段突破传统收整方式的困境,确保收整程序化、精准化和高效化的需求更为迫切,因此,各类智能管理系统或平台也被愈发广泛地用作档案收整的有效工具,例如基于大数据的智能收集系统、基于黑白名单的智能鉴定系统等。基于大数据的智能收集系统:由档案信息采集端、通讯模块、服务器、客户端和云存储器等组成,将嵌入式处理器置入档案信息采集端,并以大数据为背景,使得档案信息的采集端移动性较佳,且覆盖范围极广,方便用户档案信息的上传。基于黑白名单的智能鉴定系统:设定黑白名单(白名单中保存有所述待鉴定电子文件属于特定保存期限的关键词,黑名单中保存有排除所述待鉴定电子文件属于特定保存期限的关键词),提取待鉴定电子文件的元数据,运用模式匹配自动生成待鉴定电子文件的保存期限。
[0004]上述系统为档案智能采集和鉴定提供了新的方法,但上述系统由于功能单一,既无法挖掘多功能间的集成效应,也无法实现档案收整全流程智能化。
[0005]从系统平台构建来看,现有实现方案大多只应用了传统的技术手段,很大程度上仍依赖于人工处理,如“一种智能化档案管理系统”(公开号:CN108577225A)、“一种智能档案管理系统及应用”(公开号:CN106529812A)、“一种工商数字档案管理系统”(公开号:CN112052216A)、“一种用于会计电子档案管理的系统及方法”(公开号:CN109902211A)、“一种档案管理方法”(公开号:CN109491963A)等,这些档案管理系统或方法主要应用了扫描技术、传感技术、加密技术和RFID技术,自动化、智能化水平相对较低。
[0006]从智能化技术应用及技术赋能角度来看,现有智能化方案仅针对档案管理的某一环节进行方案构建,并未实现档案收整全流程的智能化方案设计,如“基于云计算的智能档案检索处理系统”(公开号:CN111651619A)、“一种基于深度学习的电子档案智能处理方法”(公开号:CN109658062A)、“一种基于OCR文字识别的医院纸质档案归档方法及系统”(公开号:CN110705515A)、“基于神经网络的电子图像文件自动分类方法”(公开号:CN111767418A),这些实现方案虽应用到了云计算、深度学习、OCR文字识别等技术,但每个方案仅分别针对档案检索、处理、归档、分类的单一功能,未能实现档案全流程智能化管理。
[0007]从行业领域来看,应用技术手段开展档案管理的方案涉及了工商数字档案、会计电子档案、城建档案等领域,这些不能很好地适应工程项目档案体量大、类型多、主体广的特点,不能满足工程项目档案现实收整需求,因此在工程档案智能收整领域的实现方案存
在一定空白。
[0008]目前的系统设计多侧重于解决某一环节所涉及的问题,智能化水平较低,应用范围较为局限,大多只涵盖一种或几种特定的业务,例如,基于大数据的智能收集系统仅针对档案图像的采集和云存储,功能和对象均呈现单一化,且图像识别等智能化手段未能得到很好地运用;基于黑白名单的智能鉴定系统虽运用元数据和模式匹配等智能方式完成智能鉴定,但生成的信息仅限于保存期限,属于鉴定范畴的密级鉴定并未涉及。
[0009]而工程档案工作作为一个完整的流程,数据来源于不同的业务系统,因此在协同合作中容易产生数据异构问题;并且现有的各业务系统对于人工智能技术的应用处于初级阶段,智能化水平依旧有待提升。

技术实现思路

[0010]本专利技术的目的就是要提供一种基于赋能思维的工程档案智能收整方法及系统,该方法主要面向工程档案收整工作的智能化,通过对实际问题进行挖掘,分析重点需求,主要融合数据、技术与知识等赋能要素,确保工程档案收整规范性,并有效提升工程档案的收整效率。
[0011]为实现上述目的,本专利技术所设计的一种基于赋能思维的工程档案智能收整方法,其特征在于,该方法包括以下步骤:
[0012]步骤1:智能收集,通过应用人工智能算法,以智能化方式完成其他业务系统接口归档文件的自动接收、审核和登记;
[0013]步骤2:智能分类,借助人工智能算法处理与分析工程档案文本内容,从而自动划分归属类目和确定分类号;
[0014]步骤3:智能鉴定,借助人工智能算法提取智能分类结果与形成规则集,再通过规则引擎对其进行调用,从而自动划分归属类目和确定分类号;
[0015]步骤4:智能组卷,模拟现实中实体档案组卷、排列的过程,完成智能辅助组卷、案卷排序与卷内文件排序;
[0016]步骤5:智能编目,通过集成深度学习和自然语言处理算法,实现页码自动编写和档号自动生成两项独立功能;
[0017]步骤6:智能签证,引入人工智能算法实现竣工档案签证流程智能化。
[0018]进一步地,所述步骤1中还包括以下步骤:
[0019]步骤1.1:添加自动化接收程序,实现对其他业务系统接口归档文件的批量智能化自动接收,并进行预处理;
[0020]步骤1.2:通过算法识别PDF、ODF格式的文本档案、照片档案及其他多媒体类档案,再借助信息抽取算法对所识别信息的词法、句法进行分析,实现文本内容、文本结构及元数据的全面提取,实现智能算法与档案数据资源的赋能作用;
[0021]步骤1.3:进入智能审核环节,审查电子档案是否符合归档范围,是否存在质量问题,对于不符合要求的档案进行剔除;
[0022]步骤1.4:启动登记进程,自动赋予电子档案唯一的标识符,并借助自然语言处理算法提取表单著录项,采用特征匹配算法将文件内容和信息著录项进行字段匹配,实现登记表信息的自动填充。
[0023]进一步地,所述步骤2中还包括以下步骤:
[0024]步骤2.1:应用识别算法对已登记的工程项目文档类和多媒体类电子档案进行识别;
[0025]步骤2.2:采用自然语言处理算法对识别后的工程档案进行基础分析、属性分析、语义分析、结构分析,根据预先设定的归档模板找到档案文本属性和档案归档类别之间的关系模型;
[0026]步骤2.3:在现有工程档案集合中抽样扫描件,根据学习算法的输入要求清洗数据,构造训练集和测试集,并通过不断完善模型取得预期的学习效果;
[0027]步骤2.4:将已登记的工程档案输入关系模型中,匹配至归档模块中的归档范围,并进一步细化归档类目实现全宗内档案归属类目智能划分;
[0028]步骤2.5:在档案类目准确划分的基础之上,依据二级类目名称匹配到归档模板所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于赋能思维的工程档案智能收整方法,其特征在于,该方法包括以下步骤:步骤1:智能收集,通过应用人工智能算法,以智能化方式完成其他业务系统接口归档文件的自动接收、审核和登记;步骤2:智能分类,借助人工智能算法处理与分析工程档案文本内容,从而自动划分归属类目和确定分类号;步骤3:智能鉴定,借助人工智能算法提取智能分类结果与形成规则集,再通过规则引擎对其进行调用,从而自动划分归属类目和确定分类号;步骤4:智能组卷,模拟现实中实体档案组卷、排列的过程,完成智能辅助组卷、案卷排序与卷内文件排序;步骤5:智能编目,通过集成深度学习和自然语言处理算法,实现页码自动编写和档号自动生成两项独立功能;步骤6:智能签证,引入人工智能算法实现竣工档案签证流程智能化。2.根据权利要求1所述的一种基于赋能思维的工程档案智能收整方法,其特征在于:所述步骤1中还包括以下步骤:步骤1.1:添加自动化接收程序,实现对其他业务系统接口归档文件的批量智能化自动接收,并进行预处理;步骤1.2:通过算法识别PDF、ODF格式的文本档案、照片档案及其他多媒体类档案,再借助信息抽取算法对所识别信息的词法、句法进行分析,实现文本内容、文本结构及元数据的全面提取,实现智能算法与档案数据资源的赋能作用;步骤1.3:进入智能审核环节,审查电子档案是否符合归档范围,是否存在质量问题,对于不符合要求的档案进行剔除;步骤1.4:启动登记进程,自动赋予电子档案唯一的标识符,并借助自然语言处理算法提取表单著录项,采用特征匹配算法将文件内容和信息著录项进行字段匹配,实现登记表信息的自动填充。3.根据权利要求1所述的一种基于赋能思维的工程档案智能收整方法,其特征在于:所述步骤2中还包括以下步骤:步骤2.1:应用识别算法对已登记的工程项目文档类和多媒体类电子档案进行识别;步骤2.2:采用自然语言处理算法对识别后的工程档案进行基础分析、属性分析、语义分析、结构分析,根据预先设定的归档模板找到档案文本属性和档案归档类别之间的关系模型;步骤2.3:在现有工程档案集合中抽样扫描件,根据学习算法的输入要求清洗数据,构造训练集和测试集,并通过不断完善模型取得预期的学习效果;步骤2.4:将已登记的工程档案输入关系模型中,匹配至归档模块中的归档范围,并进一步细化归档类目实现全宗内档案归属类目智能划分;步骤2.5:在档案类目准确划分的基础之上,依据二级类目名称匹配到归档模板所设定的分类号,并支持由授权用户为新创建的案卷设置分类代码。4.根据权利要求1所述的一种基于赋能思维的工程档案智能收整方法,其特征在于:所述步骤3中还包括以下步骤:步骤3.1:创建规则引擎,确定调用规则集的接口;
步骤3.2:将外部的业务规则经编译后加载到规则集中,供规则引擎调用执行;步骤3.3:提取智能分类的结果作为规则集处理的数据对象集合,并加入工作存储器中;步骤3.4:引擎执行规则匹配命令,将工作存储器中的应用对象与规则集容器中规则的条件部分进行匹配,返回分类号在归档模板和保管期限表中所对应的值,导出初步判定结果,对于事先带有保管期限和密级的档案,将智能鉴定结果与原有记录进行比对,若比对结果不一致,则将对原有保管期限和密级鉴定结果进行标记。5.根据权利要求1所述的一种基于赋能思维的工程档案智能收整方法,其特征在于:所述步骤4中还包括以下步骤:步骤4.1:将鉴定完毕的文件输入机器学习的模型之中;步骤4.2:将所设定的卷内文件排列与组卷规则、排列与组卷实践中的操作规范和经验总结纳入深度学习的规则库,用以支撑深度学习模型;步骤4.3:应用已排序和组卷的文件集合对系统进行训练建模,形成计算机可读取的排序与组卷规律;步骤4.4:通过卷内文件排序规律识别文件的...

【专利技术属性】
技术研发人员:陈慧张凯南梦洁罗慧玉
申请(专利权)人:北京暗能量软件有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1