一种档案电子文件自动批量挂接的方法、系统及存储介质技术方案

技术编号:39006198 阅读:51 留言:0更新日期:2023-10-07 10:37
本发明专利技术公开了一种档案电子文件自动批量挂接的方法、系统及存储介质,包括:首先进行初始化配置;通过物理存储介质将电子文件上传至服务器指定目录;配置定时触发电子文件批量挂接任务,定时触发完成批量挂接任务;依次读取电子文件的MD5值,判断电子文件是否已挂接;跳过已挂接的电子文件,并读取未挂接的电子文件名称,与电子文件目录库进行匹配;符合匹配规则的电子文件存入电子文件库,并与电子文件目录数据进行关联,完成挂接,记录挂接状态为成功,跳过不符合匹配规则的电子文件,并记录挂接状态为失败;本发明专利技术能够提升电子文件的上传速度、减少人工工作量,达到在减少人力依赖的基础上,实现电子文件高效自动批量挂接。实现电子文件高效自动批量挂接。实现电子文件高效自动批量挂接。

【技术实现步骤摘要】
一种档案电子文件自动批量挂接的方法、系统及存储介质


[0001]本专利技术涉及档案自动挂接
,具体为一种档案电子文件自动批量挂接的方法、系统及存储介质。

技术介绍

[0002]电子文件挂接是档案数字化过程中不可或缺的一个环节,是档案信息查借阅、档案编研的前提条件,是档案数字化管理的基石。它将电子档案目录数据与电子文件进行了关联,进而实现了线上系统对档案电子文件的管理。
[0003]目前,现有的电子文件挂接通常需要档案操作员事先准备好电子文件压缩包,然后登录系统页面,手工上传电子文件压缩包进行挂接,这种挂接方式挂接速度较慢,其主要原因有以下两个方面,一方面,主流浏览器页面上传文件大小有限制,一般单次上传文件不允许超过2G;另一方面,采用http进行网络上传电子文件,上传速度受网络带宽影响比较大。当电子文件数据量比较大时,采用这种挂接方式费时费力,如当有3.0T电子文件需要挂接时,需制作电子文件压缩包1536个,上传1536次电子文件压缩包;在上传速度为2M/s系统中挂接,上传文件时间大概需要1750小时,需要近50天。现有的电子文件挂接方法主要存在以下缺陷:
[0004](1)文件上传时间长,上传速度受限于浏览器页面上传文件大小的限制及网速,不利于提高文件挂接效率;
[0005](2)电子文件挂接时依赖人工操作较多,如电子文件包制作和上传等,对人工的依赖程度较大,浪费人力且效率较低。
[0006]因此,我们需要开发出一种档案电子文件自动批量挂接的方法与系统,能够提升电子文件的上传速度、减少人工工作量,达到在减少人力依赖的基础上,实现电子文件高效自动批量挂接。

技术实现思路

[0007]本专利技术的目的在于提供一种档案电子文件自动批量挂接的方法、系统及存储介质,以解决上述
技术介绍
中提到的现有的文件上传时间长、对人工的依赖程度大以及电子文件挂接效率低等问题。
[0008]为实现上述目的,本专利技术采用以下技术方案:
[0009]根据本专利技术的一个方面,提供一种档案电子文件自动批量挂接的方法,所述方法包括:
[0010]进行初始化配置,配置电子文件上传目录及批量挂接字段,导入所述电子文件目录数据,保存形成电子文件目录库;
[0011]通过物理存储介质将所述电子文件上传至服务器指定目录;
[0012]配置定时触发所述电子文件批量挂接任务,定时触发单元自动扫描所述服务器指定目录,依次处理所述电子文件;
[0013]读取所述电子文件的MD5值,查找电子文件库中是否已存在所述MD5值;
[0014]若存在,则跳过所述电子文件,返回上一步,对下一电子文件进行处理;
[0015]若不存在,则继续读取所述电子文件的电子文件名称,并与所述电子文件目录库进行匹配;
[0016]若匹配,则将所述电子文件存入所述电子文件库中,并将所述电子文件同匹配的所述电子文件目录数据进行关联,所述电子文件挂接成功,返回第四步,自动继续处理下一个电子文件,直至所述服务器指定目录下的所述电子文件全部处理完成;
[0017]若不匹配,则挂接失败,记录挂接状态为失败,返回第四步,自动继续处理下一个电子文件,直至所述服务器指定目录下的所述电子文件全部处理完成。
[0018]根据本专利技术的另一个方面,提供一种档案电子文件自动批量挂接的系统,包括:
[0019]信息配置单元:用于进行初始化配置,配置电子文件上传目录及批量挂接字段,导入所述电子文件目录数据,保存形成电子文件目录库;
[0020]定时触发单元:用于配置定时触发所述电子文件批量挂接任务,批量挂接任务模块定时自动扫描服务器指定目录,依次处理所述电子文件;
[0021]批量挂接单元:读取所述电子文件的MD5值,查找电子文件库中是否已存在所述MD5值,并根据查找的结果进行下一步处理;读取所述电子文件的电子文件名称,并与所述电子文件目录库进行匹配,并根据匹配结果完成挂接;
[0022]服务器单元:用于存储电子文件目录数据、电子文件、电子文件信息及电子文件的挂接状态。
[0023]基于前述方案,上述MD5值通过读取所述电子文件内容,并依据所述电子文件内容生成的n位字符串。
[0024]基于前述方案,上述电子文件名称包括第一名称标识和第二名称标识。
[0025]基于前述方案,上述读取所述电子文件的电子文件名称,并与所述电子文件目录库进行匹配的方法,包括:
[0026]将所述电子文件名称分割为第一名称标识和第二名称标识;
[0027]通过所述第一名称标识自动查询并确定所述电子文件对应的电子文件目录库;
[0028]查询所述对应的电子文件目录库中是否存在与所述第二名称标识相等的所述挂接字段。
[0029]基于前述方案,上述将所述电子文件同匹配的所述电子文件目录数据进行关联的方法,包括:
[0030]所述电子文件存入所述电子文件库中后,形成唯一标识ID;
[0031]将所述唯一标识ID存入档案目录数据中,更新所述电子文件目录库。
[0032]基于前述方案,上述电子文件挂接成功后,将所述电子文件信息和挂接成功信息保存到电子文件库中,以供操作人员查询。
[0033]基于前述方案,上述所述电子文件目录数据包括但不限于档案类型、全宗号、题名、档号、件号、年度、机构、成文日期、文号、实体份数、责任者、页数、录入者、移交部门、保管期限、密级、归档时间及有无实体;所述挂接字段为所述电子文件目录数据中的任一种。
[0034]基于前述方案,上述电子文件信息包括但不限于所述电子文件名称、所述电子文件大小、所述电子文件存放地址及所述电子文件的MD5值。
[0035]本专利技术实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行代码;所述计算机可执行代码被执行后,能够实现前述一个或多个技术方案提供的方法。
[0036]由上述技术方案可知,本专利技术与现有技术相比至少具备以下优点和积极效果:
[0037](1)本专利技术通过物理存储介质上传电子文件,一方面不再受浏览器页面上传文件大小的限制,另一方面上传速度也不受网络带宽影响,提高了文件上传的速度,在很大程度上节省了上传电子文件时间,进而提高了电子文件挂接的效率。
[0038](2)本专利技术电子文件的挂接可以按照配置好的各项参数,通过配置定时触发任务,可调用程序定时自动完成电子文件挂接任务,避免了人工页面上传电子文件压缩包,节省人工操作量,提升了挂接效率。
[0039]本专利技术应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。
附图说明
[0040]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种档案电子文件自动批量挂接的方法,其特征在于,所述方法包括:进行初始化配置,配置电子文件上传目录及批量挂接字段,导入所述电子文件目录数据,保存形成电子文件目录库;通过物理存储介质将所述电子文件上传至服务器指定目录;配置定时触发所述电子文件批量挂接任务,定时触发单元自动扫描所述服务器指定目录,依次处理所述电子文件;读取所述电子文件的MD5值,查找电子文件库中是否已存在所述MD5值;若存在,则跳过所述电子文件,返回上一步,对下一电子文件进行处理;若不存在,则继续读取所述电子文件的电子文件名称,并与所述电子文件目录库进行匹配;若匹配,则将所述电子文件存入所述电子文件库中,并将所述电子文件同匹配的所述电子文件目录数据进行关联,所述电子文件挂接成功,返回第四步,自动继续处理下一个电子文件,直至所述服务器指定目录下的所述电子文件全部处理完成;若不匹配,则挂接失败,记录挂接状态为失败,返回第四步,自动继续处理下一个电子文件,直至所述服务器指定目录下的所述电子文件全部处理完成。2.根据权利要求1所述的一种档案电子文件自动批量挂接的方法,其特征在于,所述MD5值通过读取所述电子文件内容,并依据所述电子文件内容生成的n位字符串。3.根据权利要求1所述的一种档案电子文件自动批量挂接的方法,其特征在于,所述电子文件名称包括第一名称标识和第二名称标识。4.根据权利要求1或3任一项所述的一种档案电子文件自动批量挂接的方法,其特征在于,所述读取所述电子文件的电子文件名称,并与所述电子文件目录库进行匹配的方法,包括:将所述电子文件名称分割为第一名称标识和第二名称标识;通过所述第一名称标识自动查询并确定所述电子文件对应的电子文件目录库;查询所述对应的电子文件目录库中是否存在与所述第二名称标识相等的所述挂接字段。5.根据权利要求1所述的一种档案电子文件自动批量挂接的方法,其特征在于,所述将所述电子文件同匹配...

【专利技术属性】
技术研发人员:吴限胡国俊廖语晨范捷平徐江华
申请(专利权)人:深圳市雁联计算系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1