【技术实现步骤摘要】
一种异构多源系统电子文件归档方法
[0001]本专利技术涉及数据处理
,具体来说,涉及一种异构多源系统电子文件归档方法。
技术介绍
[0002]电子文件指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件,其信息以二进制数字代码记录和表示,因此也可称为“数字文件”。随着信息技术的迅猛发展,电子文件已经越来越广泛地取代了纸质文件的使用。电子化的文件管理流程解决了传统的纸质文件归档过程中所存在的纸质档案整理费时、维护不便、浪费资源、受限于实体位置和环境等众多问题。相应地,如何合理且高效地对电子文件进行归档和管理也成为大家关注的焦点。
[0003]随着大数据、互联网的发展,出现越来越多的业务数据融合的需求,如各业务系统电子文件的在线归档。各个业务系统都是独立建设,烟囱系统较多,系统独立、数据孤岛、无法基于现有系统构建数据中台和归档平台,无法进行统一的数据标准的建立,无法实现在线各个业务系统数据的融入和归档。目前,各个烟囱系统汇聚到大数据系统或档案 ...
【技术保护点】
【技术特征摘要】
1.一种异构多源系统电子文件归档方法,其特征在于,该方法包括以下步骤:S1、接口形式定义:对业务系统的中间库进行授权定义;S2、归档包结构定义:采用基于可扩展标记语言的数据交换方式进行归档包结构定义;S3、映射配置:将归档包中的结构化要素内容与档案系统中对应的数据库表的字段进行对应匹配;S4、枚举映射:针对归档包中的枚举内容项进行配置映射,完成枚举项值的多枚举匹配;S5、数据接收:基于接口形式定义和归档包结构定义进行归档包数据接收,并依据定义的归档包结构进行数据解析;S6、数据管理:根据接收的电子原文和可扩展标记语言要素数据组织进行数据持久化存储;其中,所述对业务系统的中间库进行授权定义包括中间库形式配置,所述中间库形式配置包括以下步骤:利用业务系统将结构化数据推送至中间数据库,并将电子文件推送至中间存储服务。2.根据权利要求1所述的一种异构多源系统电子文件归档方法,其特征在于,所述中间库的配置包括中间数据库类型、中间库IP、中间库端口、中间库实例名、中间库用户名和密码的配置,且配置完毕可以在线进行测试中间库的链接测试,保证中间库链接的畅通;所述中间存储服务的配置包括传输协议、存储服务器IP、存储端口、存储路径、用户名及密码的配置;所述中间库的结构化数据的传输通过JDBC的形式进行链接,底层采用Socket套接字进行链接,所述电子文件中非结构化电子文件的传输通过基于TCP/IP的文件传输协议进行。3.根据权利要求1所述的一种异构多源系统电子文件归档方法,其特征在于,所述归档包中归档的结构化数据通过在可扩展标记语言中进行上级节点及下级节点定义,其中,所述归档的结构化数据的头部信息采用接口调用性验证,请求体为实际传输的结构化信息内容。4.根据权利要求1所述的一种异构多源系统电子文件归档方法,其特征在于,所述依据定义的归档包结构进行数据解析包括以下步骤:根据定义的归档包结构进行解析,对于电子原文内容材料则进行文件保存,对于要素材料可扩展标记语言,则进行要素的一一对应。5.根据权利要求1所述的一种异构多源系统电子文件归档方法,其特征在于,所述根据接收的电子原文和可扩展标记语言要素数据组织进行数据持久化存储包括以下步骤:当归档包接收完毕后,将接收的数据进行持久化保存;并进...
【专利技术属性】
技术研发人员:陈欣,瞿欢,姬辉,何鹏飞,
申请(专利权)人:南京云档信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。