一种异构多源系统电子文件归档方法技术方案

技术编号:32466486 阅读:18 留言:0更新日期:2022-02-26 09:29
本发明专利技术公开了一种异构多源系统电子文件归档方法,该方法包括以下步骤:S1、对中间库或webservice进行授权定义;S2、进行归档包结构定义;S3、将归档包中的结构化要素内容与档案系统中对应的数据库表的字段进行对应匹配;S4、针对归档包中的枚举内容项进行配置映射;S5、基于接口形式定义和归档包结构定义进行归档包数据接收;S6、根据接收的要素数据组织进行数据持久化存储。本发明专利技术彻底解决异构多源系统数据融合归档定制开发的问题,为异构多源业务系统数据归档建立便捷、高速的数据通道,建立精准全面的数据标准,提供有效的数据对接及映射,从而实现异构多源数据系统电子文件融合归档管理。归档管理。归档管理。

【技术实现步骤摘要】
一种异构多源系统电子文件归档方法


[0001]本专利技术涉及数据处理
,具体来说,涉及一种异构多源系统电子文件归档方法。

技术介绍

[0002]电子文件指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件,其信息以二进制数字代码记录和表示,因此也可称为“数字文件”。随着信息技术的迅猛发展,电子文件已经越来越广泛地取代了纸质文件的使用。电子化的文件管理流程解决了传统的纸质文件归档过程中所存在的纸质档案整理费时、维护不便、浪费资源、受限于实体位置和环境等众多问题。相应地,如何合理且高效地对电子文件进行归档和管理也成为大家关注的焦点。
[0003]随着大数据、互联网的发展,出现越来越多的业务数据融合的需求,如各业务系统电子文件的在线归档。各个业务系统都是独立建设,烟囱系统较多,系统独立、数据孤岛、无法基于现有系统构建数据中台和归档平台,无法进行统一的数据标准的建立,无法实现在线各个业务系统数据的融入和归档。目前,各个烟囱系统汇聚到大数据系统或档案系统需要针对每个烟囱系统进行接口对接开发,标准梳理统一,开发周期较久,且系统稳定性差,无法快捷实现异构多源业务系统数据的及时融合。
[0004]针对相关技术中的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]针对相关技术中的问题,本专利技术提出一种异构多源系统电子文件归档方法,包括两种技术实现,分别是中间库实现和在线webservice接口调用实现,以克服现有相关技术所存在的上述技术问题。
[0006]为此,本专利技术采用的具体技术方案如下:根据本专利技术的一个方面,提供了一种异构多源系统电子文件归档方法,该方法包括以下步骤:S1、接口形式定义:对业务系统的中间库进行授权定义;S2、归档包结构定义:采用基于可扩展标记语言的数据交换方式进行归档包结构定义;S3、映射配置:将归档包中的结构化要素内容与档案系统中对应的数据库表的字段进行对应匹配;S4、枚举映射:针对归档包中的枚举内容项进行配置映射,完成枚举项值的多枚举匹配;S5、数据接收:基于接口形式定义和归档包结构定义进行归档包数据接收,并依据定义的归档包结构进行数据解析;S6、数据管理:根据接收的电子原文和可扩展标记语言要素数据组织进行数据持
久化存储;其中,所述对业务系统的中间库进行授权定义包括中间库形式配置,所述中间库形式配置包括以下步骤:利用业务系统将结构化数据推送至中间数据库,并将电子文件推送至中间存储服务。
[0007]进一步的,所述中间库的配置包括中间数据库类型、中间库IP、中间库端口、中间库实例名、中间库用户名和密码的配置,且配置完毕可以在线进行测试中间库的链接测试,保证中间库链接的畅通;所述中间存储服务的配置包括传输协议、存储服务器IP、存储端口、存储路径、用户名及密码的配置;所述中间库的结构化数据的传输通过JDBC的形式进行链接,底层采用Socket套接字进行链接,所述电子文件中非结构化电子文件的传输通过基于TCP/IP的文件传输协议进行。
[0008]进一步的,所述归档包中归档的结构化数据通过在可扩展标记语言中进行上级节点及下级节点定义,其中,所述归档的结构化数据的头部信息采用接口调用性验证,请求体为实际传输的结构化信息内容。
[0009]进一步的,所述依据定义的归档包结构进行数据解析包括以下步骤:根据定义的归档包结构进行解析,对于电子原文内容材料则进行文件保存,对于要素材料可扩展标记语言,则进行要素的一一对应。
[0010]进一步的,所述根据接收的电子原文和可扩展标记语言要素数据组织进行数据持久化存储包括以下步骤:当归档包接收完毕后,将接收的数据进行持久化保存;并进行电子签名保证文件的真实性,进行电子文件号的路径规范存储;同时将电子原文规范化保存到文件服务器。
[0011]根据本专利技术的另一个方面,提供了一种异构多源系统电子文件归档方法,该方法包括以下步骤:S1

、接口形式定义:对业务系统的webservice进行授权定义;S2、归档包结构定义:采用基于可扩展标记语言的数据交换方式进行归档包结构定义;S3、映射配置:将归档包中的结构化要素内容与档案系统中对应的数据库表的字段进行对应匹配;S4、枚举映射:针对归档包中的枚举内容项进行配置映射,完成枚举项值的多枚举匹配;S5、数据接收:基于接口形式定义和归档包结构定义进行归档包数据接收,并依据定义的归档包结构进行数据解析;S6、数据管理:根据接收的电子原文和可扩展标记语言要素数据组织进行数据持久化存储;其中,所述对业务系统的webservice进行授权定义包括webservice形式配置,所述webservice形式配置通过定义在线调用接口url和授权码进行调用传输。
[0012]进一步的,所述webservice形式配置时还包括以下步骤:利用业务系统将非结构化数据和结构化数据进行基于zip的压缩,并采用SHA1WithRSA算法进行zip的签名。
[0013]进一步的,所述归档包中归档的结构化数据通过在可扩展标记语言中进行上级节
点及下级节点定义,其中,所述归档的结构化数据的头部信息采用接口调用性验证,请求体为实际传输的结构化信息内容。
[0014]进一步的,所述依据定义的归档包结构进行数据解析包括以下步骤:根据定义的归档包结构进行解析,对于电子原文内容材料则进行文件保存,对于要素材料可扩展标记语言,则进行要素的一一对应。
[0015]进一步的,所述根据接收的电子原文和可扩展标记语言要素数据组织进行数据持久化存储包括以下步骤:当归档包接收完毕后,将接收的数据进行持久化保存;并进行电子签名保证文件的真实性,进行电子文件号的路径规范存储;同时将电子原文规范化保存到文件服务器。
[0016]本专利技术的有益效果为:1)通过数据标准的在线定义解决了异构多源系统数据不统一的问题;通过归档数据包的配置实现融合归档要素的整合及映射;通过在线调用的动态接口实现数据融合归档的程序调用,从而彻底解决异构多源系统数据融合归档定制开发的问题,从而为异构多源业务系统数据归档建立便捷、高速的数据通道,建立精准全面的数据标准,提供有效的数据对接及映射,从而实现异构多源数据系统电子文件融合归档管理。
[0017]2)通过针对目前烟囱系统数据归档进行了零开发的问题解决,异构多源系统数据归档对接需要进行需求调研、接口定义、接口配置、接口联调,工期和项目及稳定性都很难保障,而本申请的方法无需开发,直接在档案系统进行归档包和接口的定义,动态生成接口程序,无需进行接口开发,解决了异构多源系统数据归档的时效性,保证了档案数据中台系统数据的稳定性。
附图说明
[0018]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异构多源系统电子文件归档方法,其特征在于,该方法包括以下步骤:S1、接口形式定义:对业务系统的中间库进行授权定义;S2、归档包结构定义:采用基于可扩展标记语言的数据交换方式进行归档包结构定义;S3、映射配置:将归档包中的结构化要素内容与档案系统中对应的数据库表的字段进行对应匹配;S4、枚举映射:针对归档包中的枚举内容项进行配置映射,完成枚举项值的多枚举匹配;S5、数据接收:基于接口形式定义和归档包结构定义进行归档包数据接收,并依据定义的归档包结构进行数据解析;S6、数据管理:根据接收的电子原文和可扩展标记语言要素数据组织进行数据持久化存储;其中,所述对业务系统的中间库进行授权定义包括中间库形式配置,所述中间库形式配置包括以下步骤:利用业务系统将结构化数据推送至中间数据库,并将电子文件推送至中间存储服务。2.根据权利要求1所述的一种异构多源系统电子文件归档方法,其特征在于,所述中间库的配置包括中间数据库类型、中间库IP、中间库端口、中间库实例名、中间库用户名和密码的配置,且配置完毕可以在线进行测试中间库的链接测试,保证中间库链接的畅通;所述中间存储服务的配置包括传输协议、存储服务器IP、存储端口、存储路径、用户名及密码的配置;所述中间库的结构化数据的传输通过JDBC的形式进行链接,底层采用Socket套接字进行链接,所述电子文件中非结构化电子文件的传输通过基于TCP/IP的文件传输协议进行。3.根据权利要求1所述的一种异构多源系统电子文件归档方法,其特征在于,所述归档包中归档的结构化数据通过在可扩展标记语言中进行上级节点及下级节点定义,其中,所述归档的结构化数据的头部信息采用接口调用性验证,请求体为实际传输的结构化信息内容。4.根据权利要求1所述的一种异构多源系统电子文件归档方法,其特征在于,所述依据定义的归档包结构进行数据解析包括以下步骤:根据定义的归档包结构进行解析,对于电子原文内容材料则进行文件保存,对于要素材料可扩展标记语言,则进行要素的一一对应。5.根据权利要求1所述的一种异构多源系统电子文件归档方法,其特征在于,所述根据接收的电子原文和可扩展标记语言要素数据组织进行数据持久化存储包括以下步骤:当归档包接收完毕后,将接收的数据进行持久化保存;并进...

【专利技术属性】
技术研发人员:陈欣瞿欢姬辉何鹏飞
申请(专利权)人:南京云档信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1