一种多源异构的档案归档方法和系统技术方案

技术编号:38751105 阅读:8 留言:0更新日期:2023-09-09 11:17
本发明专利技术涉及一种多源异构的档案归档方法和系统,包括S101:接收待归档的第一数据;S102:基于预建立的统一数据模型,对第一数据进行抽象处理得到第二数据;S103:输出所述第二数据。本发明专利技术的技术方案可对多源异构档案进行反范式处理,提高了信息定位和检索效率。提高了信息定位和检索效率。提高了信息定位和检索效率。

【技术实现步骤摘要】
一种多源异构的档案归档方法和系统


[0001]本专利技术属于数据处理领域,尤其涉及一种多源异构的档案归档方法和系统。

技术介绍

[0002]在政务服务事项电子文件归档的实践过程中,发现全市各区县档案面对的单位多、档案类别多、数据量大等情况时,仅采用由前端应用系统组织数据包推送到数字档案室系统,电子文件归档过程存在着数据质量把控不严、四性检测难,无法做到清晰维护电子文件“来源可靠,程序规范,要素合规”等问题。

技术实现思路

[0003]为了解决现有技术中的上述问题,本专利技术一方面提出了一种多源异构的档案归档方法及装置。其中,方法包括:S101:接收待归档的第一数据;S102:基于预建立的统一数据模型,对第一数据进行抽象处理得到第二数据;S103:输出所述第二数据。
[0004]可选地,建立所述统一数据模型的方法包括:构建统一数据模型的逻辑结构得到逻辑模型,其中,所述逻辑结构包括信息包,其中,保存描述信息和业务内容信息构成SIP包的描述信息,SIP包中的信息与其他模型中的数据具备预设的映射关系;所述SIP包的描述信息与外部描述信息构成AIP包的描述信息。
[0005]可选地,所述方法还包括将所述逻辑模型转换为物理模型,包括:构建物理模型中记录模型预设信息的顶层节点;其中,在所述节点中设置表述不同所述信息包中信息的信息容器,其中,不同信息容器之间可自定义组合。
[0006]可选地,所述方法还包括:接收数据检索请求,将所述检索请求指示的关键词作为描述信息对所述第二数据进行检索。
[0007]可选地,所述SIP包中的信息与ISO23081和PREMIS数据模型中的实体信息具备预设的映射关系。
[0008]另一方面还提出一种多源异构的档案归档装置,该装置包括:接收单元,被配置成接收待归档的第一数据;抽象单元,被配置成基于预建立的统一数据模型,对第一数据进行抽象处理得到第二数据;输出单元,被配置成输出所述第二数据。
[0009]可选地,建立所述统一数据模型的装置被配置成:逻辑模型构建单元,构建统一数据模型的逻辑结构得到逻辑模型,其中,所述逻辑结构包括信息包,其中,保存描述信息和业务内容信息构成SIP包的描述信息,SIP包中的信息与其他模型中的数据具备预设的映射关系;所述SIP包的描述信息与外部描述信息构成AIP包的描述信息。
[0010]可选地,所述装置还被配置成将所述逻辑模型转换为物理模型,包括:
[0011]构建物理模型中记录模型预设信息的顶层节点;其中,在所述节点中设置表述不同所述信息包中信息的信息容器,其中,不同信息容器之间可自定义组合。
[0012]可选地,所述装置还包括检索响应单元:接收数据检索请求,将所述检索请求指示的关键词作为描述信息对所述第二数据进行检索。
[0013]可选地,所述SIP包中的信息与ISO23081和PREMIS数据模型中的实体信息具备预设的映射关系。
[0014]本专利技术的有益效果包括:
[0015]1、实现电子政务业务事项业务数据分析和信息抽象处理。
[0016]2、实现基于OAIS模型的政务电子档案统一数据模型(UDM)的构建。
[0017]3、实现统一数据模型(UDM)中的SIP数据包结构。
[0018]4、实现逻辑模型向物理模型的转换指引。
[0019]5、可对多源异构档案进行反范式处理,从而统一数据格式。
[0020]6、可根据数据的业务信息选择存储方式,从而使有限的资源得到充分利用。
[0021]7、可根据数据是否存在业务流程以选择是否创建节点,以及存储块的创建方式。
【附图说明】
[0022]此处所说明的附图是用来提供对本专利技术的进一步理解,构成本申请的一部分,但并不构成对本专利技术的不当限定,在附图中:
[0023]图1是本专利技术一种多源异构的档案归档方法的流程图。
[0024]图2是本专利技术中的政务电子档案统一数据模型的逻辑模型结构。
[0025]图3是本专利技术中SIP结构与其他模型的映射关系。
[0026]图4是本专利技术中UDM的业务信息Block组织结构。
【具体实施方式】
[0027]下面将结合附图以及具体实施例来详细说明本专利技术,其中的示意性实施例以及说明仅用来解释本专利技术,但并不作为对本专利技术的限定。
[0028]下面对本专利技术的一种多源异构的档案归档方法进行详细说明。
[0029]S101:接收待归档的第一数据。
[0030]其中,待归档的数据可为各种格式的文件,服务器可为客户端提供专用接口,从而令客户通过客户端进行数据上传。
[0031]S102:基于预建立的统一数据模型,对第一数据进行抽象处理得到第二数据;
[0032]S103:输出所述第二数据。
[0033]由于不同来源的数据文件通常包含不同类型的范式表,若直接进行数据处理,会增大数据检索和数据处理的工作量。通过本实施例对不同类型数据的反范式处理,可使归档数据的表达形式统一。进而,尽管内部业务信息的表达会千变万化,但是从外层信息封装来看,任何业务数据的归档数据表达形式都是一致的。
[0034]在具体实现过程中,可以数据文档化的形式过嵌入和引用、附加表,通过适当增加数据冗余度来摆脱传统第三范式的束缚,具体到系统中实现时就是对那些并不直接参与管理的数据,尤其是业务信息通过XML、JSON等形式直接存储到数据库中,在数据文档中通过数据嵌套和引用剔除其中表与表之间关系等信息,重新构造业务本身信息的完整表达。
[0035]作为本实施例一种可选的实现方式,建立所述统一数据模型的方法包括:构建统一数据模型的逻辑结构得到逻辑模型,其中,所述逻辑结构包括信息包,其中,保存描述信息和业务内容信息构成SIP包的描述信息,SIP包中的信息与其他模型中的数据具备预设的
映射关系;所述SIP包的描述信息与外部描述信息构成AIP包的描述信息。
[0036]作为本实施例一种可选的实现方式,所述方法还包括将所述逻辑模型转换为物理模型,包括:构建物理模型中记录模型预设信息的顶层节点;其中,在所述节点中设置表述不同所述信息包中信息的信息容器,其中,不同信息容器之间可自定义组合。
[0037]作为本实施例一种可选的实现方式,所述SIP包中的信息与ISO23081和PREMIS数据模型中的实体信息具备预设的映射关系。
[0038]本实施例的数据可以是政务电子档案数据,政务电子档案统一数据模型(UDM)包括逻辑模型构建,UDM模型的结构如图2所示,UDM在逻辑模型的设计上参考了OAIS信息模型。一个完整UDM是由包描述信息、业务信息、保存描述信息以及外部描述信息几个部分共同构成,通过图2所示一个嵌套的逻辑图形能够清晰地展现出各个部分相互关联的业务逻辑关系。具体的政务电子档案统一数据模型UDM包括SIP包和AIP包,其中SIP包是提交信息包,具体是指信息生产者提供的数据包,其包含一些内容信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多源异构的档案归档方法,其特征在于,该方法包括如下步骤:S101:接收待归档的第一数据;S102:基于预建立的统一数据模型,对第一数据进行抽象处理得到第二数据;S103:输出所述第二数据。2.根据权利要求1所述的多源异构的档案归档方法,其特征在于,建立所述统一数据模型的方法包括:构建统一数据模型的逻辑结构得到逻辑模型,其中,所述逻辑结构包括信息包,其中,保存描述信息和业务内容信息构成SIP包的描述信息,SIP包中的信息与其他模型中的数据具备预设的映射关系;所述SIP包的描述信息与外部描述信息构成AIP包的描述信息。3.根据权利要求2所述的多源异构的档案归档方法,其特征在于,所述方法还包括将所述逻辑模型转换为物理模型,包括:构建物理模型中记录模型预设信息的顶层节点;其中,在所述节点中设置表述不同所述信息包中信息的信息容器,其中,不同信息容器之间可自定义组合。4.根据权利要求1

3任一项所述的多源异构的档案归档方法,其特征在于,所述方法还包括:接收数据检索请求,将所述检索请求指示的关键词作为描述信息对所述第二数据进行检索。5.根据权利要求2所述的多源异构的档案归档方法,其特征在于,所述SIP包中的信息与ISO23081和PREMIS数据模型中的实体信息具备预设的映射关系。6.一种多源异构的档案归档装置,其特征在于...

【专利技术属性】
技术研发人员:盛忠波
申请(专利权)人:杭州安铂数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1