用于对电子档案封装包进行四性检测的方法及装置制造方法及图纸

技术编号:39437831 阅读:11 留言:0更新日期:2023-11-19 16:21
本公开的实施例提供一种用于对电子档案封装包进行四性检测的方法及装置。该方法包括:解析电子档案封装包的层级结构以生成对应的多叉树模型,多叉树模型中的每个节点包括电子档案封装包中的与该节点对应的数据信息,数据信息包括以下中的一个或多个:元数据信息、元数据路径信息、电子文件路径信息、电子文件实际元信息;将每个元数据信息中的字段标识与目标检测规则中的关键词进行比较,目标检测规则是根据电子档案封装包的四性检测要求确定的检测规则,关键词指示目标检测规则的检测对象;以及响应于字段标识与关键词匹配,借助于多叉树模型获取执行目标检测规则所需的数据信息以执行目标检测规则。信息以执行目标检测规则。信息以执行目标检测规则。

【技术实现步骤摘要】
用于对电子档案封装包进行四性检测的方法及装置


[0001]本公开的实施例涉及档案信息管理领域,具体地,涉及用于对电子档案封装包进行四性检测的方法及装置。

技术介绍

[0002]电子档案封装包的四性是指真实性、完整性、可用性和安全性。真实性指电子档案封装包的内容、逻辑结构和背景与形成时的原始状况相一致的性质。完整性指电子档案封装包的内容、结构和背景信息齐全且没有破坏、变异或丢失的性质。可用性指电子档案封装包可以被检索、呈现和理解的性质。安全性指电子档案封装包的管理过程可控、数据存储可靠,未被破坏、未被非法访问的性质。
[0003]各个单位的电子档案封装包的层级结构各不相同,因此在实践中,需要程序员针对不同的电子档案封装包设计不同的检测规则,而这些检测规则都是客制化的,因此需要的人力成本高。

技术实现思路

[0004]本文中描述的实施例提供了一种用于对电子档案封装包进行四性检测的方法、装置以及存储有计算机程序的计算机可读存储介质。
[0005]根据本公开的第一方面,提供了一种用于对电子档案封装包进行四性检测的方法。该方法包括:解析电子档案封装包的层级结构以生成对应的多叉树模型,多叉树模型中的每个节点包括电子档案封装包中的与该节点对应的数据信息,数据信息包括以下中的一个或多个:元数据信息、元数据路径信息、电子文件路径信息、电子文件实际元信息;将每个元数据信息中的字段标识与目标检测规则中的关键词进行比较,目标检测规则是根据电子档案封装包的四性检测要求确定的检测规则,关键词指示目标检测规则的检测对象;以及响应于字段标识与关键词匹配,借助于多叉树模型获取执行目标检测规则所需的数据信息以执行目标检测规则。
[0006]在本公开的一些实施例中,解析电子档案封装包的层级结构以生成对应的多叉树模型包括:将电子档案封装包的包目录文件与多叉树模型的根节点相关联;在包目录文件中检测数组型数据;响应于在包目录文件中检测到数组型数据,生成根节点的子节点并将数组型数据与所生成的子节点相关联;在每个子节点中包括的元数据路径信息所对应的子目录文件中检测数组型数据;以及响应于在子目录文件中检测到数组型数据,生成子节点的下一级节点并将数组型数据与所生成的下一级节点相关联。
[0007]在本公开的一些实施例中,借助于多叉树模型获取执行目标检测规则所需的数据信息以执行目标检测规则包括:解析目标检测规则以确定目标检测规则需使用的检测器和目标检测规则所涉及的所有字段标识;将目标检测规则所涉及的所有字段标识中的每个字段标识作为目标字段标识并执行以下操作:在多叉树模型中从根节点开始逐层查找目标字段标识;响应于在当前层中目标字段标识未被查找到,在当前层的下一层查找目标字段标
识;响应于在当前层中目标字段标识对应的字段内容包括非法字符或者为空,在当前层的下一层查找目标字段标识的等效字段标识,等效字段标识对应的字段内容能够计算或者推导出目标字段标识的字段内容;响应于在多叉树模型中查找到目标字段标识,将目标字段标识和目标字段标识对应的字段内容输入所确定的检测器;以及响应于在多叉树模型中查找到等效字段标识,将等效字段标识和等效字段标识对应的字段内容输入所确定的检测器。
[0008]在本公开的一些实施例中,借助于多叉树模型获取执行目标检测规则所需的数据信息以执行目标检测规则还包括:响应于目标检测规则涉及对目标电子文件本身的检测,通过多叉树模型中的目标电子文件的电子文件路径信息来获取目标电子文件,并将目标电子文件输入所确定的检测器。
[0009]在本公开的一些实施例中,借助于多叉树模型获取执行目标检测规则所需的数据信息以执行目标检测规则还包括:响应于目标检测规则涉及对目标电子文件的实际元信息的检测,从多叉树模型中获取目标电子文件的实际元信息,并将目标电子文件的实际元信息输入所确定的检测器。
[0010]在本公开的一些实施例中,该方法还包括:在多叉树模型中的每个节点所包括的元数据信息中查找指示文件格式的格式字段标识;响应于查找到格式字段标识,确定格式字段标识对应的字段内容是否匹配指定文件格式;响应于格式字段标识对应的字段内容匹配指定文件格式,通过多叉树模型中的与格式字段标识相关联的电子文件路径信息来获取对应的电子文件;以及将对应的电子文件输入专门用于检测具有指定文件格式的电子文件的质量的检测器,检测器用于确定对应的电子文件的内容质量是否符合对指定文件格式的质量要求。
[0011]在本公开的一些实施例中,目标检测规则选自预设的通用检测规则库。通用检测规则库包括根据电子档案封装包的四性检测要求确定的多个通用检测规则。
[0012]在本公开的一些实施例中,关键词包括:通用检测词以及通用检测词的同义词、近义词和衍生词。
[0013]在本公开的一些实施例中,目标检测规则选自用户专门针对电子档案设置的检测规则列表,检测规则列表包括多个检测规则。
[0014]根据本公开的第二方面,提供了一种用于对电子档案封装包进行四性检测的装置。该装置包括至少一个处理器;以及存储有计算机程序的至少一个存储器。当计算机程序由至少一个处理器执行时,使得装置:解析电子档案封装包的层级结构以生成对应的多叉树模型,多叉树模型中的每个节点包括电子档案封装包中的与该节点对应的数据信息,数据信息包括以下中的一个或多个:元数据信息、元数据路径信息、电子文件路径信息、电子文件实际元信息;将每个元数据信息中的字段标识与目标检测规则中的关键词进行比较,目标检测规则是根据电子档案封装包的四性检测要求确定的检测规则,关键词指示目标检测规则的检测对象;以及响应于字段标识与关键词匹配,借助于多叉树模型获取执行目标检测规则所需的数据信息以执行目标检测规则。
[0015]在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置通过以下操作来解析电子档案封装包的层级结构以生成对应的多叉树模型:将电子档案封装包的包目录文件与多叉树模型的根节点相关联;在包目录文件中检测数组型数据;响应于在
包目录文件中检测到数组型数据,生成根节点的子节点并将数组型数据与所生成的子节点相关联;在每个子节点中包括的元数据路径信息所对应的子目录文件中检测数组型数据;以及响应于在子目录文件中检测到数组型数据,生成子节点的下一级节点并将数组型数据与所生成的下一级节点相关联。
[0016]在本公开的一些实施例中,计算机程序在由至少一个处理器执行时使得装置通过以下操作来借助于多叉树模型获取执行目标检测规则所需的数据信息以执行目标检测规则:解析目标检测规则以确定目标检测规则需使用的检测器和目标检测规则所涉及的所有字段标识;将目标检测规则所涉及的所有字段标识中的每个字段标识作为目标字段标识并执行以下操作:在多叉树模型中从根节点开始逐层查找目标字段标识;响应于在当前层中目标字段标识未被查找到,在当前层的下一层查找目标字段标识;响应于在当前层中目标字段标识对应的字段内容包括非法字符或者为空,在当前层的下一层查找目标字段标识的等效字段标识,等效字段标识对应的字段内容能够计算或者推导本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于对电子档案封装包进行四性检测的方法,其特征在于,所述方法包括:解析所述电子档案封装包的层级结构以生成对应的多叉树模型,所述多叉树模型中的每个节点包括所述电子档案封装包中的与该节点对应的数据信息,所述数据信息包括以下中的一个或多个:元数据信息、元数据路径信息、电子文件路径信息、电子文件实际元信息;将每个元数据信息中的字段标识与目标检测规则中的关键词进行比较,所述目标检测规则是根据电子档案封装包的四性检测要求确定的检测规则,所述关键词指示所述目标检测规则的检测对象;以及响应于所述字段标识与所述关键词匹配,借助于所述多叉树模型获取执行所述目标检测规则所需的数据信息以执行所述目标检测规则。2.根据权利要求1所述的方法,其特征在于,解析所述电子档案封装包的层级结构以生成对应的多叉树模型包括:将所述电子档案封装包的包目录文件与所述多叉树模型的根节点相关联;在所述包目录文件中检测数组型数据;响应于在所述包目录文件中检测到数组型数据,生成所述根节点的子节点并将所述数组型数据与所生成的子节点相关联;在每个子节点中包括的元数据路径信息所对应的子目录文件中检测数组型数据;以及响应于在所述子目录文件中检测到数组型数据,生成所述子节点的下一级节点并将所述数组型数据与所生成的下一级节点相关联。3.根据权利要求1或2所述的方法,其特征在于,借助于所述多叉树模型获取执行所述目标检测规则所需的数据信息以执行所述目标检测规则包括:解析所述目标检测规则以确定所述目标检测规则需使用的检测器和所述目标检测规则所涉及的所有字段标识;将所述目标检测规则所涉及的所有字段标识中的每个字段标识作为目标字段标识并执行以下操作:在所述多叉树模型中从根节点开始逐层查找所述目标字段标识;响应于在当前层中所述目标字段标识未被查找到,在所述当前层的下一层查找所述目标字段标识;响应于在当前层中所述目标字段标识对应的字段内容包括非法字符或者为空,在所述当前层的下一层查找所述目标字段标识的等效字段标识,所述等效字段标识对应的字段内容能够计算或者推导出所述目标字段标识的字段内容;响应于在所述多叉树模型中查找到所述目标字段标识,将所述目标字段标识和所述目标字段标识对应的字段内容输入所确定的检测器;以及响应于在所述多叉树模型中查找到所述等效...

【专利技术属性】
技术研发人员:由伟希张海青张正
申请(专利权)人:北京云唤维科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1