电子档案的可读性检测方法、装置及设备制造方法及图纸

技术编号:38138350 阅读:9 留言:0更新日期:2023-07-08 09:51
本申请提供一种电子档案的可读性检测方法、装置及设备,涉及电子档案检测技术领域。该方法应用于终端设备,包括:获取待检测的电子档案文件;根据所述电子档案文件的文件扩展名,确定所述电子档案文件所属的第一文件格式;根据所述第一文件格式对所述电子档案文件进行可读性检测,确定检测结果,所述检测结果包括所述电子档案文件可读,或,所述电子档案文件不可读。本申请的方案提高了电子档案文件可读性检测的效率。可读性检测的效率。可读性检测的效率。

【技术实现步骤摘要】
电子档案的可读性检测方法、装置及设备


[0001]本申请涉及电子档案检测
,尤其涉及一种电子档案的可读性检测方法、装置及设备。

技术介绍

[0002]电子档案在归档、移交以及长期保存环节,均需要进行真实性、完整性、可用性和安全性检测,统称为四性检测,以确保电子档案的真实合法。
[0003]电子档案的可读性检测,属于可用性检测的一种,主要是检测电子档案的内容是否可读。目前,电子档案的可读性检测,主要是通过人工方式进行的,也即人工打开电子档案,判断电子档案的内容是否可读。这种可读性检测的方式,效率十分低下。

技术实现思路

[0004]本申请提供一种电子档案的可读性检测方法、装置及设备,以提高电子档案文件可读性检测的效率。
[0005]第一方面,本申请提供一种电子档案的可读性检测方法,应用于终端设备,所述方法包括:获取待检测的电子档案文件;根据所述电子档案文件的文件扩展名,确定所述电子档案文件所属的第一文件格式;根据所述第一文件格式对所述电子档案文件进行可读性检测,确定检测结果,所述检测结果包括所述电子档案文件可读,或,所述电子档案文件不可读。
[0006]在一种可能的实施方式中,所述根据所述第一文件格式对所述电子档案文件进行可读性检测,确定检测结果,包括:将所述电子档案文件的文件信息与参考文件信息进行匹配,得到匹配结果,其中,所述参考文件信息为所述第一文件格式对应的文件信息,或者,多个文件格式各自对应的文件信息,所述多个文件格式包括所述第一文件格式,文件信息包括文件头和/或文件尾;根据所述匹配结果,确定所述检测结果。
[0007]在一种可能的实施方式中,在所述参考文件信息为所述第一文件格式对应的文件信息的情况下,所述根据所述匹配结果,确定所述检测结果,包括:若所述电子档案文件的文件信息与所述第一文件格式对应的文件信息不匹配,则确定所述检测结果为所述电子档案文件不可读;若所述电子档案文件的文件信息与所述第一文件格式对应的文件信息匹配,则根据所述电子档案文件的文件内容,确定所述检测结果。
[0008]在一种可能的实施方式中,在所述参考文件信息包括所述多个文件格式各自对应的文件信息的情况下,所述根据所述匹配结果,确定所述检测结果,包括:将与所述电子档案文件的文件信息匹配的目标文件信息对应的文件格式,确定为
所述电子档案文件所属的第二文件格式;若所述第一文件格式和所述第二文件格式不同,则确定所述检测结果为所述电子档案文件不可读;若所述第一文件格式和所述第二文件格式相同,则根据所述电子档案文件的文件内容,确定所述检测结果。
[0009]在一种可能的实施方式中,所述根据所述电子档案文件的文件内容,确定所述检测结果,包括:根据所述第一文件格式,确定所述文件内容是否存在文件错误;若所述文件内容存在文件错误,则确定所述检测结果为所述电子档案文件不可读;若所述文件内容不存在文件错误,则确定所述检测结果为所述电子档案文件可读。
[0010]在一种可能的实施方式中,在所述第一文件格式为数据压缩格式的情况下,所述根据所述第一文件格式,确定所述文件内容是否存在文件错误,包括:在所述文件内容中确定中央目录文件头,所述中央目录文件头中包括所述文件内容中的多个文件片段的位置;根据所述多个文件片段的位置,对所述多个文件片段进行循环冗余校验,得到所述多个文件片段各自的校验结果,所述校验结果为文件片段的校验值与对应的预存校验值相同,或者与对应的预存校验值不同;若各所述文件片段各自的校验值与对应的预存校验值均相同,则确定所述文件内容不存在文件错误;若存在至少一个文件片段的校验值与对应的预存校验值不同,则确定所述文件内容存在错误。
[0011]在一种可能的实施方式中,在所述第一文件格式为可携带文件格式的情况下,所述根据所述第一文件格式,确定所述文件内容是否存在文件错误,包括:在所述文件内容中确定开始标志表,所述开始标志表用于指示所述文件内容中的多个对象块;针对任意对象块,根据所述对象块的起始字符串和结束字符串,确定所述对象块在所述文件内容中的位置是否正确;若各所述对象块在所述文件内容中的位置均正确,则确定所述文件内容不存在文件错误;若存在至少一个对象块在所述文件内容中的位置不正确,则确定所述文件内容存在错误。
[0012]在一种可能的实施方式中,在所述第一文件格式为图像文件格式的情况下,所述根据所述第一文件格式,确定所述文件内容是否存在文件错误,包括:在所述文件内容中确定多个文件段,其中,任意文件段中均包括对应的段类型;针对任意文件段,根据所述文件段的段类型指示的段长度和所述文件段的真实段长度,确定所述文件段是否符合图像文件格式要求;确认任意相邻的两个文件段之间的填充字符;
若各所述文件段均符合所述图像文件格式要求,且任意相邻的两个文件段之间的填充字符均为预设字符,则确定所述文件内容不存在文件错误;若存在至少一个文件段不符合所述图像文件格式要求,或者,存在相邻的两个文件段之间的填充字符包括除所述预设字符外的其他字符,则确定所述文件内容存在文件错误。
[0013]在一种可能的实施方式中,在所述第一文件格式为标签图像文件格式的情况下,所述根据所述第一文件格式,确定所述文件内容是否存在文件错误,包括:在所述文件内容中确定图像文件头,所述图像文件头中包括第1个文件目录的偏移位置,所述第1个文件目录的偏移位置用于指示第1个文件目录;若第i个文件目录中存储的第i+1个文件目录的偏移位置不为预设位置,且存在第i+1个文件目录,则根据所述第i+1个文件目录的偏移位置,确定所述第i+1个文件目录,所述i依次为1,2,...;若第i个文件目录中存储的第i+1个文件目录的偏移位置为所述预设位置,则确定所述文件内容不存在文件错误;若第i个文件目录中存储的第i+1个文件目录的偏移位置不为所述预设位置,且不存在第i+1个文件目录,则确定所述文件内容存在文件错误。
[0014]第二方面,本申请提供一种电子档案的可读性检测装置,所述装置包括:获取模块,用于获取待检测的电子档案文件;确定模块,用于根据所述电子档案文件的文件扩展名,确定所述电子档案文件所属的第一文件格式;处理模块,用于根据所述第一文件格式对所述电子档案文件进行可读性检测,确定检测结果,所述检测结果包括所述电子档案文件可读,或,所述电子档案文件不可读。
[0015]在一种可能的实施方式中,所述处理模块具体用于:将所述电子档案文件的文件信息与参考文件信息进行匹配,得到匹配结果,其中,所述参考文件信息为所述第一文件格式对应的文件信息,或者,多个文件格式各自对应的文件信息,所述多个文件格式包括所述第一文件格式,文件信息包括文件头和/或文件尾;根据所述匹配结果,确定所述检测结果。
[0016]在一种可能的实施方式中,在所述参考文件信息为所述第一文件格式对应的文件信息的情况下,所述处理模块具体用于:若所述电子档案文件的文件信息与所述第一文件格式对应的文件信息不匹配,则确定所述检测结果为所述电子档案文件不可读;若所述电子档案文件的文件信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电子档案的可读性检测方法,其特征在于,应用于终端设备,所述方法包括:获取待检测的电子档案文件;根据所述电子档案文件的文件扩展名,确定所述电子档案文件所属的第一文件格式;根据所述第一文件格式对所述电子档案文件进行可读性检测,确定检测结果,所述检测结果包括所述电子档案文件可读,或,所述电子档案文件不可读。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一文件格式对所述电子档案文件进行可读性检测,确定检测结果,包括:将所述电子档案文件的文件信息与参考文件信息进行匹配,得到匹配结果,其中,所述参考文件信息为所述第一文件格式对应的文件信息,或者,多个文件格式各自对应的文件信息,所述多个文件格式包括所述第一文件格式,文件信息包括文件头和/或文件尾;根据所述匹配结果,确定所述检测结果。3.根据权利要求2所述的方法,其特征在于,在所述参考文件信息为所述第一文件格式对应的文件信息的情况下,所述根据所述匹配结果,确定所述检测结果,包括:若所述电子档案文件的文件信息与所述第一文件格式对应的文件信息不匹配,则确定所述检测结果为所述电子档案文件不可读;若所述电子档案文件的文件信息与所述第一文件格式对应的文件信息匹配,则根据所述电子档案文件的文件内容,确定所述检测结果。4.根据权利要求2所述的方法,其特征在于,在所述参考文件信息包括所述多个文件格式各自对应的文件信息的情况下,所述根据所述匹配结果,确定所述检测结果,包括:将与所述电子档案文件的文件信息匹配的目标文件信息对应的文件格式,确定为所述电子档案文件所属的第二文件格式;若所述第一文件格式和所述第二文件格式不同,则确定所述检测结果为所述电子档案文件不可读;若所述第一文件格式和所述第二文件格式相同,则根据所述电子档案文件的文件内容,确定所述检测结果。5.根据权利要求3或4所述的方法,其特征在于,所述根据所述电子档案文件的文件内容,确定所述检测结果,包括:根据所述第一文件格式,确定所述文件内容是否存在文件错误;若所述文件内容存在文件错误,则确定所述检测结果为所述电子档案文件不可读;若所述文件内容不存在文件错误,则确定所述检测结果为所述电子档案文件可读。6.根据权利要求5所述的方法,其特征在于,在所述第一文件格式为数据压缩格式的情况下,所述根据所述第一文件格式,确定所述文件内容是否存在文件错误,包括:在所述文件内容中确定中央目录文件头,所述中央目录文件头中包括所述文件内容中的多个文件片段的位置;根据所述多个文件片段的位置,对所述多个文件片段进行循环冗余校验,得到所述多个文件片段各自的校验结果,所述校验结果为文件片段的校验值与对应的预存校验值相同,或者与对应的预存校验值不同;若各所述文件片段各自的校验值与对应的预存校验值均相同,则确定所述文件内容不存在文件错误;
若存在至少一个文件片段的校验值与对应的预存校验值不同,则确定所述文件内容存在错误。7.根据权利要求5所述的方法,其特征在于,在所述第一文件格式...

【专利技术属性】
技术研发人员:张桂霞
申请(专利权)人:北京网智易通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1