一种数字化档案表格转换方法及系统技术方案

技术编号:39573225 阅读:50 留言:0更新日期:2023-12-03 19:24
本发明专利技术公开了一种数字化档案表格转换方法,属于档案数字化技术领域,包括以下步骤:

【技术实现步骤摘要】
一种数字化档案表格转换方法及系统


[0001]本专利技术涉及档案数字化
,具体为一种数字化档案表格转换方法及系统


技术介绍

[0002]随着信息化的发展,数字化档案管理已经成为一种趋势

数字化档案管理的核心是数字化档案的建设和管理,且数字化档案建设的核心是数字化档案的采集和整理

数字化档案采集的主要方式是通过扫描将纸质档案转换为数字化档案;
[0003]数字化档案中的表格数据是一种重要的数据类型,且利用价值高

但是,数字化档案中的表格数据往往是非结构化的,难以直接利用

因此,需要将数字化档案中的表格数据转换为结构化数据,以便于利用;
[0004]目前,数字化档案表格转换的方法主要有两种:一种是手工转换,即人工逐一读取表格中的数据,并将其转换为结构化数据;另一种是自动转换,即利用计算机程序对表格进行分析和处理,将表格中的数据转换为结构化数据

手工转换存在效率低

精度低
>、
成本高本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种数字化档案表格转换方法,其特征在于,包括以下步骤:
S1
:用户依次将纸质档案进行读取并录入;
S2
:生成电子表格,并对电子表格进行具体分析,提取整体数据;
S3
:对提取后的数据进行预处理;
S4
:将处理后的数据进行细处理,最终转换成结构化数据;
S5
:将结构化数据存储至数据库中
。2.
根据权利要求1所述的一种数字化档案表格转换方法,其特征在于:在步骤
S1
中,读取方式为拍照和扫描
。3.
根据权利要求1所述的一种数字化档案表格转换方法,其特征在于:在步骤
S2
中,将文本数据转换为数值数据

将日期数据转换为时间戳,通过计算数据的平均值

中位数

标准差等统计量,对数据进行分析,进而对数据进行提取
。4.
根据权利要求1所述的一种数字化档案表格转换方法,其特征在于:在步骤
S3
中,使用图像处理软件对数字化图像进行图像增强

去噪

裁剪,使用
Optical Character Recognition
技术将数字化图像中的文字识别出来,并转换为可编辑的文本格式,并对
OCR
识别出来的文本进行清洗
。5.
根据权利要求1所述的一种数字化档案表格转换方法,其特征在于:在步骤
S4
中,对扫描得到的纸质档案图像进行预处理后,对处理后的图像进行表格检测和分割,将表格中的各个单元格分离出来,对每个单元格中的文字和数字进行...

【专利技术属性】
技术研发人员:张珊
申请(专利权)人:日照职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1