【技术实现步骤摘要】
一种计算机自动化纸件档案数字方法、设备及终端
[0001]本专利技术属于档案管理领域,尤其涉及计算机自动化纸件档案数字方法、设备及终端。
技术介绍
[0002]目前:档案数字化是随着计算机技术、扫描技术、扫描矩阵CCD技术、0CR技术、数字摄影.技术(录音、录像)、数据库技术、多媒体技术、存储技术的发展而产生的一种新型档案信息形态,它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储,网络化的形式互相连接,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享。
[0003]通过上述分析,现有技术存在的问题及缺陷为:
[0004](1)现有的技术没有档案的自动化扫描步骤。
[0005](2)现有的技术没有针对纸质档案的数字化处理。
[0006](3)一些年代久远的档案,手写档案,难以转化成文本,且纸张随着时间的推移已经不能弯折,易损坏。
技术实现思路
[0007]针对现有技术存在的问题,本专利技术提供了一种计算机自动化纸件档案数字方法。r/>[0008]本本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种计算机自动化纸件档案数字方法,其特征在于,该方法具体包括:步骤一,通过计算机程序完成档案的扫描;将打印机与计算机连接,安装好驱动,通过计算机的设定,对打印机设定自动扫描任务,完成对纸件档案的扫描,扫描结束后自动将扫描的结果发送至计算机,计算机进行留存;步骤二,通过计算机程序完成档案的数字化识别并保存;计算机将打印机发送的扫描数据先进行识别,其次建立识别图像数据;步骤三,计算机自动完成档案的数字化修改校对,完成后进行保存;计算机能对识别后的图像数据进行修改,需要将识别图像数据和扫描图像数据同时显示校对,校对合格后的识别图像数据保存于计算机的数据库中,对应的扫描图像数据被压缩后保存;存储的位置时由计算机对电子档案柜的自动分配,每个保存位置具有单独的开口,开口设置有计算机控制的门;步骤四,计算机对副本档案的自动化打印;需要使用打印副本档案时,计算机控制打印机打印所需的档案,并在每一页的边缘位置打印出唯一的二维码;可以打印多份副本档案;步骤五,计算机对副本档案的数字化回收;将使用完的多份打印的副本档案逐份放置于打印机的自动进纸台,打印机逐页进行扫描,将扫描后的结果发送至计算机;计算机将扫描后的结果同原始档案的图像进行比较,识别出进行标记和修改的位置,并每一份的副本档案编号和标记、修改的位置处的图像进行保存;计算机将对应同一个识别图像数据的从多份打印副本档案中保存的编号和标记、修改的图像保存于该档案的识别图像数据中。2.如权利要求1所述的计算机自动化纸件档案数字方法,其特征在于,所述扫描数据先进行识别的识别图像数据的内容包括文本、图形和公式。3.如权利要求1所述的计算机自动化纸件档案数字方法,其特征在于,所述计算机程序完成档案的数字化识别方法具体包括以下步骤:步骤一,将打印机发送的扫描数据行几何校正后,再通过图像增强技术进行扩充,得到自制数据集;步骤二,选择训练参数,搭建基于深度学习开源框架Tensorflow的卷积神经网络架构,将自制数据集中的图像分为训练集和测试集,将训练集加载至卷积神经网络进行训练,并对训练结果进行可视化表示;根据训练结果微调卷积神经网络的训练参数,再将测试集加载至卷积神经网络进行准确率测试,微调卷积神经网络的训练参数,直至测试集准确率达到预期的标准,即得卷积神经网络模型;步骤三,将扫描数据加载至的卷积神经网络模型中进行识别分类,识别时对数据中某个位置的某一字体的文字,则将该文字保存在图像数据中并建立对应位置的文本类对象,若不能识别出文字,则对该位置的识别图像数据裁剪保存,建立该位置的图形类对象或者公式类对象。4.如...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。