【技术实现步骤摘要】
一种基于深度学习的档案影像信息结构化构建方法及装置
本专利技术涉及图像处理
,特别是涉及一种基于深度学习的档案影像信息结构化构建方法及装置。
技术介绍
档案是事物发展的真实记录,蕴含着大量的时空变迁信息(历史、现状和未来规划),同时档案信息也是信息资源的重要来源之一。在当今大数据背景下,社会各行各业信息化、数字化、网络化发展已是大势所趋。档案信息化建设,是档案工作融入现代生活、对接智慧城市、连通大数据社会、参与国民经济和社会发展的重要组成部分,对适应外界环境变化,助力各行各业协调发展具有重要的现实意义。因此,对于决策管理者来说,如何做好档案信息化,也是一种挑战。现有的档案信息化建设大部分处于信息化的前期阶段,多数做法是将纸质档案经扫描或拍摄形成图像,转化成以电子形式存在的文件,而非真正意义上的文本文件,即计算机只能认识档案外表,并不了解其包含的内容信息,用户只能通过已有目录索引翻阅单个档案的原貌,却不能根据关键内容信息检索操作。在实际应用中,由于档案的数量庞大,种类繁多,档案管理的不规范导致档案检索效率低,不易 ...
【技术保护点】
1.一种基于深度学习的档案影像信息结构化构建方法,包括如下步骤:/n步骤S1,获取档案图片,对所述档案图片进行预处理,获得档案图片样本;/n步骤S2,对档案图片样本进行人工文本定位标注,提取关键词,进行文本识别,并通过多次学习的方式构建端到端的深度学习模型,并使用训练样本进行训练,得到最终的档案影像信息构建模型;/n步骤S3,输入待识别档案图片,经训练好的档案影像信息构建模型进行文字的定位、识别和关键词提取,将输出内容保存为预设格式,并提取至标注库文件;/n步骤S4,通过标注库工具进行提取、入库存储进行结构化构建。/n
【技术特征摘要】
1.一种基于深度学习的档案影像信息结构化构建方法,包括如下步骤:
步骤S1,获取档案图片,对所述档案图片进行预处理,获得档案图片样本;
步骤S2,对档案图片样本进行人工文本定位标注,提取关键词,进行文本识别,并通过多次学习的方式构建端到端的深度学习模型,并使用训练样本进行训练,得到最终的档案影像信息构建模型;
步骤S3,输入待识别档案图片,经训练好的档案影像信息构建模型进行文字的定位、识别和关键词提取,将输出内容保存为预设格式,并提取至标注库文件;
步骤S4,通过标注库工具进行提取、入库存储进行结构化构建。
2.如权利要求1所述的一种基于深度学习的档案影像信息结构化构建方法,其特征在于:所述预处理包括但不限于对获取的档案图片进行锐化、灰度化、二值化、图像去噪、倾斜矫正等处理。
3.如权利要求1所述的一种基于深度学习的档案影像信息结构化构建方法,其特征在于:于步骤S2中,所述深度学习模型采用基于深度学习的端到端CRNNOCR技术,其采用的是包括卷积神经网络CNN、循环神经网络RNN以及联结时序分类CTC的架构。
4.如权利要求3所述的一种基于深度学习的档案影像信息结构化构建方法,其特征在于,所述深度学习模型包括:
卷积网络层,使用CNN模型,用于提取图像像素特征,从输入图像中提取特征序列,即图像特征向量;
循环网络层,使用RNN模型,利用双向LSTM进行序列处理,用于学习从卷积网络层获取的特征序列的关联序列信息并预测其标签分布;
序列识别层,使用CTC算法,归纳字符间的连接特性,把从所述循环网络层获取的标签分布通过去重整合等操作转换成最终的识别结果输出。
5.如权利要求4所述的一种基于深度学习的档案影像信息结构化构建方法,其特征在于,于步骤S2中,所述深度学习模型训练过程为:获取训练集样本,进行数据预处理;将预处理后的数据输入网络模型,得到预测值;计算CTC-Loss函数;利用优化器更新参数寻找最优值,重复上述过程直到设定epoch次数或损失函数不再下降,训练完成。
6.如权利要求5所述的一种基于深度学习的档案影像信息结构化构建方法,其特征在于:于步骤S3中,所述...
【专利技术属性】
技术研发人员:曹孟君,曾智,胡磊,陈韵,卢强,孙颖,邹瑶,刘小保,黎浩云,才翔,宋莎,
申请(专利权)人:广州城市规划技术开发服务部有限公司,广州市城市建设档案馆,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。