一种藏文古籍文档图像版面分割、识别方法及系统技术方案

技术编号：30407638 阅读：19 留言：0更新日期：2021-10-20 11:17

本发明专利技术涉及一种藏文古籍文档图像版面分割、识别方法及系统，所述方法包括：构建藏文古籍文档图像版面分割数据集；基于所述藏文古籍文档图像版面分割数据集对深度卷积神经网络进行训练；基于训练好的深度卷积神经网络对藏文古籍图像版面进行分割；对分割后的藏文古籍图像版面中的文本进行识别。本发明专利技术中的上述方法能够实现对藏文古籍文档图像进行精确分割和文字识别。和文字识别。和文字识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种藏文古籍文档图像版面分割、识别方法及系统

[0001]本专利技术涉及文字识别领域，特别是涉及一种藏文古籍文档图像版面分割、识别方法及系统。

技术介绍

[0002]在过去的几十年中，文档图像版面分析工作在多文种、多字体上展开，国内外的研究者针对印刷或手写的古籍文献提出了许多不同的版面分析方法。传统方法方面有：1)基于纹理的分析、2)游程平滑算法、3)投影轮廓切割算法、4)空白区域分析法、5)连通域分析法、6)Voronoi图分析法。深度学习方法方面，此类方法从图像像素出发利用卷积神经网络(CNN)生成图像的多层特征，利用提取的特征搭建合适的模型结构，并选择相应的损失函数，在大量的监督数据下通过最优化损失函数学习模型中的参数。此外，在版面分析系统研究方面，S.Pletschacher等于2010年发布用于页面分析和页面基本元素格式化的框架，随之发布版面分析系统Aletheia，并在不断扩充支持的语言。Supachai Tangwongsan等构建了一个高效的文档页面布局提取系统。
[0003]对于藏文文档图像版面分析技术，国内外仅有少数研究者对藏文古籍图像版面分析做了一些研究。其中，Ma等人研究出一种应用于藏文历史文档图像分割和识别的框架。提出基于块投影的版面分割方法，将藏文文档图像分割成文本、线条和框架，利用基于图模型的文本行分割方法解决文本与边框之间的粘连问题。Liu等人提出一种基于边界信息的藏文历史文献的版面分析方法，采用中值滤波、高斯平滑、Sobel边缘检测和边缘平滑、去除小区域、获取边界位置等一系列...

【技术保护点】

【技术特征摘要】
1.一种藏文古籍文档图像版面分割、识别方法，其特征在于，所述方法包括：构建藏文古籍文档图像版面分割数据集；基于所述藏文古籍文档图像版面分割数据集对深度卷积神经网络进行训练；基于训练好的深度卷积神经网络对藏文古籍图像版面进行分割；对分割后的藏文古籍图像版面中的文本进行识别。2.根据权利要求1所述的藏文古籍文档图像版面分割、识别方法，其特征在于，所述构建藏文古籍文档图像版面分割数据集具体包括：获取藏文古籍图像；随所述藏文古籍图像进行预处理；对预处理后的藏文古籍图像进行数据标记，得到版面元素类型；所述版面元素类型包括：背景、文本、左标题、右标题以及图；将所述版面元素类型进行扩充并生成标签，得到藏文古籍文档图像版面分割数据集。3.根据权利要求1所述的藏文古籍文档图像版面分割、识别方法，其特征在于，所述基于训练好的深度卷积神经网络对藏文古籍图像版面进行分割具体包括：对待分割的藏文古籍文档图像进行光照不均处理；对光照不均处理后的藏文古籍文档图像进行图像尺寸归一化处理；对尺寸归一化后的藏文古籍文档图像进行图像切片；对图像切片后的藏文古籍文档图像分别输入至所述训练好的深度卷积神经网络，得到多个预测结果；将所述多个预测结果进行合并，得到整张藏文古籍图像的分割结果；将所述分割结果恢复为原尺寸。4.根据权利要求1所述的藏文古籍文档图像版面分割、识别方法，其特征在于，所述对分割后的藏文古籍图像版面中的文本进行识别具体包括：对分割后的藏文古籍图像版面中文本的左标题、正文以及右标题进行识别。5.根据权利要求4所述的藏文古籍文档图像版面分割、识别方法，其特征在于，所述对分割后的藏文古籍图像版面中文本的左标题、正文以及右标题进行识别集体包括：构建藏文古籍文本行数据集；所述藏文古籍文本行数据集包括：藏文古籍文本行合成数据集和藏文古籍文本行真实数据集；基于所述藏文古籍文本行数据集对CRNN神经网络进行训练；基于训练好的CRNN神经网络对藏文...

【专利技术属性】
技术研发人员：王维兰，陈园园，王筱娟，郝玉胜，
申请(专利权)人：西北民族大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人