一种文献版面区域检测分割的方法技术

技术编号：24093099 阅读：49 留言：0更新日期：2020-05-09 08:59

本发明专利技术提供的一种文献版面区域检测分割的方法，通过获取文献图片，并建立训练数据集；创建第一检测模型，并通过所述训练数据集对所述第一检测模型进行训练，得到训练好的第二检测模型；根据所述第二检测模型对待检测分割的文献图片进行检测分割，能够实现文献图片自动化检测分割，且准确度高。

A method of document layout area detection and segmentation

全部详细技术资料下载

【技术实现步骤摘要】
一种文献版面区域检测分割的方法
本专利技术涉及图像检测
，特别涉及一种文献版面区域检测分割的方法。
技术介绍
目前OCR技术通常先识别整个图片中的所有文字，然后分析内容，提取有用信息。在对文献利用OCR技术进行数字化，制作成电子书时，不仅要利用OCR技术检测识别文字，还需要遵循原书的排版，为此需确定版面中的有效内容区域、边框(如黑框)内区域、页眉页脚等。由于不同文献版面的多样性，很难用规则化方式分割版面，目前还没有相应的技术实现版面自动分割。因此，需要一种文献版面区域检测分割的方法，能够实现文献图片自动化检测分割，且准确度高。
技术实现思路
(一)要解决的技术问题为了解决现有技术的上述问题，本专利技术提供一种文献版面区域检测分割的方法，能够实现文献图片自动化检测分割，且准确度高。(二)技术方案为了达到上述目的，本专利技术采用的主要技术方案包括：一种文献版面区域检测分割的方法，包括步骤：S1、获取文献图片，并建立训练数据集；S2、创建第一检测模型...

【技术保护点】
1.一种文献版面区域检测分割的方法，其特征在于，包括步骤：/nS1、获取文献图片，并建立训练数据集；/nS2、创建第一检测模型，并通过所述训练数据集对所述第一检测模型进行训练，得到训练好的第二检测模型；/nS3、根据所述第二检测模型对待检测分割的文献图片进行检测分割。/n

【技术特征摘要】
1.一种文献版面区域检测分割的方法，其特征在于，包括步骤：
S1、获取文献图片，并建立训练数据集；
S2、创建第一检测模型，并通过所述训练数据集对所述第一检测模型进行训练，得到训练好的第二检测模型；
S3、根据所述第二检测模型对待检测分割的文献图片进行检测分割。

2.根据权利要求1所述的文献版面区域检测分割的方法，其特征在于，步骤S1具体为：
获取不同版式的文献图片，并建立第一检测数据集。

3.根据权利要求2所述的文献版面区域检测分割的方法，其特征在于，步骤S1还包括：
对所述第一检测数据集中的图片进行标记，得到第二检测数据集。

4.根据权利要求1所述的文献版面区域检测分割的方法，其特征在于，步骤S2具体为：
创建第一神经网络YOLOV3检测模...

【专利技术属性】
技术研发人员：张雄，
申请(专利权)人：福建两岸信息技术有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人