【技术实现步骤摘要】
一种文献版面区域检测分割的方法
本专利技术涉及图像检测
,特别涉及一种文献版面区域检测分割的方法。
技术介绍
目前OCR技术通常先识别整个图片中的所有文字,然后分析内容,提取有用信息。在对文献利用OCR技术进行数字化,制作成电子书时,不仅要利用OCR技术检测识别文字,还需要遵循原书的排版,为此需确定版面中的有效内容区域、边框(如黑框)内区域、页眉页脚等。由于不同文献版面的多样性,很难用规则化方式分割版面,目前还没有相应的技术实现版面自动分割。因此,需要一种文献版面区域检测分割的方法,能够实现文献图片自动化检测分割,且准确度高。
技术实现思路
(一)要解决的技术问题为了解决现有技术的上述问题,本专利技术提供一种文献版面区域检测分割的方法,能够实现文献图片自动化检测分割,且准确度高。(二)技术方案为了达到上述目的,本专利技术采用的主要技术方案包括:一种文献版面区域检测分割的方法,包括步骤:S1、获取文献图片,并建立训练数据集;S2、创建第一检测模型 ...
【技术保护点】
1.一种文献版面区域检测分割的方法,其特征在于,包括步骤:/nS1、获取文献图片,并建立训练数据集;/nS2、创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;/nS3、根据所述第二检测模型对待检测分割的文献图片进行检测分割。/n
【技术特征摘要】
1.一种文献版面区域检测分割的方法,其特征在于,包括步骤:
S1、获取文献图片,并建立训练数据集;
S2、创建第一检测模型,并通过所述训练数据集对所述第一检测模型进行训练,得到训练好的第二检测模型;
S3、根据所述第二检测模型对待检测分割的文献图片进行检测分割。
2.根据权利要求1所述的文献版面区域检测分割的方法,其特征在于,步骤S1具体为:
获取不同版式的文献图片,并建立第一检测数据集。
3.根据权利要求2所述的文献版面区域检测分割的方法,其特征在于,步骤S1还包括:
对所述第一检测数据集中的图片进行标记,得到第二检测数据集。
4.根据权利要求1所述的文献版面区域检测分割的方法,其特征在于,步骤S2具体为:
创建第一神经网络YOLOV3检测模...
【专利技术属性】
技术研发人员:张雄,
申请(专利权)人:福建两岸信息技术有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。