版面分析方法、装置、设备和存储介质制造方法及图纸

技术编号:37678742 阅读:31 留言:0更新日期:2023-05-26 04:45
本公开提供了一种版面分析方法、装置、设备和存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。版面分析方法包括:获取原始图像;对原始图像进行结构分析处理,以确定所述原始图像的结构类型;若所述结构类型是单一结构,将所述原始图像切分为多个子图,对所述子图进行版面分析处理,以获得子图版面分析结果;以及,根据所述子图版面分析结果获得所述原始图像的最终版面分析结果。本公开提高版面分析结果的准确度。分析结果的准确度。分析结果的准确度。

【技术实现步骤摘要】
版面分析方法、装置、设备和存储介质


[0001]本公开涉及人工智能
,具体为深度学习、图像处理、计算机视觉
,可应用于OCR等场景,尤其涉及一种版面分析方法、装置、设备和存储介质。

技术介绍

[0002]光学字符识别(OpticalCharacterRecognition,OCR)技术在多种场景中发挥着重要作用。版面分析是OCR技术的基础步骤,通过版面分析可以获得图像中元素的属性及其位置,便于后续处理。
[0003]相关技术中,针对长图的版面分析,一般是将原始图像的最长边缩放到固定长度,在保持原始图像比例的前提下,对原始图像进行尺寸转换(resize),再对尺寸转换后的图像进行版面分析。

技术实现思路

[0004]本公开提供了一种版面分析方法、装置、设备和存储介质。
[0005]根据本公开的一方面,提供了一种版面分析方法,包括:获取原始图像;对原始图像进行结构分析处理,以确定所述原始图像的结构类型;若所述结构类型是单一结构,将所述原始图像切分为多个子图,对所述子图进行版面分析处理,以获得子图版面分析结本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种版面分析方法,包括:获取原始图像;对原始图像进行结构分析处理,以确定所述原始图像的结构类型;若所述结构类型是单一结构,将所述原始图像切分为多个子图,对所述子图进行版面分析处理,以获得子图版面分析结果;以及,根据所述子图版面分析结果获得所述原始图像的最终版面分析结果。2.根据权利要求1所述的方法,其中,所述单一结构包括:左右结构;所述左右结构的原始图像中包含分隔符;所述将所述原始图像切分为多个子图,包括:检测所述原始图像中的所述分隔符的位置信息;根据所述分隔符的位置信息,将所述原始图像切分为多个子图,其中,所述多个子图具有相同的高度。3.根据权利要求1所述的方法,其中,所述单一结构包括:上下结构;所述将所述原始图像切分为多个子图,包括:针对所述原始图像中的目标区域,检测所述目标区域内的目标元素的位置信息,所述目标区域是所述原始图像中的部分区域,所述目标元素是所述目标区域内处于最上方位置的元素;根据所述目标元素的位置信息,将所述原始图像切分为多个子图,其中,所述多个子图具有相同的宽度。4.根据权利要求1

3任一项所述的方法,其中,所述根据所述子图版面分析结果获得所述原始图像的最终版面分析结果,包括:对所述子图版面分析结果进行合并处理,以获得所述最终版面分析结果。5.根据权利要求1

3任一项所述的方法,还包括:若所述结构类型是混合结构,对所述原始图像进行整图版面分析处理,以获得所述原始图像的最终版面分析结果。6.一种版面分析装置,包括:获取模块,用于获取原始图像;结构分析模块,用于对原始图像进行结构分析处理,以确定所述原始图像的结构类型;第一处理模块,用于若所述结构类型是单一结构,将所述原始图像切分为多个子图,对所述子图进行版面分析处理,以获得子图版面分析结果;以及,根据所述子图版面分析结果获得所述原始...

【专利技术属性】
技术研发人员:乔美娜刘珊珊章成全姚锟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1