图片表格自动提取方法及系统技术方案

技术编号:25551868 阅读:77 留言:0更新日期:2020-09-08 18:52
本发明专利技术实施例提供一种图片表格自动提取方法及系统,该方法包括以下步骤:步骤S1:对原图进行预处理,分离前景色和背景;步骤S2:对每个连续的前景色部分逐个描绘包落区域;步骤S3:检索面积最大的包落区域,以定位表格主体部分;步骤S4:通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;步骤S5:通过四个表格顶点的位置估算透视角度,进行透视还原;步骤S6:定位出标准长方形,提取表格的最终矫正图。该图片表格自动提取方法及系统通过图像处理技术,自动识别表格边框线的方式进行表格的提取和矫正,规避了自然场景的照片的各种干扰以及表格内容的识别对表格线本身识别的干扰,提取的准确率高。

【技术实现步骤摘要】
图片表格自动提取方法及系统
本专利技术涉及图片提取领域,尤其涉及一种图片表格自动提取方法及系统。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。开发一个OCR文字识别软件系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。从影像到结果输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果输出。自然场景的照片可能有各种干扰项,例如图片上的表格旁边多了一个杯子、一支笔或者多了一道阴影,而且当前技术更多注重自然场景照片的英文字母、汉字等的文字识别,对表格内容的识别较少涉及,表格线本身往往也被识别成为了干扰项,因此导致数据提取失败或者准确率极低。公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种图片表格自动提取方法及系统。第一方面,本专利技术实施例提供一种图片表格自动提取方法,包括以下步骤:步骤S1:对原图进行预处理,分离前景色和背景;步骤S2:对每个连续的前景色部分逐个描绘包落区域;步骤S3:检索面积最大的包落区域,以定位表格主体部分;步骤S4:通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;步骤S5:通过四个表格顶点的位置估算透视角度,进行透视还原;步骤S6:定位出标准长方形,提取表格的最终矫正图。进一步地,步骤S1中对原图进行预处理包括:降噪和二值化。进一步地,降噪指根据图片噪声的特征进行去噪,所述图片噪声包括:环境背景、光照、文档上的印章或签名涂改、以及图片本身的拍摄模糊或者曝光不均匀。进一步地,二值化指将整个图像前景信息定义为黑色,背景信息定义为白色,使其呈现出明显的黑白效果的过程。第二方面,本专利技术实施例提供一种图片表格自动提取系统,包括:预处理模块:用于对原图进行预处理,分离前景色和背景;表格主体定位模块:用于对每个连续的前景色部分逐个描绘包落区域,并检索面积最大的包落区域,以定位表格主体部分;定位表格顶点模块:用于通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;透视还原模块:用于通过四个表格顶点的位置估算透视角度,进行透视还原;提取表格模块:用于定位出标准长方形,提取表格的最终矫正图。本专利技术实施例提供的一种图片表格自动提取方法及系统具有如下优点:该图片表格自动提取方法及系统通过图像处理技术,自动识别表格边框线的方式进行表格的提取和矫正,规避了自然场景的照片的各种干扰以及表格内容的识别对表格线本身识别的干扰,图片表格提取的准确率高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的图片表格自动提取方法流程图;图2本专利技术实施例提供的图片表格自动提取系统的原理图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。图1为本专利技术实施例提供的一种图片表格自动提取方法流程图,如图1所示,本专利技术提出的一种图片表格自动提取方法,包括下述步骤:步骤S1:对原图进行预处理,分离前景色(文字)和背景;本专利技术实施例的步骤S1中,对原图进行预处理包括:降噪和二值化。常见的图片噪声包括:环境背景、光照、文档上的印章或签名涂改,以及图片本身拍摄模糊或者曝光不均匀等等。降噪指根据图片噪声的特征进行去噪。二值化(ImageBinarization)就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先对彩色图进行处理,使图片只具有前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了。步骤S2:对每个连续的前景色部分逐个描绘包落区域;步骤S3:检索面积最大的包落区域,以定位表格主体部分;步骤S4:通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;步骤S5:通过四个表格顶点的位置估算透视角度,进行透视还原;例如,四个表格顶点的位置形态是上窄下宽的梯形时,我们会根据近大远小的透视原理,推测长边离镜头近,窄边离镜头远,并估算镜头角度。步骤S6:定位出标准长方形,提取表格的最终矫正图。提取的表格被还原成了标准的长方形,对后续进行表格单元格的定位与基于水平和垂直位置进行表格内容OCR识别提供了极大的便利。基于上述任一实施例,图2为本专利技术实施例提供的一种图片表格自动提取系统的结构示意图,该系统包括:预处理模块:用于对原图进行预处理,分离前景色和背景;表格主体定位模块:用于对每个连续的前景色部分逐个描绘包落区域,并检索面积最大的包落区域,以定位表格主体部分;定位表格顶点模块:用于通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;透视还原模块:用于通过四个表格顶点的位置估算透视角度,进行透视还原;提取表格模块:用于定位出标准长方形,提取表格的最终矫正图。综上所述,本专利技术实施例提供的图片表格自动提取方法及系统通过图像处理技术,自动识别表格边框线的方式进行表格的提取和矫正,规避了自然场景的照片的各种干扰以及表本文档来自技高网...

【技术保护点】
1.一种图片表格自动提取方法,其特征在于,包括以下步骤:/n步骤S1:对原图进行预处理,分离前景色和背景;/n步骤S2:对每个连续的前景色部分逐个描绘包落区域;/n步骤S3:检索面积最大的包落区域,以定位表格主体部分;/n步骤S4:通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;/n步骤S5:通过四个表格顶点的位置估算透视角度,进行透视还原;/n步骤S6:定位出标准长方形,提取表格的最终矫正图。/n

【技术特征摘要】
1.一种图片表格自动提取方法,其特征在于,包括以下步骤:
步骤S1:对原图进行预处理,分离前景色和背景;
步骤S2:对每个连续的前景色部分逐个描绘包落区域;
步骤S3:检索面积最大的包落区域,以定位表格主体部分;
步骤S4:通过切线方式在最大的包落边框上定位四个表格顶点,并对四点表格顶点位置进行微调和矫正;
步骤S5:通过四个表格顶点的位置估算透视角度,进行透视还原;
步骤S6:定位出标准长方形,提取表格的最终矫正图。


2.根据权利要求1所述的图片表格自动提取方法,其特征在于,所述步骤S1中对原图进行预处理包括:降噪和二值化。


3.根据权利要求2所述的图片表格自动提取方法,其特征在于,所述降噪指根据图片噪声的特征进行去噪,所述图片噪声包括:环境背景、光照...

【专利技术属性】
技术研发人员:高垚翟帅华
申请(专利权)人:上海铭垚信息科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1