图片表格识别方法及图片表格识别装置制造方法及图纸

技术编号:39188786 阅读:9 留言:0更新日期:2023-10-27 08:36
本发明专利技术涉及图像处理技术领域,具体地涉及一种图片表格识别方法及图片表格识别装置。本发明专利技术提供的图片表格识别方法包括:表格检测步骤,通过预先构建的表格检测模型对图片进行表格检测,得到表格图;投影分析步骤,对表格图进行横向和/或纵向直方图投影,根据直方图的幅值分布,确定表格图的表格线长度和/或位置。上述图片表格识别方法能够对图片中的表格进行精准高效的识别,提高物料清单(BOM)处理效率。提高物料清单(BOM)处理效率。提高物料清单(BOM)处理效率。

【技术实现步骤摘要】
图片表格识别方法及图片表格识别装置


[0001]本专利技术涉及图像处理
,具体地涉及一种图片表格识别方法及图片表格识别装置。

技术介绍

[0002]物料清单(Bill of Material,简称BOM)是描述工业产品组成的技术文件,表明了产品的总装件、分装件、组件、部件、零件、直到原材料之间的结构关系以及所需的数量。在工业品电商运营中,客户通常也会采用物料清单(BOM)进行报价采购。
[0003]在上述的采购过程中,物料清单(BOM)会以PDF格式文件或者扫描图片、照片的形式进行传递。当进行大批量的采购时,客户提供的采购清单往往是多页PDF或者多图形式,并且包含标题及文字注释信息。而营业人员对应时更关注表格信息,即采购报价商品的具体信息。这就需要将表格部分做识别截取。
[0004]目前基于传统图像线条检测截取表格主体的方式,对只有横向线表格或者三线表处理困难,对干扰线也难以区别。基于深度学习的表格检测方法精度更高,目前常用的方法有基于Faster R

CNN或者YOLO,前者作为two

stage的定位框架,速度较慢;后者的速度较前者高,但精度却有损失。而且,由于PDF格式文件或图片、照片在扫描或拍摄时拍摄器材、拍摄角度的不同,物料清单(BOM)在图片中呈现的角度和尺寸和会有较大差异,也会对表格截取的准确性带来较大的影响。
[0005]因此,亟待一种技术方案,能够对图片中的表格进行精准高效的识别,提高物料清单(BOM)处理效率。
专利技术内容
[0006]针对以上问题,本专利技术提供了一种图片表格识别方法及图片表格识别装置,图片表格识别方法能够通过直方图投影的方式精准判断表格及表格文字的位置,从而实现精准高效地获取识别表格内容。
[0007]本专利技术的技术方案中,提供了一种图片表格识别方法,包括:
[0008]表格检测步骤,通过预先构建的表格检测模型对图片进行表格检测,得到表格图;
[0009]投影分析步骤,对表格图进行横向和/或纵向直方图投影,根据直方图的幅值分布,确定表格图的表格线长度和/或位置。
[0010]根据本专利技术的技术方案,表格检测步骤中通过采用深度学习算法对大量的物料清单(BOM)图片进行训练以获得表格检测模型,实现快速准确地检测图片中的表格。然后,对表格图进行横向和/或纵向直方图投影,以表格图的像素点横坐标或纵坐标为基础,进行水平或垂直方向的直方图投影,以了解像素在表格图中的分布情况。根据像素分布情况,判断表格中表格线的长度和位置,从而准确地定位和检测到表格,以便进一步地获取表格及表格中的文字内容。实现对图片中的表格进行精准高效的识别,提高物料清单(BOM)处理效率。
[0011]优选地,本专利技术的技术方案中,图片表格识别方法中的表格图具有多条表格横线,投影分析步骤包括:
[0012]纵向投影步骤,对表格图进行纵向直方图投影,根据纵向直方图的幅值分布,确定表格横线的长度;和
[0013]横向投影步骤,对表格图进行横向直方图投影,根据横向直方图的幅值分布,确定表格横线和表格文字的坐标位置,从而形成目标表格图片。
[0014]根据本专利技术的技术方案,对表格图中的表格横线及其中的表格文字进行精准定位,在此基础上对图片中的表格进行准确检测和剪裁提取以输出目标表格图片,完成图片中的表格识别捕捉。
[0015]进一步地,本专利技术的技术方案中,横向投影步骤包括:
[0016]表格横线坐标步骤,根据横向直方图的脉冲幅值大于预设比例的幅值,坐标即为表格横线坐标L
l

[0017]文字坐标步骤,根据横向直方图的脉冲幅值的中值,确定表格文字坐标L
w
和脉冲宽度w
f

[0018]根据本专利技术的技术方案,通过横向直方图的脉冲幅值的分析计算即可对表格图中的表格横线及其中的表格文字进行精准定位,计算过程方便且结果准确。
[0019]优选地,本专利技术的技术方案中,图片表格识别方法还包括
[0020]表格线补充步骤,按照表格图由上到下的顺序,若第一个表格横线坐标L
l1
大于第一个表格文字坐标L
w1
,则在表格文字坐标L
w1

w
f
/2处补充一条表格横线;若最后一个表格横线坐标L
ln
小于最后一个表格文字坐标L
wn
,则在表格文字坐标L
wn
+w
f
/2处补充一条表格横线。
[0021]根据本专利技术的技术方案,对表格横线和文字进行检测比较,已补全表格缺失部分,保证表格检测识别的完整性,避免发生表格数据错漏。
[0022]在本专利技术的技术方案中,图片表格识别方法还包括图片处理步骤,图片处理步骤包括:
[0023]图片读取步骤,将多个原始图片转化为同一格式,并读取或排列顺序;
[0024]图片校正步骤,对原始图片进行旋转变换和透视变换;
[0025]图片去重步骤,统一原始图片的尺寸,通过图片感知哈希检测重复的原始图片。
[0026]根据本专利技术的技术方案,首先对图片进行格式统一,然后再对同一格式的图片进行校正,校正图片拍摄、上传过程中的角度光影等带来的偏差,使表格的横纵线条与水平/垂直方向保持平行,以便后续进一步地读取分析。接着,对校正后的图片进行尺寸统一,再通过图片感知哈希得到图片的特征向量,根据图片特征向量之间的关系进行去重。从而,大大减少了后续图片表格识别的工作量,提高了图片表格识别的识别效率和精准度。
[0027]优选地,在本专利技术的技术方案中,图片表格识别方法中的图片校正步骤包括:
[0028]边缘检测步骤,对原始图片进行灰度化和二值化,再对得到的二值化图片进行边缘检测;
[0029]直线检测步骤,用霍夫直线检测方法检测确定边缘后的二值化图片,得到表格线;
[0030]角度检测步骤,在坐标系中测量表格线的夹角,区分表格横线和表格纵线;
[0031]旋转变换步骤,以全部表格线与横/纵坐标的夹角的中值作为旋转角度,对原始图
片进行旋转变换。
[0032]根据上述步骤,完成了对原始图片的旋转变换,消除了原始图片在横/纵坐标方向上的角度偏差,即水平面上的角度偏差。
[0033]进一步地,在本专利技术的技术方案中,图片表格识别方法中的图片校正步骤还包括:
[0034]开运算步骤,对原始图片进行灰度化和二值化,选取水平结构元素对进行旋转变换后的二值化图片进行开运算,得到一组横线区域的二值图;
[0035]外接矩阵步骤,在横线区域的二值图中查找每一条横线的连通域,获取连通域的最小外接矩阵,并记录最小外接矩阵的矩阵宽度w和中心坐标(x
c
,y
c
);
[0036]表格线筛选步骤,根据每一条横线的最小外接矩阵的矩阵宽度w和中心坐标(x本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图片表格识别方法,其特征在于,包括:表格检测步骤,通过预先构建的表格检测模型对图片进行表格检测,得到表格图;投影分析步骤,对所述表格图进行横向和/或纵向直方图投影,根据直方图的幅值分布,确定所述表格图的表格线长度和/或位置。2.如权利要求1所述的图片表格识别方法,其特征在于,所述表格图具有多条表格横线,所述投影分析步骤包括:纵向投影步骤,对所述表格图进行纵向直方图投影,根据纵向直方图的幅值分布,确定表格横线的长度;和横向投影步骤,对所述表格图进行横向直方图投影,根据横向直方图的幅值分布,确定所述表格横线和表格文字的坐标位置,从而形成目标表格图片。3.如权利要求2所述的图片表格识别方法,其特征在于,所述横向投影步骤包括:表格横线坐标步骤,根据所述横向直方图的脉冲幅值集合,利用大于预设比例的幅值,确定表格横线坐标L
l
;文字坐标步骤,根据所述横向直方图的脉冲幅值的中值,确定表格文字坐标L
w
和脉冲宽度w
f
。4.如权利要求3所述的图片表格识别方法,其特征在于,还包括表格线补充步骤,按照所述表格图由上到下的顺序,若第一个所述表格横线坐标L
l1
大于第一个所述表格文字坐标L
w1
,则在所述表格横线坐标L
w1

w
f
/2处补充一条表格横线;若最后一个所述表格横线坐标L
ln
小于最后一个所述表格文字坐标L
wn
,则在所述表格横线坐标L
wn
+w
f
/2处补充一条表格横线。5.如权利要求1

4任一项所述的图片表格识别方法,其特征在于,还包括图片处理步骤,所述图片处理步骤包括:图片读取步骤,将多个原始图片转化为同一格式,并读取或排列顺序;图片校正步骤,对所述原始图片进行旋转变换和透视变换;图片去重步骤,统一所述原始图片的尺寸,通过图片感知哈希检测重复的所述原始图片。6.如权利要求5所述的图片表格识别方法,其特征在于,所述图片校正步骤包括:边缘检测步骤,对所述原始图片进行灰度化和二值化,再对...

【专利技术属性】
技术研发人员:胡叶岑苏啸倪浩天
申请(专利权)人:米思米上海投资有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1