【技术实现步骤摘要】
表格信息提取方法和电子设备
[0001]本申请涉及图像处理
,具体而言,涉及一种表格信息提取方法、装置、设备和存储介质。
技术介绍
[0002]图形界面是流形的人机交互方式,通过图像界面人们可以与机器进行更有效的交互。信息经过整理与计算后,除了使用直接的文本表达外,常常还需采用表格来进行展示。与文字相比,表格可以直观地展示数据的逻辑结构,与图像相比,表格的数据更加精确与丰富。
[0003]常用的识别图形界面中表格信息的方式有如下两种:
[0004]方法一:工作人员人眼观察图形界面,发现有表格,则将其中表格的位置,结构记录下来,并存入系统中。
[0005]方法二:图像界面的开发本身包含了所有的底层数据,软件开发者可以将这些表格数据以一定的组织方式输出到用户指定的位置。
[0006]以上两种方法都会存在比较大缺陷,方法一的缺陷:(1)人力消耗巨大,对图形界面中每个表格都需要人工地检查识别,对于内容丰富的表格,分析时间会很长。(2)工人的工作强度大,工人需要长期地面对电脑屏幕,对眼睛负担太重, ...
【技术保护点】
【技术特征摘要】
1.一种表格信息提取方法,其特征在于,包括:获取待处理的图像信息;提取所述图像信息中的可见线条信息,得到可见线集合;对所述可见线集合进行分组处理,将所述可见线集合中相交的可见线段划分为同一组,得到多个可见线组;分别对每个所述可见线组进行轮廓分析,并基于轮廓分析结果得到所述图像信息中的表格信息。2.根据权利要求1所述的方法,其特征在于,所述提取所述图像信息中的可见线条信息,得到可见线集合,包括:对所述图像信息进行二值化处理,得到二值化图像,所述二值化图像中可见线条为前景,所述图像信息中除去所述可见线条的其余信息为背景;根据所述二值化图像,提取所述图像信息中的可见线条信息,得到所述可见线集合。3.根据权利要求2所述的方法,其特征在于,所述对所述图像信息进行二值化处理,得到二值化图像,包括:当所述图像信息中同时存在像素值比局部环境像素值大的第一线条和像素值比局部环境像素值小的第二线条时,采用局部二值化方式对所述图像信息进行二值化处理,得到所述二值化图像。4.根据权利要求2所述的方法,其特征在于,所述对所述图像信息进行二值化处理,得到二值化图像,包括:当所述图像信息中存在与局部环境像素值相同的第三线条时,采用梯度阈值二值化方式对所述图像信息进行二值化处理,得到所述二值化图像。5.根据权利要求2所述的方法,其特征在于,所述对所述图像信息进行二值化处理,得到二值化图像,包括:采用固定阈值二值化方式,将所述图像信息中每个像素数值与预定的二值化阈值相比较,大于所述二值化阈值的像素作为前景,小于或等于所述二值化阈值的像素作为背景。6.根据权利要求2所述的方法,其特征在于,所述根据所述二值化图像,提取所述图像信息中的可...
【专利技术属性】
技术研发人员:黄博,张泉,燕鹏举,
申请(专利权)人:上海弘玑信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。