【技术实现步骤摘要】
一种从图像中提取表格的方法、系统和存储介质
[0001]本申请涉及图像处理领域,特别涉及一种从图像中提取表格的方法、系统和存储介质。
技术介绍
[0002]表格结构识别旨在从包含表格的原始图像中提取表格的结构信息,包括每个单元格的坐标位置和每个单元格所属的行和列信息。目标检测方法可以基于少量的训练数据训练出卷积核对原始图像进行单元格检测。然而,表格中的空白单元格和检测框的尺寸限制会导致目标检测方法获取的表格结构信息中表格边框难以对齐,需要进一步对表格边框进行调整,这又会降低表格结构识别的效率。此外,对于包含密集单元格的表格,检测框的尺寸限制同样会导致表格结构识别效率的降低。
[0003]因此,有必要提供一种从图像中提取表格的方案,可以提高表格结构识别的准确率和效率。
技术实现思路
[0004]本说明书一个方面提供一种从图像中提取表格的方法,所述方法包括:获取待处理图像;对待处理图像进行特征提取,以获得其一个以上特征图,其中,至少一个特征图融合有行注意力信息和/或列注意力信息;对特征图进行识别,得到原始图像包含的表格。
[0005]本说明书一个方面提供一种从图像中提取表格的方法,所述方法包括:获取待处理图像;对待处理图像进行特征提取,以获得其一个以上特征图;特征图为三维图,包括在一个以上通道上的二维矩阵;对于一个以上特征图中的每一个:将其两个以上通道上的二维矩阵进行组合重排,得到行数和/或列数大于原二维矩阵的重排二维矩阵,进而得到重排特征图;对重排特征图进行识别,得到原始图像包含的表格。
【技术保护点】
【技术特征摘要】
1.一种从图像中提取表格的方法,所述方法包括:获取待处理图像;对待处理图像进行特征提取,以获得其一个以上特征图,其中,至少一个特征图融合有行注意力信息和/或列注意力信息;对所述特征图进行识别,得到原始图像包含的表格。2.如权利要求1所述的方法,对待处理图像进行特征提取,以获得其一个以上特征图,包括对待处理图像进行一轮以上迭代处理,得到一个以上特征图,其中一轮迭代处理包括:对待处理图像或前一轮迭代处理得到的特征图进行卷积操作,得到初始特征图;所述初始特征图为三维图,包括在一个以上通道上的二维矩阵;获取初始特征图中各通道上二维矩阵中各行的第一特征信息;基于一个以上第一策略对各通道上二维矩阵中相同行的第一特征信息进行融合,得到一个以上第一策略分别对应的所述二维矩阵中各行的第一融合特征信息;基于一个以上第一策略分别对应的所述二维矩阵中各行的第一融合特征信息,得到初始特征图中各通道上二维矩阵中各行的行注意力权重;将初始特征图中各像素点的像素值乘以对应通道上对应行的行注意力权重,得到当前轮的特征图。3.如权利要求2所述的方法,所述一个以上特征图包括所述一轮以上迭代处理中一轮或多轮中得到的特征图。4.如权利要求2所述的方法,所述第一特征信息包括所述二维矩阵中对应行的各元素的均值和/或各元素中的最大值。5.如权利要求2所述的方法,所述基于一个以上第一策略对各通道上二维矩阵中相同行的第一特征信息进行融合,得到一个以上第一策略分别对应的所述二维矩阵中各行的第一融合特征信息,包括:基于一个以上第一策略对各通道上二维矩阵中相同行的第一特征信息进行卷积操作,得到一个以上第一策略分别对应的所述二维矩阵中各行的第一卷积信息;基于第一函数,将一个以上第一卷积信息映射为一个以上第一策略分别对应的所述二维矩阵中各行的第一融合特征信息。6.如权利要求1所述的方法,对待处理图像进行特征提取,以获得其一个以上特征图,包括对待处理图像进行一轮以上迭代处理,得到一个以上特征图,其中一轮迭代处理包括:对待处理图像或前一轮迭代处理得到的特征图进行卷积操作,得到初始特征图;所述初始特征图为三维图,包括在一个以上通道上的二维矩阵;获取初始特征图各通道上二维矩阵中各列的第二特征信息;基于一个以上第二策略对各通道上二维矩阵中相同列的第二特征信息进行融合,得到一个以上第二策略分别对应的所述二维矩阵中各列的第二融合特征信息;将基于一个以上第二策略分别对应的所述二维矩阵中各列的第二融合特征信息,得到初始特征图中各通道上二维矩阵中各列的列注意力权重;将初始特征图中各像素点的像素值乘以对应通道上对应列的列注意力权重,得到所述特征图。7.如权利要求6所述的方法,所述第二特征信息包括所述二维矩阵中对应列的各元素
的均值和/或各元素中的最大值。8.如权利要求1所述的方法,所述对待处理图像进行特征提取,以获得其一个以上特征图,包括对待处理图像进行一轮以上迭代处理,得到一个以上特征图,其中一轮迭代处理包括:对待处理图像或前一轮迭代处理得到的特征图进行卷积操作,得...
【专利技术属性】
技术研发人员:王国栋,丁国栋,谌明,夏鑫,
申请(专利权)人:杭州同花顺数据开发有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。