【技术实现步骤摘要】
基于语义分割的表格重建方法、装置、设备及存储介质
[0001]本申请涉及人工智能
,具体涉及一种基于语义分割的表格重建方法、装置、设备及存储介质。
技术介绍
[0002]表格作为一种有效的数据组织与展现方法被广泛应用,也成为各类文档中常见的页面对象。表格通常以结构化的方式展示基本信息,因而表格检测和识别是诸多文件分析应用中的一项重要任务。而且,随着文档数目的爆炸性增长,如何高效地从文档中找到表格并获取内容与结构信息即表格识别,成为了一个亟待解决的问题。
[0003]目前,对于图像中的表格的检测与重建大多通过边缘检测的方式来实现,即通过边缘检测技术识别出表格的边界,基于表格的边界重建表格。但是,实际应用中有些图像可能会存在变形,甚至有些表格没有明显的边界,这都给边缘检测带来巨大的挑战,导致重建出的表格精度低。
技术实现思路
[0004]本申请实施例提供了一种基于语义分割的表格重建方法、装置、设备及存储介质。通过语义分割的方式,提高表格的重建精度。
[0005]第一方面,本申请实施例提供一种基于语义分割的表格重建方法,包括:
[0006]获取待重建图像,所述待重建图像中存在待重建表格;
[0007]对所述待重建图像进行语义分割,得到多个掩码图,其中,所述多个掩码图与多个预设分割类别一一对应,所述多个掩码图中的每个掩码图用于表示所述待重建图像中的各个像素点属于与所述每个掩码图对应的预设分割类别的概率;
[0008]根据所述多个掩码图构建待重建表格;
[0 ...
【技术保护点】
【技术特征摘要】
1.一种基于语义分割的表格重建方法,其特征在于,包括:获取待重建图像,所述待重建图像中存在待重建表格;对所述待重建图像进行语义分割,得到多个掩码图,其中,所述多个掩码图与多个预设分割类别一一对应,所述多个掩码图中的每个掩码图用于表示所述待重建图像中的各个像素点属于与所述每个掩码图对应的预设分割类别的概率;根据所述多个掩码图构建待重建表格;从所述待重建图像中提取与所述待重建表格对应的文字内容;将所述文字内容填入所述待重建表格,得到重建好的表格。2.根据权利要求1所述的方法,其特征在于,所述对所述待重建图像进行语义分割,得到多个掩码图,包括:对所述待重建图像进行特征提取,得到多个第一特征图;对所述多个第一特征图进行卷积处理,得到多个第一语义分割结果,其中,所述多个第一语义分割结果与所述多个预设分割类别一一对应;将所述待重建图像中每个像素点分别在所述多个第一语义分割结果中的取值进行sigmoid激活处理,得到所述多个掩码图,其中,所述多个第一语义分割结果与所述多个掩码图一一对应。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述多个掩码图构建待重建表格,包括:对所述多个掩码图中的每个掩码图进行二值化处理,得到多个二值图;针对所述多个二值图中的每个二值图,确定所述每个二值图中的目标像素点组成的M个连通域,其中,所述目标像素点为所述每个二值图像素值为1的像素点;将所述每个二值图中的M个连通域中的每个连通域进行直线拟合,得到与所述每个二值图对应的N条第一直线段;对所述每个连通域对应的第一直线段进行合并,得到与所述每个二值图对应的目标直线段;根据所述多个二值图中的每个二值图对应的目标直线段,构建待重建表格。4.根据权利要求3所述的方法,其特征在于,所述将所述每个二值图中的M个连通域中的每个连通域进行直线拟合,得到与所述每个连通域对应的第一直线段,包括:对所述每个二值图中的M个连通域中的每个连通域进行直线拟合,得到M条第二直线段,其中,所述M条第二直线段与所述M个连通域一一对应;确定所述M条第二直线段中的每条第二直线段在图像坐标下与X轴的夹角,所述X轴为图像坐标系下的X轴;根据所述M条第二直线段中的每条第二直线段与X轴的夹角,从所述M条第二直线段中选取K条第二直线段,其中,所述K条第二直线段中的每条第二直线段与所述X轴的夹角小于与所述每个二值图对应的预设分割类别对应的第一阈值或者大于第二阈值,K小于或等于M;确定所述K条第二直线段与所述X轴的夹角的均值和标准差,并确定所述K条第二直线段中的每条第二直线段与所述X轴的夹角与所述均值之间的差值;根据所述K条第二直线段中的每条第二直线段对应的差值,以及目标阈值,从所述K条
第二直线段中选取出N条第二直线段,并将所述N条第二直线段作为与所述每个连通域对应的N条第一直线段,其中,所述N条第二直线段中的每条第二直线段对应的差值小于所述目标阈值,所述目标阈值是根据...
【专利技术属性】
技术研发人员:朱锦祥,臧磊,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。