基于人工智能的表格图像重构方法、装置、设备及介质制造方法及图纸

技术编号：31711680 阅读：13 留言：0更新日期：2022-01-01 11:15

本发明专利技术涉及人工智能技术领域，提供了一种基于人工智能的表格图像重构方法、装置、设备及存储介质。所述方法包括：识别待重构的表格图像中各文本框的坐标信息及文本信息并构建无向连通图；提取无向连通图中各节点的位置坐标特征、文本特征、图像特征及位置编码特征，并执行融合操作得到各节点的目标融合特征；将包含有边特征及节点目标融合特征的无向连通图，输入节点关系分类模型，得到无向连通图中各节点之间边的分类结果；基于分类结果将各文本框填充至模板文件的对应位置，得到重构的目标表格文件。本发明专利技术可以将非结构化的表格图像转换为结构化的表格文件。本发明专利技术还涉及区块链技术领域，上述目标表格文件可以存储于一区块链的节点中。节点中。节点中。

全部详细技术资料下载

【技术实现步骤摘要】
基于人工智能的表格图像重构方法、装置、设备及介质

[0001]本专利技术涉及人工智能
，尤其涉及一种基于人工智能的表格图像重构方法、装置、设备及存储介质。

技术介绍

[0002]表格是一种有效的数据组织与展现方法被广泛应用，随着文档尤其是通过扫描、拍照等方式生成的文档快速增长，实现自动重构表格文档图像的方法非常重要。重构表格图像是指将不可编辑的表格图像，自动转换为保持原始表格结构的excel形式。由于表格文档版式复杂、背景纹理丰富、信息排版多样、光照程度及拍摄机器质量等因素，目前大多研究仅限于对表格图像的文字识别，因此，亟需通过技术方案实现对表格图像的重构。

技术实现思路

[0003]鉴于以上内容，本专利技术提供一种基于人工智能的表格图像重构方法、装置、设备及存储介质，其目的在于实现将非结构化表格图像自动转换为结构化的表格文件。
[0004]为实现上述目的，本专利技术提供一种基于人工智能的表格图像重构方法，该方法包括：
[0005]将待重构的表格图像输入预先构建的图像识别模型，得到所述表格图像中各文本框的坐标信息及文本信息，以各文本框作为节点，各文本框之间的距离作为边构建无向连通图；
[0006]分别提取所述无向连通图中各节点的位置坐标特征、文本特征、图像特征及位置编码特征，对各节点的位置坐标特征、文本特征、图像特征及位置编码特征执行融合操作，得到各节点对应的目标融合特征；
[0007]将各节点之间的距离特征作为所述无向连通图的边特征，将包含有边特征及节点目标融合...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的表格图像重构方法，应用于电子设备，其特征在于，所述方法包括：将待重构的表格图像输入预先构建的图像识别模型，得到所述表格图像中各文本框的坐标信息及文本信息，以各文本框作为节点，各文本框之间的距离作为边构建无向连通图；分别提取所述无向连通图中各节点的位置坐标特征、文本特征、图像特征及位置编码特征，对各节点的位置坐标特征、文本特征、图像特征及位置编码特征执行融合操作，得到各节点对应的目标融合特征；将各节点之间的距离特征作为所述无向连通图的边特征，将包含有边特征及节点目标融合特征的无向连通图，输入预先训练好的节点关系分类模型，得到所述无向连通图中各节点之间边的分类结果；基于各节点之间边的分类结果确各节点之间的位置关系，基于各节点的位置关系将各节点对应的文本框填充至预设模板文件的对应位置，得到重构的目标表格文件。2.如权利要求1所述的基于人工智能的表格图像重构方法，其特征在于，所述图像识别模型包括位置检测模型及文本识别模型，所述将待重构的表格图像输入预先构建的图像识别模型，得到所述表格图像中各文本框的坐标信息及文本信息，包括：将所述表格图像输入所述位置检测模型，得到所述表格图像中各个文本框的坐标信息，基于各个文本框的坐标信息对表格图像的文本框进行切分，将切分后的文本框分别输入所述文本识别模型，得到各文本框的文本信息。3.如权利要求1所述的基于人工智能的表格图像重构方法，其特征在于，所述提取所述无向连通图中各节点的图像特征，包括：利用FPN算法构建特征塔，将节点对应的图像依次输入至所述特征塔的不同层级，利用所述特征塔中的映射通道将所述特征塔中各层级的图像逐层向下映射至所述特征塔底层的图像中，对映射后特征塔底层的多张映射图像进行拼接，得到该节点对应的图像特征。4.如权利要求1所述的基于人工智能的表格图像重构方法，其特征在于，所述对各节点的位置坐标特征、文本特征、图像特征及位置编码特征执行融合操作，包括：对各节点对应的位置坐标特征、文本特征、图像特征及位置编码特征分别通过预设模型的全连接层进行特征转换，生成四个不同尺寸的初始特征；将四个不同尺寸的初始特征的尺寸调整至相同的尺寸，将调整后的四个初始特征进行点乘运算生成初始融合特征；以全连接层对所述初始融合特征进行特征转换生成注意力特征，将所述注意力特征与所述初始融合特征进行点乘融合生成所述目标融合特征。5.如权利要求1所述的基于人工智能的表格图像重构方法，其特征在于，所述对各节点的位置坐标特征、文本特征、图像特征及位置编码特征执行融合操作，包括：分别对各节点的位置坐标特征、文本特征、图像特征及位置编码特征设定对应的权重，根据所述权重对各节点的位置坐标特征、文本特征、图像特...

【专利技术属性】
技术研发人员：陈少琼，汤鑫，付园园，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人