一种表格识别方法及其相关设备技术

技术编号：43812037 阅读：39 留言：0更新日期：2024-12-27 13:27

本申请公开了一种表格识别方法及其相关设备，可正确完成多个单元格与多个文本之间的匹配，从而得到正确的表格。本申请的方法包括：当需要进行表格识别时，可先获取包含待识别表格的目标图像。在得到目标图像后，可通过目标模型对目标图像进行处理，从而分别得到表格的多个单元格、多个单元格的第一位置信息以及多个单元格之间的多个分隔符的第二位置信息。在得到目标图像后，还可对目标图像进行文本识别，从而得到表格的多个文本以及多个文本的第三位置信息。然后，可利用多个分隔符的第二位置信息，来确定多个单元格的第四位置信息。最后，可综合考虑这些位置信息，以完成多个单元格以及多个文本之间的匹配，从而得到所需要的表格。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及人工智能(artificial intelligence，ai)，尤其涉及一种表格识别方法及其相关设备。

技术介绍

1、表格识别为图像处理中的一个重要环节，其目的是将图像形式的表格转换为文字形式的表格。当用户存在表格识别需求时，可通过ai技术中的神经网络模型对包含待识别表格的图像进行处理，以从该图像中提取出所需的表格，从而完成用户的表格识别需求。

2、在相关技术中，可将包含待识别的表格的目标图像输入至神经网络模型。那么，神经网络模型可先对目标图像进行初步的处理，从而得到目标图像的特征。接着，神经网络模型可对目标图像的特征做进一步的处理，从而输出表格的多个单元格以及多个单元格的位置信息。然后，可对目标图像进行识别，从而得到表格的多个文本以及多个文本的位置信息。最后，可基于单元格的位置信息以及文本的位置信息，将多个单元格以及多个文本进行匹配，从而得到所需的表格。

3、上述表格识别过程中，仅考虑了模型所输出的多个单元格的位置信息，所考虑的因素较为单一，一旦多个单元格的位置信息不够准确，进而无法正确完成多...

【技术保护点】

1.一种表格识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述通过目标模型对所述目标图像进行处理，得到所述表格的多个单元格包括：

3.根据权利要求1或2所述的方法，其特征在于，所述通过目标模型对所述目标图像进行处理，得到所述多个单元格的第一位置信息包括：

4.根据权利要求1至3任意一项所述的方法，其特征在于，所述通过目标模型对所述目标图像进行处理，得到所述多个单元格之间的多个分隔符的第二位置信息包括：

5.根据权利要求1至4任意一项所述的方法，其特征在于，所述基于所述第二位置信息，确定所述多个单元格的第四位...

【技术特征摘要】

1.一种表格识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述通过目标模型对所述目标图像进行处理，得到所述表格的多个单元格包括：

3.根据权利要求1或2所述的方法，其特征在于，所述通过目标模型对所述目标图像进行处理，得到所述多个单元格的第一位置信息包括：

5.根据权利要求1至4任意一项所述的方法，其特征在于，所述基于所述第二位置信息，确定所述多个单元格的第四位置信息包括：

6.根据权利要求1至5任意一项所述的方法，其特征在于，所述基于所述第一位置信息、所述第三位置信息以及所述第四位置信息，对所述多个单元格以及所述多个文本进行匹配，得到所述表格包括：

7.根据权利要求6所述的方法，其特征在于，所述第一匹配为中心匹配，所述第二匹配为匈牙利匹配。

8.一种模型训练方法，其特征在于，所述方法包括：

9.根据权利要求8所述的方法，其特征在于，所述方法还包括：

10.根据权利要求8所述的方法，其特征在于，所述方法还包括：

11.根据权利要求10所述的方法，其特征在于，所述第二图像以及所述第三图像来源于同一张图像，所...

【专利技术属性】
技术研发人员：裴玉龙，陶耀，唐莞辉，胡海林，王云鹤，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人