表格识别方法、模型预训练方法及模型训练方法技术

技术编号:41501190 阅读:29 留言:0更新日期:2024-05-30 14:43
本申请提供一种表格识别方法、模型预训练方法及模型训练方法。本申请的方法包括:获取待识别图像,待识别图像包括待识别表格;将待识别图像输入表格识别模型中进行识别,得到待识别表格中单元格在待识别图像中的坐标位置和在待识别表格中的行列位置,表格识别模型是通过在预训练后的表格识别模型的基础上训练得到的,以实现对表格结构以及表格中内容的准确识别。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种表格识别方法、模型预训练方法及模型训练方法


技术介绍

1、表格利用其独有的结构,规整并传递信息之间的逻辑关系,从而成为信息的重要载体。无论是文本片段还是票据异或其他,只要有表格存在,则表格区域一定是信息量最大、最丰富的区域之一。

2、目前,只能通过ocr(光学字符识别)技术识别出表格中的文本,但是无法识别到表格结构,进而导致还无法准确识别图像中的表格。因此,亟需一种表格识别方法,以准确的识别表格。


技术实现思路

1、本申请提供一种表格识别方法、模型预训练方法及模型训练方法,用以无法准确识别表格的问题。

2、第一方面,本申请提供一种表格识别方法,包括:获取待识别图像,待识别图像包括待识别表格;将待识别图像输入表格识别模型中进行识别,得到待识别表格中单元格在待识别图像中的坐标位置和在待识别表格中的行列位置,表格识别模型是通过在预训练后的表格识别模型的基础上训练得到的。

3、第二方面,本申请提供一种模型预训练方法,包括:获取样本图像,样本图像中包含本文档来自技高网...

【技术保护点】

1.一种表格识别方法,其特征在于,包括:

2.根据权利要求1所述的表格识别方法,其特征在于,所述将所述待识别图像输入表格识别模型中进行识别,得到所述待识别表格中单元格在所述待识别图像中的坐标位置和在所述待识别表格中的行列位置之后,还包括:

3.根据权利要求2所述的表格识别方法,其特征在于,所述在所述可编辑表格中填充所述文本信息,得到目标表格之后,还包括:

4.根据权利要求2所述的表格识别方法,其特征在于,所述在所述可编辑表格中填充所述文本信息,得到目标表格之后,还包括:

5.根据权利要求2所述的表格识别方法,其特征在于,所述在所述可编辑表格...

【技术特征摘要】

1.一种表格识别方法,其特征在于,包括:

2.根据权利要求1所述的表格识别方法,其特征在于,所述将所述待识别图像输入表格识别模型中进行识别,得到所述待识别表格中单元格在所述待识别图像中的坐标位置和在所述待识别表格中的行列位置之后,还包括:

3.根据权利要求2所述的表格识别方法,其特征在于,所述在所述可编辑表格中填充所述文本信息,得到目标表格之后,还包括:

4.根据权利要求2所述的表格识别方法,其特征在于,所述在所述可编辑表格中填充所述文本信息,得到目标表格之后,还包括:

5.根据权利要求2所述的表格识别方法,其特征在于,所述在所述可编辑表格中填充所述文本信息,得到目标表格之后,还包括:

6.一种模型预训练方法,其特征在于,包括:

7.根据权利要求6所述的模型预训练方法,其特征在于,所述表格识别模型包括所述编码器、所述第一解码器和所述第二解码器,所述编码器的输出为所述第一解码器和所述第二解码器的输入。

8.根据权利要求6所述的模型...

【专利技术属性】
技术研发人员:龙如蛟邢航笛杨志博郑琪姚聪
申请(专利权)人:浙江阿里巴巴机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1