【技术实现步骤摘要】
表格图像的识别方法、装置、设备和存储介质
[0001]本公开涉及人工智能
,具体涉及计算机视觉、深度学习等
,可应用于智慧城市和智慧金融场景下,尤其涉及一种表格图像的识别方法、装置、设备和存储介质。
技术介绍
[0002]随着办公电子化程度的提高,原本以纸质形式保存的文档资料逐渐通过扫描仪等电子化手段转为以图像形式保存。表格图像是指包含表格的图像。
[0003]相关技术中,一般采用较为复杂的图像处理流程来识别表格图像。
技术实现思路
[0004]本公开提供了一种表格图像的识别方法、装置、设备和存储介质。
[0005]根据本公开的一方面,提供了一种表格图像的识别方法,包括:获取表格图像的图像特征;基于所述图像特征,获得所述表格图像的表格结构信息,所述表格结构信息包括文本标签;基于所述图像特征和所述文本标签,获得所述表格图像中的文本区域的位置信息;基于所述位置信息在所述表格图像中确定所述文本区域,并识别所述文本区域中的文本内容。
[0006]根据本公开的另一方面,提供了一种表格 ...
【技术保护点】
【技术特征摘要】
1.一种表格图像的识别方法,包括:获取表格图像的图像特征;基于所述图像特征,获得所述表格图像的表格结构信息,所述表格结构信息包括文本标签;基于所述图像特征和所述文本标签,获得所述表格图像中的文本区域的位置信息;基于所述位置信息在所述表格图像中确定所述文本区域,并识别所述文本区域中的文本内容。2.根据权利要求1所述的方法,其中,所述基于所述图像特征,获得所述表格图像的表格结构信息,包括:采用结构解码器,对所述图像特征进行处理,以获得所述表格结构信息。3.根据权利要求2所述的方法,其中,所述结构解码器包括多个单元,所述采用结构解码器,对所述图像特征进行处理,以获得所述表格结构信息,包括:采用所述结构解码器的多个单元,对所述图像特征进行处理,以获得所述多个单元中各个单元的输出特征;基于所述输出特征获得所述表格结构信息。4.根据权利要求3所述的方法,其中,所述基于所述图像特征和所述文本标签,获得文本区域的位置信息,包括:采用位置解码器,对所述文本标签对应的单元的输出特征,以及所述图像特征进行处理,以获得所述文本区域的位置信息。5.根据权利要求1
‑
4任一项所述的方法,其中,所述获取表格图像的图像特征,包括:采用编码器对表格图像进行处理,以提取所述表格图像的特征图;将所述特征图展平为特征向量,作为所述图像特征。6.一种表格图像的识别装置,包括:获取模块,用于获取表格图像的图像特征;结构模块,用于基于所述图像特征,获得所述表格图像的表格结构信息,所述表格结构信息包括文本标签;位置模块,用于基于所述图像特征和所述文本标签,获得所述表格图像中的文本区域的位置信息;识别模块,用于基于所述位置信息在所述表...
【专利技术属性】
技术研发人员:庾悦晨,郭增源,章成全,姚锟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。