【技术实现步骤摘要】
本申请实施例涉及人工智能(artificial intelligence,ai),尤其涉及一种表格识别方法及其相关设备。
技术介绍
1、表格识别为图像处理中的一个重要环节,其目的是将图像形式的表格转换为文字形式的表格。当用户存在表格识别需求时,可通过ai技术中的神经网络模型对包含待识别表格的图像进行处理,以从该图像中提取出所需的表格,从而完成用户的表格识别需求。
2、在相关技术中,可将包含待识别的表格的目标图像输入至神经网络模型。那么,神经网络模型可先对目标图像进行初步的处理,从而得到目标图像的特征。接着,神经网络模型可对目标图像的特征做进一步的处理,从而输出表格的多个单元格以及多个单元格的位置信息。然后,可对目标图像进行识别,从而得到表格的多个文本以及多个文本的位置信息。最后,可基于单元格的位置信息以及文本的位置信息,将多个单元格以及多个文本进行匹配,从而得到所需的表格。
3、上述表格识别过程中,仅考虑了模型所输出的多个单元格的位置信息,所考虑的因素较为单一,一旦多个单元格的位置信息不够准确,进而无法正确完成多
...【技术保护点】
1.一种表格识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述通过目标模型对所述目标图像进行处理,得到所述表格的多个单元格包括:
3.根据权利要求1或2所述的方法,其特征在于,所述通过目标模型对所述目标图像进行处理,得到所述多个单元格的第一位置信息包括:
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述通过目标模型对所述目标图像进行处理,得到所述多个单元格之间的多个分隔符的第二位置信息包括:
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述基于所述第二位置信息,确定所
...【技术特征摘要】
1.一种表格识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述通过目标模型对所述目标图像进行处理,得到所述表格的多个单元格包括:
3.根据权利要求1或2所述的方法,其特征在于,所述通过目标模型对所述目标图像进行处理,得到所述多个单元格的第一位置信息包括:
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述通过目标模型对所述目标图像进行处理,得到所述多个单元格之间的多个分隔符的第二位置信息包括:
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述基于所述第二位置信息,确定所述多个单元格的第四位置信息包括:
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述基于所述第一位置信息、所述第三位置信息以及所述第四位置信息,对所述多个单元格以及所述多个文本进行匹配,得到所述表格包括:
7.根据权利要求6所述的方法,其特征在于,所述第一匹配为中心匹配,所述第二匹配为匈牙利匹配。
8.一种模型训练方法,其特征在于,所述方法包括:
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
10.根据权利要求8所述的方法,其特征在于,所述方法还包括:
11.根据权利要求10所述的方法,其特征在于,所述第二图像以及所述第三图像来源于同一张图像,所...
【专利技术属性】
技术研发人员:裴玉龙,陶耀,唐莞辉,胡海林,王云鹤,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。