【技术实现步骤摘要】
表格生成方法、装置、电子设备、存储介质及产品
[0001]本公开涉及人工智能
,具体为计算机视觉和深度学习
,可应用于智慧城市和智慧金融场景下,尤其涉及一种表格生成方法、装置、电子设备、存储介质及产品。
技术介绍
[0002]OCR(Optical Character Recognition,光学字符识别)技术,是指电子设备检测纸质上打印的字符,通过检测明暗等模式确定图像的表格形状,然后字符识别方法获得以计算机语言表示的文字的过程。
[0003]现有技术中,OCR技术识别表格的识别方式准确度不高,识别精度较差。
技术实现思路
[0004]本公开提供了一种用于表格生成的方法、装置、电子设备、存储介质及产品。
[0005]根据本公开的第一方面,提供了一种表格生成方法,包括:
[0006]识别待识别图像中的至少一个表格对象,获得所述至少一个表格对象分别对应的表格属性;其中,任一个表格对象的表格属性包括单元格属性或非单元格属性;
[0007]确定所述至少一个表格对象中具有单 ...
【技术保护点】
【技术特征摘要】
1.一种表格生成方法,包括:识别待识别图像中的至少一个表格对象,获得所述至少一个表格对象分别对应的表格属性;其中,任一个表格对象的表格属性包括单元格属性或非单元格属性;确定所述至少一个表格对象中具有单元格属性的至少一个目标对象;确定所述至少一个目标对象分别对应的单元格区域,获得所述至少一个目标对象分别对应的单元格位置信息;根据所述至少一个目标对象分别对应的单元格位置信息,生成所述待识别图像对应的电子表格。2.根据权利要求1所述的方法,其中,所述根据所述至少一个目标对象分别对应的单元格位置信息,生成所述待识别图像对应的电子表格,包括:根据所述至少一个目标对象分别对应的单元格位置信息,确定至少一个目标对象分别对应的区域图像;识别所述至少一个目标对象分别对应的区域图像的文本信息,以获得所述至少一个目标对象分别对应的图像文本信息;根据所述至少一个目标对象分别对应的图像文本信息以及单元格位置信息,生成所述电子表格。3.根据权利要求1所述的方法,其中,所述识别待识别图像中的至少一个表格对象,获得所述至少一个表格对象分别对应的表格属性,包括:识别所述待识别图像中的至少一个表格对象分别对应的对象位置信息;利用所述至少一个表格对象分别对应的对象位置信息,确定所述至少一个表格对象分别对应的表格属性。4.根据权利要求3所述的方法,其中,所述利用所述至少一个表格对象分别对应的对象位置信息,确定所述至少一个表格对象分别对应的表格属性,包括:基于所述至少一个表格对象分别对应的对象位置信息,提取所述至少一个表格对象分别对应的目标特征;将所述至少一个表格对象分别对应的目标特征输入到属性分类模型,获得所述至少一个表格对象分别对应的表格属性。5.根据权利要求4所述的方法,其中,所述基于所述至少一个表格对象分别对应的对象位置信息,提取所述至少一个表格对象分别对应的目标特征,包括:提取所述至少一个表格对象分别对应的对象特征;基于所述至少一个表格对象分别对应的对象位置信息,提取所述至少一个表格对象分别对应的区域特征;将任一个表格对象的对象特征和区域特征进行特征拼接处理,获得所述表格对象的多模态特征,以获得所述至少一个表格对象分别对应的多模态特征;将所述至少一个表格对象分别对应的多模态特征输入特征融合模型,获得所述至少一个表格对象分别对应的目标特征。6.根据权利要求5所述的方法,其中,还包括:基于所述待识别图像,提取所述至少一个表格对象在预设模态种类分别对应的模态特征;
所述将任一个表格对象的对象特征和区域特征进行特征拼接,获得所述表格对象的多模态特征,以获得所述至少一个表格对象分别对应的多模态特征,包括:将任一个表格对象的对象特征、区域特征和所述表格对象在所述模态种类对应的模态特征进行特征拼接,获得所述表格对象的多模态特征,以获得所述至少一个表格对象分别对应的多模态特征。7.根据权利要求5所述的方法,其中,所述至少一个表格对象包括至少一个文本框对象;所述提取所述至少一个表格对象分别对应的对象特征,包括:提取所述待识别图像的图像特征;根据所述至少一个表格对象分别对应的对象位置信息,从所述图像特征中提取所述至少一个表格对象分别对应的区域图像特征;确定任一个表格对象的区域图像特征为所述表格对象的对象特征,以获得所述至少一个表格对象分别对应的对象特征。8.根据权利要求5所述的方法,其中,所述至少一个表格对象包括至少一个字符对象;还包括:识别所述待识别图像中的至少一个表格对象分别对应的对象文本信息;所述提取所述至少一个表格对象分别对应的对象特征,包括:对所述至少一个表格对象分别对应的对象文本信息进行词向量提取,获得所述至少一个表格对象分别对应的对象特征。9.根据权利要求5所述的方法,其中,所述确定所述至少一个目标对象分别对应的单元格区域,获得所述至少一个目标对象分别对应的单元格位置信息,包括:基于所述至少一个表格对象分别对应的多模态特征,确定所述至少一个目标对象分别对应的多模态特征;将所述至少一个目标对象分别对应的多模态特征输入单元格区域的位置解码器,获得所述至少一个目标对象分别对应的单元格位置信息。10.根据权利要求9所述的方法,其中,所述基于所述至少一个表格对象分别对应的多模态特征,确定所述至少一个目标对象分别对应的多模态特征,包括:从所述至少一个表格对象中确定与任一个目标对象匹配的匹配对象,以将所述匹配对象的多模态特征确定为所述目标对象的多模态特征,获得所述至少一个目标对象分别对应的多模态特征。11.根据权利要求1~10任一项所述的方法,其中,所述根据所述至少一个目标对象分别对应的单元格位置信息,生成所述待识别图像的电子表格,包括:根据所述至少一个目标对象分别对应的表格属性,将所述至少一个目标对象中具有相同单元格区域的目标对象划分至同一个对象组中,获得至少一个对象组;遍历所述至少一个对象组,将任一个对象组中至少一个目标对象各自的单元格位置信息进行加权计算,获得所述至少一个对象组分别对应的目标位置信息;根据所述至少一个对象组分别对应目标位置信息,生成所述待识别图像的电子表格。12.根据权利要求11所述的方法,其中,还包括:识别所述待识别图像中的至少一个表格对象分别对应的对象文本信息;根据任一个对象组中至少一个目标对象各自的对象文本信息,确定所述对象组的目标
文本信息,获得所述至少一个对象组分别对应的目标文本信息;所述根据所述至少一个对象组分别对应目标位置信息,生成所述待识别图像的电子表格,包括:根据所述至少一个对象组分别对应的目标位置信息以及目标文本信息,生成所述待识别图像的电子表格。13.根据权利要求12所述的方法,其中,所述至少一个表格对象包括至少一个文本框对象;所述根据任一个对象组中至少一个目标对象各自的对象文本信息,确定所述对象组的目标文本信息,获得所述至少一个对象组分别对应的目标文本信息,包括:识别所述至少一个文本框对象分别对应的对象位置信息;基于所述至少一个文本框对象分别对应的对象位置信息以及所述至少一个对象组分别对应的目标位置信息,为所述至少一个对象组分别匹配对应的目标文本框对象;确定与任一个对象组匹配的目标文本框对象的对象文本信息为所述对象组的目标文本信息,以获得所述至少一个对象组分别对应的目标文本信息。14.一种表格生成装置,包括:属性识别单元,用于识别待识别图像中的至少一个表格对象,获得所述至少一个表格对象分别对应的表格属性;其中,任一个表格对象的表格属性为单元格属性包括非单元格属性;对象确...
【专利技术属性】
技术研发人员:庾悦晨,李煜林,章成全,姚锟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。