【技术实现步骤摘要】
本申请属于表格重建,具体涉及一种表格生成方法及其装置。
技术介绍
1、图片表格通常以图片或扫描件形式保存,缺乏结构化数据,无法直接用于后续的处理和分析。
2、相关技术中,存在通过光学字符识别(ocr,optical character recognition)技术识别图片或扫描件中的表格,但是在识别复杂表格时的准确性尚不能满足实际需求。图片表格通常包含多行文本、合并单元格以及不同排版方式的内容,这使得ocr技术在识别图片表格时存在识别准确率较低的问题。
技术实现思路
1、本申请实施例的目的是提供一种表格生成方法及其装置,解决了相关技术中在识别图片表格时存在识别准确率较低的问题。
2、第一方面,本申请实施例提供了一种表格生成方法,包括:获取包括表格的第一图像,第一图像中包括表头区域和内容区域;基于文字内容信息生成至少一个内容单元格,其中,文字内容信息为对内容区域进行图像识别确定的内容信息,同一个内容单元格中的语义信息相互关联;基于内容单元格的单元格位置信息将至少一个内
...【技术保护点】
1.一种表格生成方法,其特征在于,所述表格生成方法包括:
2.根据权利要求1所述的表格生成方法,其特征在于,所述获取包括表格的第一图像之后,所述表格生成方法还包括:
3.根据权利要求1所述的表格生成方法,其特征在于,所述获取包括表格的第一图像之后,所述表格生成方法还包括:
4.根据权利要求2或3所述的表格生成方法,其特征在于,所述表头内容信息包括多个表头内容子信息,所述基于所述表头内容信息和所述表头位置信息生成所述表头单元格,包括:
5.根据权利要求4所述的表格生成方法,其特征在于,所述基于所述内容单元格的单元格位置信息
...【技术特征摘要】
1.一种表格生成方法,其特征在于,所述表格生成方法包括:
2.根据权利要求1所述的表格生成方法,其特征在于,所述获取包括表格的第一图像之后,所述表格生成方法还包括:
3.根据权利要求1所述的表格生成方法,其特征在于,所述获取包括表格的第一图像之后,所述表格生成方法还包括:
4.根据权利要求2或3所述的表格生成方法,其特征在于,所述表头内容信息包括多个表头内容子信息,所述基于所述表头内容信息和所述表头位置信息生成所述表头单元格,包括:
5.根据权利要求4所述的表格...
【专利技术属性】
技术研发人员:陈诚,
申请(专利权)人:维沃移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。