一种数据提取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:43387255 阅读:24 留言:0更新日期:2024-11-19 18:01
本公开提供了一种数据提取方法、装置、电子设备及存储介质,所述方法包括:对原始表格图片中的数据进行识别,形成结构化数据,所述结构化数据包括行索引和列索引;基于所述结构化数据,确定原始表格的类型,所述类型包括嵌套表头表格和非嵌套表头表格;对嵌套表头表格对应的结构化数据进行数据填充,使得到的填充后的结构化数据中的每一列数据都具有对应的表头作为列索引;针对嵌套表头表格对应的填充后的结构化数据或非嵌套表头表格对应的结构化数据的行索引和列索引进行数据提取,获得目标数据。应用本公开的方法可以对包含嵌套表头或不包含嵌套表头表格的图片进行数据提取,通用性强,且提高了数据提取的效率和准确率。

【技术实现步骤摘要】

本公开涉及数据处理,尤其涉及一种数据提取方法、装置、电子设备及存储介质


技术介绍

1、在企业的生产活动中,需要从原材料供应商提供的大量出厂物料清单中提取出物料的参数信息,用于录入企业的生产系统。现有的物料参数信息的提取方法主要是基于人工阅读大量的出厂物料清单,然后手动进行提取和录入。该种方式耗费时间较长且容易出错。


技术实现思路

1、本公开提供一种数据提取方法、装置、电子设备及存储介质,以至少解决现有技术中存在的以上技术问题。

2、根据本公开的第一方面,提供了一种数据提取方法,所述方法包括:对原始表格图片中的数据进行识别,形成结构化数据,所述结构化数据包括行索引和列索引;基于所述结构化数据,确定原始表格的类型,所述类型包括嵌套表头表格和非嵌套表头表格;对嵌套表头表格对应的结构化数据进行数据填充,使得到的填充后的结构化数据中的每一列数据都具有对应的表头作为列索引;针对嵌套表头表格对应的填充后的结构化数据或非嵌套表头表格对应的结构化数据的行索引和列索引进行数据提取,获得目标数据。

3、在本文档来自技高网...

【技术保护点】

1.一种数据提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对原始表格图片中的数据进行识别,形成结构化数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述结构化数据,确定原始表格的类型,包括:

4.根据权利要求3所述的方法,其特征在于,所述对嵌套表头表格对应的结构化数据进行数据填充,使得到的填充后的结构化数据中的每一列数据都具有对应的表头作为列索引,包括:

5.根据权利要求1所述的方法,其特征在于,针对嵌套表头表格对应的填充后的结构化数据的行索引和列索引进行数据提取,获得目标数据,包括:<...

【技术特征摘要】

1.一种数据提取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对原始表格图片中的数据进行识别,形成结构化数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述结构化数据,确定原始表格的类型,包括:

4.根据权利要求3所述的方法,其特征在于,所述对嵌套表头表格对应的结构化数据进行数据填充,使得到的填充后的结构化数据中的每一列数据都具有对应的表头作为列索引,包括:

5.根据权利要求1所述的方法,其特征在于,针对嵌套表头表格对应的填充后的结构化数据的行索引和列索引进...

【专利技术属性】
技术研发人员:沈晓东钟权刘浩王骏荣张学钢
申请(专利权)人:合肥联宝信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1