一种基于生成对抗网络的图像表格数据提取方法及装置制造方法及图纸

技术编号:34281509 阅读:32 留言:0更新日期:2022-07-24 18:26
本发明专利技术公开了一种基于生成对抗网络的图像表格数据提取方法及装置。其中,该方法包括:获取原始图像数据;根据表格识别模型,识别所述原始图像数据中的表格标识;根据所述表格标识,提取所述原始图像数据中的表格信息;根据表格优化模型,对所述表格信息进行表格数据的提取。本发明专利技术解决了现有技术中的图像表格数据提取过程无法在表格非清晰或者表格区域面积不稳定的情况下进行提取,从而导致表格数据提取效率低下,提取精度较低的技术问题。提取精度较低的技术问题。提取精度较低的技术问题。

A method and device for extracting image table data based on generating countermeasure network

【技术实现步骤摘要】
一种基于生成对抗网络的图像表格数据提取方法及装置


[0001]本专利技术涉及表格图像数据提取领域,具体而言,涉及一种基于生成对抗网络的图像表格数据提取方法及装置。

技术介绍

[0002]随着智能化科技的不断发展,人们的生活、工作、学习之中越来越多地用到了智能化设备,使用智能化科技手段,提高了人们生活的质量,增加了人们学习和工作的效率。
[0003]目前,针对图像和表格数据进行提取的情况,通常对图像和表格进行可视化静态图像生成,并根据像素要求以及图像处理精度要求,对图像进行分割和优化处理,从而得到图像中的表格区域,并将表格区域中涉及的数据进行识别和输出,但是现有技术中的图像表格数据提取过程无法在表格非清晰或者表格区域面积不稳定的情况下进行提取,从而导致表格数据提取效率低下,提取精度较低的技术问题。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种基于生成对抗网络的图像表格数据提取方法及装置,以至少解决现有技术中的图像表格数据提取过程无法在表格非清晰或者表本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于生成对抗网络的图像表格数据提取方法,其特征在于,包括:获取原始图像数据;根据表格识别模型,识别所述原始图像数据中的表格标识;根据所述表格标识,提取所述原始图像数据中的表格信息;根据表格优化模型,对所述表格信息进行表格数据的提取。2.根据权利要求1所述的方法,其特征在于,在所述根据表格识别模型,识别所述原始图像数据中的表格标识之前,所述方法还包括:利用生成式对抗网络算法,根据与所述原始图像数据相关的历史数据,训练所述表格识别模型。3.根据权利要求1所述的方法,其特征在于,所述根据所述表格标识,提取所述原始图像数据中的表格信息包括:根据所述表格标识,获取表格角点坐标值;根据所述表格角点坐标值确定表格信息,其中,所述表格信息包括:表格区域、表格格式。4.根据权利要求1所述的方法,其特征在于,所述根据表格优化模型,对所述表格信息进行表格数据的提取包括:根据所述原始图像数据,选取所述表格优化模型;根据所述表格优化模型,对所述表格信息进行校正和坐标彭化处理;根据优化后的所述表格信息,输出所述表格数据。5.一种基于生成对抗网络的图像表格数据提取装置,其特征在于,包括:获取模块,用于获取原始图像数据;识别模块,用于根据表格识别模型,识别所述原始图像数据中的表格标识;信息提取模块,用于根据所述表格标识...

【专利技术属性】
技术研发人员:高强
申请(专利权)人:北京鼎泰智源科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1