表格信息的获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:41283590 阅读:22 留言:0更新日期:2024-05-11 09:33
本申请提出一种表格信息的获取方法、装置、电子设备及存储介质,其中,该方法包括:获取待处理文档;去除所述待处理文档中的电子印章;获取去除所述电子印章后的所述待处理文档中待处理页面对应的待处理图像;获取所述待处理图像中包含的表格的表格线交点坐标;基于所述表格线交点坐标对所述待处理图像进行光学字符识别OCR识别,获取所述表格的表格信息。通过本申请的技术方案,能够消除文档中的印章,从而更为准确的获取文档中表格信息。

【技术实现步骤摘要】

本申请涉及文档处理,尤其涉及一种表格信息的获取方法、装置、电子设备及存储介质


技术介绍

1、相关技术中,在对招投标文件中表格信息进行提取时,招投标文件中存在的大量印章会对表格信息提取的准确性造成影响。


技术实现思路

1、本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

2、第一方面,本申请提出一种表格信息的获取方法,包括:获取待处理文档;去除所述待处理文档中的电子印章;获取去除所述电子印章后的所述待处理文档中待处理页面对应的待处理图像;获取所述待处理图像中包含的表格的表格线交点坐标;基于所述表格线交点坐标对所述待处理图像进行光学字符识别ocr识别,获取所述表格的表格信息。

3、在一种实现方式中,所述获取所述待处理图像中包含的表格的表格线交点坐标,包括:对所述待处理图像进行图像校正,获得校正图像;获取所述校正图像中的横向表格线的第一坐标和竖向表格线的第二坐标;基于所述第一坐标和所述第二坐标,获取所述横向表格线和所述竖向表格线相交的初始表格线交点的第三坐标;基于所述第三坐标对所述本文档来自技高网...

【技术保护点】

1.一种表格信息的获取方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述获取所述待处理图像中包含的表格的表格线交点坐标,包括:

3.如权利要求2所述的方法,其特征在于,所述对所述待处理图像进行图像校正,获得校正图像,包括:

4.如权利要求1所述的方法,其特征在于,所述基于所述表格线交点坐标对所述待处理图像进行光学字符识别OCR识别,获取所述表格的表格信息,包括:

5.如权利要求1所述的方法,其特征在于,所述获取去除所述电子印章后的所述待处理文档中待处理页面对应的待处理图像,包括:

6.如权利要求5所述的方法,...

【技术特征摘要】

1.一种表格信息的获取方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述获取所述待处理图像中包含的表格的表格线交点坐标,包括:

3.如权利要求2所述的方法,其特征在于,所述对所述待处理图像进行图像校正,获得校正图像,包括:

4.如权利要求1所述的方法,其特征在于,所述基于所述表格线交点坐标对所述待处理图像进行光学字符识别ocr识别,获取所述表格的表格信息,包括:

5.如权利要求1所述的方法,其特征在于,所述获取去除所述电子印章后的所述待处理文档中待处理页面对应的待处理图像,包括:

6.如权利要求5所述的方法,其特征在于,所述对所述图像进行图像滤波,包...

【专利技术属性】
技术研发人员:邸智郑子辰袁建贾家琛
申请(专利权)人:中国华能集团清洁能源技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1