一种基于扫描件的纸质试验报告生成方法技术

技术编号:30540905 阅读:31 留言:0更新日期:2021-10-30 13:18
本发明专利技术提供了一种基于扫描件的纸质试验报告生成方法,涉及图像处理的技术领域,具体包括如下步骤:获取图片以提取表格;对表格中的位置进行排序;对排序好的表格进行文字识别以及校验以生成试验报告。通过本发明专利技术提供的方法可以缓解现有OCR技术中图片,识别准确率极低,并且识别内容不能够表示文本单元格所属行列,难以做到结构化文本的问题,同时降低工作强度、提高工作效率、推动自动化办公。推动自动化办公。推动自动化办公。

【技术实现步骤摘要】
一种基于扫描件的纸质试验报告生成方法


[0001]本专利技术涉及图像处理的
,尤其是涉及一种基于扫描件的纸质试验报告生成方法。

技术介绍

[0002]在各行各业中,试验检测的重要性不言而喻,试验报告是试验的过程记录以及结果输出,是对设备、工程等信息检测和评价的重要依据。当前,相关的试验报告数据的处理方式主要为:对照纸质记录或word文档类试验报告逐条筛选、人工录入至管理系统内。这种基于人工机械地数据处理方式不仅效率低、易出错,而且无法形成数字化对比。其中,纸质报告录入系统的难度尤其大。
[0003]OCR技术可以快速的将纸质资料转换为电子资料。但一般的OCR技术主要是对图片中的文本内容进行识别,并且对图片大小、文本位置等要求严格,特别是对于试验报告类的扫描图片,识别准确率极低,并且识别内容不能够表示文本单元格所属行列,难以做到结构化文本,不方便其他如录入数据库等数据操作。因此,提供一种能够有效识别、识全纸质试验报告类数据并结构化的方法对于降低工作强度、提高工作效率、推动自动化办公具有重要意义。
专利技术内容
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于扫描件的纸质试验报告生成方法,其特征在于,具体包括如下步骤:获取图片以提取表格;对表格中的位置进行排序;对排序好的表格进行文字识别以及校验以生成试验报告。2.根据权利要求1所述的方法,其特征在于,所述获取图片以提取表格的步骤包括:对图片进行仿射变化;对进行仿射变化后的图片进行边缘检测以获取试验报告表头与表格主体;获取表格主体的位置信息,所述表格主体的位置信息包括左上点横坐标、左上点纵坐标、单元格的宽以及单元格的高;设置第一阈值,并判定所述单元格的宽以及所述单元格的高的乘积...

【专利技术属性】
技术研发人员:冯冰程法庆张锡喆杜岳凡殷震马泊宁王婧金岩周亚楠方琼顾庆东刘常军王云龙邹培根曲童
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1