【技术实现步骤摘要】
一种基于扫描件的纸质试验报告生成方法
[0001]本专利技术涉及图像处理的
,尤其是涉及一种基于扫描件的纸质试验报告生成方法。
技术介绍
[0002]在各行各业中,试验检测的重要性不言而喻,试验报告是试验的过程记录以及结果输出,是对设备、工程等信息检测和评价的重要依据。当前,相关的试验报告数据的处理方式主要为:对照纸质记录或word文档类试验报告逐条筛选、人工录入至管理系统内。这种基于人工机械地数据处理方式不仅效率低、易出错,而且无法形成数字化对比。其中,纸质报告录入系统的难度尤其大。
[0003]OCR技术可以快速的将纸质资料转换为电子资料。但一般的OCR技术主要是对图片中的文本内容进行识别,并且对图片大小、文本位置等要求严格,特别是对于试验报告类的扫描图片,识别准确率极低,并且识别内容不能够表示文本单元格所属行列,难以做到结构化文本,不方便其他如录入数据库等数据操作。因此,提供一种能够有效识别、识全纸质试验报告类数据并结构化的方法对于降低工作强度、提高工作效率、推动自动化办公具有重要意义。
专利技术 ...
【技术保护点】
【技术特征摘要】
1.一种基于扫描件的纸质试验报告生成方法,其特征在于,具体包括如下步骤:获取图片以提取表格;对表格中的位置进行排序;对排序好的表格进行文字识别以及校验以生成试验报告。2.根据权利要求1所述的方法,其特征在于,所述获取图片以提取表格的步骤包括:对图片进行仿射变化;对进行仿射变化后的图片进行边缘检测以获取试验报告表头与表格主体;获取表格主体的位置信息,所述表格主体的位置信息包括左上点横坐标、左上点纵坐标、单元格的宽以及单元格的高;设置第一阈值,并判定所述单元格的宽以及所述单元格的高的乘积...
【专利技术属性】
技术研发人员:冯冰,程法庆,张锡喆,杜岳凡,殷震,马泊宁,王婧,金岩,周亚楠,方琼,顾庆东,刘常军,王云龙,邹培根,曲童,
申请(专利权)人:国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。