一种处理表格图片中框选文字的方法及装置制造方法及图纸

技术编号：20546561 阅读：44 留言：0更新日期：2019-03-09 19:28

本发明专利技术提供一种处理表格图片中框选文字的方法，包括：去除表格图片中的干扰识别项；利用联合训练模型，在表格图片中圈选出字条，获取字条在表格图片中的字条位置坐标、并识别出与字条相对应的文字内容；利用表格特性对字条、字条位置坐标与文字内容进行表格还原。实施上述方法的装置，包括：用于去除表格图片中干扰识别项的预处理模块；利用联合训练模型，在表格图片中圈选出字条，获取字条在表格图片中的字条位置坐标、并识别出与字条相对应的文字内容的识别模块；利用表格特性对字条、字条位置坐标与文字内容进行表格还原的表格还原模块。本发明专利技术可以提升表格图片中文字识别和还原准确率。

A Method and Device for Processing Box Selection Text in Form Pictures

The invention provides a method for processing frame-selected characters in table pictures, which includes: removing interference recognition items in table pictures; using joint training model, circle-selected words in table pictures, obtaining position coordinates of words in table pictures, and identifying text content corresponding to words; and using table characteristics, entering words, position coordinates of words and text content. Row table restore. The device for implementing the above-mentioned method includes: a preprocessing module for removing interference recognition items in table pictures; a recognition module for obtaining the position coordinates of the bars in table pictures and identifying the corresponding text content of the bars by using the joint training model; and a recognition module for entering the bars, position coordinates of the bars and text content by using table characteristics. Table Restore Module for row table restore. The invention can improve the accuracy of character recognition and restoration in table pictures.

全部详细技术资料下载

【技术实现步骤摘要】
一种处理表格图片中框选文字的方法及装置
本专利技术涉及一种表格处理方法，尤其是一种处理表格图片中框选文字的方法及装置。
技术介绍
在OCR识别领域中，对于类似A4纸的大段文字识别的准确率较高。但针对于表格的识别，目前业界准确率都不是很高。因为原有的切字识别的方式会造成难以进行版面还原，且无法利用表格中的信息。
技术实现思路
针对上述问题中存在的不足之处，本专利技术提供一种可以提升表格图片中文字识别和还原准确率的一种处理表格图片中框选文字的方法及装置。为实现上述目的，本专利技术提供一种处理表格图片中框选文字的方法，包括以下步骤：步骤1、以去除表格图片中的干扰识别项；步骤2、利用联合训练模型，在表格图片中圈选出字条，获取字条在表格图片中的字条位置坐标、并识别出与字条相对应的文字内容；步骤3、利用表格特性对字条、字条位置坐标与文字内容进行表格还原。上述的一种处理表格图片中框选文字的方法，其中，在步骤1中，对表格图片进行预处理，以去除表格图片中的干扰识别项，对表格图片进行的预处理包括图片角度纠偏操作、或水印印章去除操作。上述的一种处理表格图片中框选文字的方法，其中，在步骤2中，包括以下子步骤：步骤21、对去除干扰识别项的表格图片进行RGB三通道处理，以形成至少两个表格图片层；步骤22、通过卷积变换对每个表格图片层进行特征提取；步骤23、在第一表格图片层中，预测出字条在第一表格图片层中的字条位置坐标；步骤24、在第二表格图片层中，通过图像信息和应用语言模型得到与字条相对应的文字内容。上述的一种处理表格图片中框选文字的方法，其中，在步骤23中，字条位置坐标包括左上坐标(x...

【技术保护点】
1.一种处理表格图片中框选文字的方法，包括以下步骤：步骤1、以去除表格图片中的干扰识别项；步骤2、利用联合训练模型，在表格图片中圈选出字条，获取字条在表格图片中的字条位置坐标、并识别出与字条相对应的文字内容；步骤3、利用表格特性对字条、字条位置坐标与文字内容进行表格还原。

【技术特征摘要】
1.一种处理表格图片中框选文字的方法，包括以下步骤：步骤1、以去除表格图片中的干扰识别项；步骤2、利用联合训练模型，在表格图片中圈选出字条，获取字条在表格图片中的字条位置坐标、并识别出与字条相对应的文字内容；步骤3、利用表格特性对字条、字条位置坐标与文字内容进行表格还原。2.根据权利要求1所述的一种处理表格图片中框选文字的方法，其特征在于，在步骤1中，对表格图片进行预处理，以去除表格图片中的干扰识别项，对表格图片进行的预处理包括图片角度纠偏操作、或水印印章去除操作。3.根据权利要求1所述的一种处理表格图片中框选文字的方法，其特征在于，在步骤2中，包括以下子步骤：步骤21、对去除干扰识别项的表格图片进行RGB三通道处理，以形成至少两个表格图片层；步骤22、通过卷积变换对每个表格图片层进行特征提取；步骤23、在第一表格图片层中，预测出字条在第一表格图片层中的字条位置坐标；步骤24、在第二表格图片层中，通过图像信息和应用语言模型得到与字条相对应的文字内容。4.根据权利要求3所述的一种处理表格图片中框选文字的方法，其特征在于，在步骤23中，字条位置坐标包括左上坐标(x0，y0)、右上坐标(x1，y1)、右下坐标(x2，y2)、左下坐标(x3，y3)。5.根据权利要求1所述的一种处理表格图片中框选文字的方法，其特征在于，在步骤3中，根据字条位置坐标进行表格...

【专利技术属性】
技术研发人员：李鹏辉，竺晨曦，邱锡鹏，
申请(专利权)人：上海犀语科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人