一种基于文字位置信息的OCR优化方法及系统技术方案

技术编号：27240295 阅读：27 留言：0更新日期：2021-02-04 12:11

本发明专利技术公开了一种基于文字位置信息的OCR优化方法及系统，包括：设定需要提取的约束信息项及提取范围；对待识别图像进行预处理，获取所述图像中的文字及位置信息；计算所有文字信息的平均行间距，确定当前文字与下一行文字之间的间距，基于所述间距与平均行间距的大小，判断当前文字与下一行文字是否需要合并；对上述提取到的信息项文字数据进行格式化输出。本发明专利技术方法在保证识别结果准确率的前提下，只需要对图片扫描一次就可以实现对各类文字的高精度提取，可显著降低OCR识别技术实现的算力硬件成本和时间成本。的算力硬件成本和时间成本。的算力硬件成本和时间成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文字位置信息的OCR优化方法及系统

[0001]本专利技术涉及图像文字识别
，尤其涉及一种基于文字位置信息的OCR优化方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。
[0003]OCR(Optical Character Recognition，光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；
[0004]随着各行业信息化程度的提高以及计算机图像处理技术以及机器学习等人工智能技术的发展，OCR文字识别技术也迎来的飞跃式进步，识别效率和场景也越来越高效和丰富，由最开始的电子书籍等无格式的简单场景OCR识别发展到现在各行业中普遍存在的营业执照、身份证、驾驶证、出生证等有格式的复杂场景OCR识别。但是目前复杂场景下的所有OCR解决方案都对待识别的照片的拍摄清晰度、拍摄角度及范围等提出了较高的要求，有的解决方案通过设置人性化的拍摄范围辅助框，帮助用户拍摄到高标准的图片，以提高识别准确度。
[0005]目前复杂场景OCR识别解决方案大都是通过证件模板训练得到需要识别的证件照的分类及各信息项的区域信息，然后根据区域信息对图片进行再切割，对切割后的小区域图片再进行灰度化、二值化、噪声去除、倾斜纠正等一系列图像预处理后再进行文字识别，切割后的图片信息量小，识别成功率高，但是上述方案在技术上存在以下不足之处：
[0006](...

【技术保护点】

【技术特征摘要】
1.一种基于文字位置信息的OCR优化方法，其特征在于，包括：设定需要提取的约束信息项及提取范围；对待识别图像进行预处理，获取所述图像中的文字及位置信息；计算所有文字信息的平均行间距，确定当前文字与下一行文字之间的间距，基于所述间距与平均行间距的大小，判断当前文字与下一行文字是否需要合并；对上述提取到的信息项文字数据进行格式化输出。2.如权利要求1所述的一种基于文字位置信息的OCR优化方法，其特征在于，对待识别图像进行预处理，包括：对图像进行灰度化、二值化、噪声去除以及倾斜矫正的预处理操作。3.如权利要求1所述的一种基于文字位置信息的OCR优化方法，其特征在于，设定需要提取的约束信息项及提取范围，具体包括：需要提取的图像中的文字信息。4.如权利要求1所述的一种基于文字位置信息的OCR优化方法，其特征在于，通过临近连通区域搜索方法，逐行搜索出现在图片中的文字并记录坐标位置，截取文字所处区域，识别文字，得到图片所有文字及其坐标位置信息。5.如权利要求1所述的一种基于文字位置信息的OCR优化方法，其特征在于，计算所有文字信息的平均行间距，具体包括：遍历提取的图像中每一行文字的坐标，基于所述坐标值计算当前行与下一行的行间距；将所有行间距累加求和；基于累加值与行数的比值确定平均行间距。6.如权利要求1所述的一种基于文字位置信息的OCR优化方法，其...

【专利技术属性】
技术研发人员：张丽丽，刘宏亮，刘伟珊，王菲，
申请(专利权)人：山东国赢大数据产业有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人