一种基于tesseract引擎的文字识别方法及装置制造方法及图纸

技术编号：13492055 阅读：352 留言：0更新日期：2016-08-07 03:58

本发明专利技术公开了一种基于tesseract引擎的文字识别方法及其对应的装置，利用云端服务器对本地文字库进行升级来修正tesseract引擎的识别结果，提高了tesseract引擎识别图像中文字的精度。本发明专利技术所述的文字识别装置包括服务器、tesseract引擎模块、云端服务器和本地文字库。升级本地文字库时，服务器采用云端服务器识别出的文字对tesseract引擎模块的识别结果进行修正，将tesseract引擎模块无法正确识别的文字补充进本地文字库。这样，进行文字识别时则可以通过查询本地文字库来提升识别精度。本发明专利技术利用升级后的本地文字库修正tesseract引擎模块的识别结果，可以达到与直接利用云端服务器进行文字识别相同的精度同时也可缩短文字识别运算的时间，适合将日常学习与工作中的图片识别成文字。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于tesseract引擎的文字识别方法及其对应的装置，利用云端服务器对本地文字库进行升级来修正tesseract引擎的识别结果，提高了tesseract引擎识别图像中文字的精度。本专利技术所述的文字识别装置包括服务器、tesseract引擎模块、云端服务器和本地文字库。升级本地文字库时，服务器采用云端服务器识别出的文字对tesseract引擎模块的识别结果进行修正，将tesseract引擎模块无法正确识别的文字补充进本地文字库。这样，进行文字识别时则可以通过查询本地文字库来提升识别精度。本专利技术利用升级后的本地文字库修正tesseract引擎模块的识别结果，可以达到与直接利用云端服务器进行文字识别相同的精度同时也可缩短文字识别运算的时间，适合将日常学习与工作中的图片识别成文字。【专利说明】一种基于tesseract引擎的文字识别方法及装置
本专利技术涉及一种图像识别方法，属于OCR文字识别(Optical CharacterRecognit1n，光学字符识别)

技术介绍
OCR文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。光学字符识别(OCR)是将印刷的文字图像转换成机器编码文本的过程。它被广泛地用于转换印刷纸上的数据记录形式，主要转换对象为护照证件，发...

【技术保护点】
一种OCR文字识别方法，其特征在于识别的具体步骤如下：步骤1，由服务器接收待识别图片；步骤2，将服务器连接云端服务器，服务器同时将待识别图片传输至tesseract引擎模块和云端服务器，tesseract引擎模块和云端服务器同时对待识别图片进行文字识别，并分别将识别结果反馈给服务器，服务器比较两个识别结果，若两个识别结果相同则进入步骤3；若两个识别结果不同，则将识别结果不一样的待识别图片和其对应的来自云端服务器的识别结果存入本地文字库；步骤3，重复步骤1至2直至完成对本地文字库的升级；步骤4，服务器与云端服务器的连接断开，通过tesseract引擎模块进行图片文字识别；tesseract引擎模块首先查询本地文字库，寻找是否存在与待识别图片相匹配的识别结果，若存在，则以文字的形式输出本地文字库中存储的识别结果；若不存在，则通过卷积神经网络进行文字识别，以文字的形式输出识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：孙磊，秦阳，莫凌飞，杜喆宁，姚昕宇，齐恒，冯增涛，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人