【技术实现步骤摘要】
一种高识别率的光学字符识别方法
[0001]本专利技术涉及一种对图形文件进行分析,获取其中文字信息并以文本形式反馈的方法。
技术介绍
[0002]光学字符识别(Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。
[0003]传统的文档OCR文字识别技术,他是有对图片上的内容进行认识分析的过程,其中比较重要的就是有个四要素,横排文本、竖排文本、表格、配图;每一个作者所写的材料,文章等文件中都是由这四个基本要素组成。所以在传统的文档OCR识别技术中,算法会先分析图片中有几个布局区域,然后分析出水平横向文字,竖向垂直文字,表格和配图照片等区域,然后在针对各自的特点进行切分字符,保留区域类型,进行OCR识别调整;所以可以适应各种类型的文本识别。
[0004]但是对于背景比较复杂的图片,各个领域形式丰富多样的图片,传统的OCR技术就无能为力了。后续也出现了tesseract
‑< ...
【技术保护点】
【技术特征摘要】
1.一种高识别率的光学字符识别方法,其特征在于包括:对待识别的图片进行裁剪,保留核心区域;对裁剪后的图片进行预处理;对预处理后的图片进行文字检测;基于文字检测结果进行文字识别;输出文本文字。2.根据权利要求1所述的一种高识别率的光学字符识别方法,其特征在于所述对待识别的图片进行裁剪包括:显示待识别的图片;生成取景模板,对图片中的标志性图形进行框选;调整裁剪框,框选核心区域;裁剪。3.根据权利要求2所述的一种高识别率的光学字符识别方法,其特征在于调整裁剪框的同时对裁剪后的图片进行预览。4.根据权利要求1所述的一种高识别率的光学字符识别方法,其特征在于所述对裁剪后的图片进行预处理包括:灰度化、二值化、降噪、核心区域定位、图像角度旋转。5.根据权利要求4所述的一种高识别率的光学字符识别方法,其特征在于所述图像角度旋转包括:通过人脸识别算法判断图片中的头像位置是否准确,若...
【专利技术属性】
技术研发人员:董建伟,方佩,钱小峰,鲍贞,王涛,陈贵根,
申请(专利权)人:中通服创立信息科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。