一种基于视觉高效OCR识别算法制造技术

技术编号:19009512 阅读:65 留言:0更新日期:2018-09-22 09:20
本发明专利技术涉及图像处理技术领域,具体的讲涉及一种基于视觉高效OCR识别算法,包括步骤一:字符训练;所述字符训练包括:(a)图像预处理;(b)文字定位;(c)骨架提取;(d)特征提取;得到一个模型数据,将模型数据保存到模型文件中;步骤二:字符识别;所述字符识别读取所述(d)步中训练保存的模型文件,经过步骤一中的(a)、(b)、(c)、(d)步提取文字RILBP特征后,归一化处理,得RILBP数据使用SVM进行分类识别;从识别结果中选择相似度最高且达到一定相似度的结果为最终识别结果;本算法运行速度快,识别率高,不依赖任何第三方库,可移植性强,能在普通Arm嵌入式平台运行。从而在机器人等领域产品大大降低平台成本。

An efficient OCR recognition algorithm based on vision

The invention relates to the technical field of image processing, in particular to a vision-based high-efficiency OCR recognition algorithm, including steps 1: character training; the character training includes: (a) image pre-processing; (b) text localization; (c) skeleton extraction; (d) feature extraction; obtaining a model data and saving the model data to the model file Step 2: Character recognition. The character recognition reads the model file stored in the training step (d), extracts the RILBP features in step 1, normalizes them, and selects the highest similarity and achieves a certain similarity from the recognition results. The result is the final recognition result; the algorithm runs fast, has high recognition rate, does not rely on any third-party library, has strong portability, and can run on ordinary Arm embedded platform. Thus, the cost of platform is greatly reduced in the field of robotics and other fields.

【技术实现步骤摘要】
一种基于视觉高效OCR识别算法
本专利技术涉及图像处理
,具体的讲涉及一种基于视觉高效OCR识别算法。
技术介绍
目前,用于机器视觉人工智能的算法,主要基于OpenCV、Python等支持平台,而对于一些普通智能需求来说,基于高端处理器成本高、功耗高、体积大,难以产品化。然而,现有的一些识别算法,识别率低,效率低下,依赖OpenCV等开源库,需要运行在成本较高的高端处理器上。
技术实现思路
因此本专利技术提出一种基于视觉高效OCR识别算法,用来解决上述
技术介绍
中的问题。本专利技术的技术方案是这样实现的:一种基于视觉高效OCR识别算法,包括以下两个步骤:步骤一:字符训练;所述字符训练包括:(a)图像预处理;提取图像灰度图,然后计算灰度图阈值,根据阈值将灰度图进行二值化;(b)文字定位;通过临近连通区域搜索方法定位文字区域,定位到文字位置,截取文字区域,并进行缩放;(c)骨架提取;不同场景下,文字笔画粗细不一,将文字线条细化,提取特征统一都使用细化后的图像数据,得到预处理后的数据;(d)特征提取;提取数据的RILBP特征,归一化处理,数据经过数据标准化处理后,各指标处于同一数量级,适合本文档来自技高网...
一种基于视觉高效OCR识别算法

【技术保护点】
1.一种基于视觉高效OCR识别算法,其特征在于,包括以下两个步骤:步骤一:字符训练;所述字符训练包括:(a)图像预处理;提取图像灰度图,然后计算灰度图阈值,根据阈值将灰度图进行二值化;(b)文字定位;通过临近连通区域搜索方法定位文字区域,定位到文字位置,截取文字区域,并进行缩放;(c)骨架提取;不同场景下,文字笔画粗细不一,将文字线条细化,提取特征统一都使用细化后的图像数据,得到预处理后的数据;(d)特征提取;提取数据的RILBP特征,归一化处理,数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价;将所有字符RILBP特征组成多个特征向量样本集,使用支持向量机SVM进行分类训...

【技术特征摘要】
1.一种基于视觉高效OCR识别算法,其特征在于,包括以下两个步骤:步骤一:字符训练;所述字符训练包括:(a)图像预处理;提取图像灰度图,然后计算灰度图阈值,根据阈值将灰度图进行二值化;(b)文字定位;通过临近连通区域搜索方法定位文字区域,定位到文字位置,截取文字区域,并进行缩放;(c)骨架提取;不同场景下,文字笔画粗细不一,将文字线条细化,提取特征统一都使用细化后的图像数据,得到预处理后的数据;(d)特征提取;提取数据的RILBP特征,归一化处理,数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价;将所有字符RILBP特征组成多个特征向量样本集,使用支持向量机SVM进行分类训练;分类训练完成后得到一个模型数据,将模型数据保存到模型文件中;步骤二:字符识别;所述字符识别读取所述(d)步中训练保存的模型文件,从摄像头获取图像数据;经过所述步骤一中的(a)、(b)、(c)、(d)步提取文字RILBP特征后,进行归一化处理,将归一化得RILBP数据使用SVM进行分类识别;从识别结果中选择相似度最高且达到一定相似度的结果为最终识别结果。2.根据权利要求1所述的一种基于视觉高效OCR识别算法,其特征在于:所述步骤一中的(d)特征提取步骤采用旋转不变RILBP特征,取n*n像素的邻域,以邻域中心像素为阈值,周围相邻m个像素的灰度值与阈值进行比较。3.根据权利要求2所述的一种基于视觉高效OCR识别算法,其特...

【专利技术属性】
技术研发人员:欧阳德寿
申请(专利权)人:北京宙心科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1