一种基于模板匹配的OCR识别方法及其系统技术方案

技术编号:26304889 阅读:33 留言:0更新日期:2020-11-10 20:01
本发明专利技术涉及一种基于模板匹配的OCR识别方法及其系统,通过对图像进行预处理,投影切割字符,将字符划分为多个网格,并计算网格特征值,将特征值与模板特征值比对计算相似度,以相似度最高的模板作为识别结果。本发明专利技术有益效果:适用于大部分场景,算法开发难度低,效率高,识别精度高。

【技术实现步骤摘要】
一种基于模板匹配的OCR识别方法及其系统
本专利技术涉及一种基于模板匹配的OCR识别方法及其系统,属于OCR识别领域。
技术介绍
传统意义上的OCR(opticalcharacterrecognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。随着近年来图像处理技术的进步,对于OCR文字识别的需求越来越多,场景应用也不再局限于纸面文字,包括车牌识别,护照识别,交通标志识别等等。随着深度学习的进步,目前越来越多的OCR技术采用基于神经网络的识别方法或者传统的机器学习knn分类算法进行识别,这些技术在准确率上虽然满足要求,但算法开发周期长,耗时长且要求的所需要的运行设备硬件要求高,在一些简单的应用场景上性价比不高,如车牌识别领域。
技术实现思路
为了解决上述技术问题,本专利技术提供一种基于模板匹配的OCR识别方法及其系统,通过对图像的预处理,对切割后的单字符文字进行快速模本文档来自技高网...

【技术保护点】
1.一种基于模板匹配的OCR识别方法,其特征在于,包括如下步骤:/nS1:获取目标图像;/nS2:对所述目标图像进行预处理;/nS3:对经过预处理的目标图像进行字符切割,以获得单独的字符图像,利用投影算法对所述字符进行切割处理;/nS4:将所述单独的字符图像进行垂直投影分割获得N个一级网格,对所述一级网格进行水平投影分割获得N

【技术特征摘要】
1.一种基于模板匹配的OCR识别方法,其特征在于,包括如下步骤:
S1:获取目标图像;
S2:对所述目标图像进行预处理;
S3:对经过预处理的目标图像进行字符切割,以获得单独的字符图像,利用投影算法对所述字符进行切割处理;
S4:将所述单独的字符图像进行垂直投影分割获得N个一级网格,对所述一级网格进行水平投影分割获得N2个二级网格,对所述二级网格进行垂直投影分割获得2N2个三级网格,对所述三级网格进行水平投影分割获得4N2个四级网格,其中,N的取值大于2;
S5:计算所有的所述四级网格的特征值,所述特征值包括:笔画方向的对比特征值,横竖笔画判断的位特征值,撇捺笔画判断的位特征值,大小判断的位特征值,形状判断的位特征值;
S6:将所述特征值与字符模板的对应特征值按照从左到右的顺序,依次比对对应位置的数值,如果数值一致,则相似度加1,计算所有特征值的相似度总和,取相似度总和最大的字符模板所代表的字符作为字符识别结果。


2.根据权利要求1所述的一种基于模板匹配的OCR识别方法,其特征在于,所述S2步骤具体为:
S21:对所述目标图像进行目标定位,通过彩色图像定位方法,找到符合的颜色特征区域并进行裁剪;
S22:对经过定位裁剪的目标图像进行转正处理;
S23:对经过转正处理的目标图像通过OTSU算法进行二值化处理以获得二值化图像;
S24:对所述二值化图像通过连通域去噪方法进行去噪处理,获得经过预处理的目标图像。


3.根据权利要求2所述的一种基于模板匹配的OCR识别方法,其特征在于:所述S3步骤中,对所述经过预处理的目标图像的进行垂直方向投影,即对每一列的字符像素点数进行统计,获得表征目标图像的直方图,所述直方图中的波谷位置为字符间隔,根据字符间隔分割出单独字符图像。


4.根据权利要求3所述的一种基于模板匹配的OCR识别方法,其特征在于,所述S4步骤具体为:
S41:对所述单独字符图像进行垂直投影,统计每列的字符像素点数,并计算字符像素点数总和,从第一列起依次累加每列的字符像素点数,当累计点数达到点数总和的1/N时,此时的列记录为第一垂直分割线,继续累加,当累计点数达到点数总和的2/N时,此时的列记录为第二垂直分割线,以此类推,直至得到第N-1垂直分割线,所述第一至第N-1垂直分割线将所述单独字符图像分割为N个一级网格;
S42:对S41步骤获得的每个一级网格的图像进行水平投影,统计每行的字符像素点数,并计算字符像素点数总和,从第一行起依次累加每行的字符像素点数,当累计点数达到点数总和的1/N时,此时的行记录为第一水平分割线,继续累加,当累计点数达到点数总和的2/N时,此时的行记录为第二水平分割线,以此类推,直至得到第N-1水平分割线,所述第一至第N-1水平分割线将所述每个一级网格的图像分割为N个二级网格,所述单独字符图像被划分为N2个二级网格;
S43:对S42步骤获得的每个二级网格的图像进行垂直投影,统计每列的字符像素点数,并计算字符像素点数总和,从第一列起依次累加每列的字符像素点数,当累计点数达到点数总和的1/2时,此时的列记录为第N垂直分割线,所述第N垂直分割线将所述二级网格图像分割成2个三级网格,所述单独字符图像被划分为2N2个三级网格;
S44:对S43步骤获得的每个三级网格的图像进行水平投影,统计每行的字符像素点数,并计算字符像素点数总和,从第一行起依次累加每行的字符像素点数,当累计点数达到点数总和的1/2时,此时的行记录为第N水平分割线,所述第N水平分割线将所述三级网格图像分割成2个四级网格,最终将所述单独字符图像划分为4N2个四级网格。


5.根据权利要求4所述的一种基于模板匹配的OCR识别方法,其特征在于:所述S5步骤具体为:
S51:计算所述笔画方向的对比特征值,每个字符像素点根据周边8个像素点组成包含9个像素点的九宫格阵列,将所述九宫格阵列和横竖撇捺4个模板阵列比对,判断当前字符像素点的类别,计算判断为横竖撇捺4个类别的字符像素点个数,其中,最小点数和最大点数的比值记为笔画方向的对比特征值;
S52:计算所述横竖笔画判断的位特征值,根据S51计算的像素点类别值,当判断为横的字符像素点个数大于判断为竖的字符像素点个数,则所述四级网格横竖笔画判断的位特征值记为0,反之,则所述四级网格横竖笔画判断的位特征值记为1;
S53:计算所述撇捺笔画判断的位特征值,根据S51计算的像素点类别值,当判断为撇的字符像素点个数大于判断为捺的字符像素点个数,则所述四级网格撇捺笔画判断的位特征值记为0,反之,则所述四级网格横竖笔画判断的位特征值记为1;
S54:计算所述形状判断的位特征值,当所述四级网格的宽大于高时,则所述四级网格的形状判断的位特征值记为0,反之,则所述四级网格的形状判断的位特征值记为1;
S55:计算所述大小判断的位特征值,计算所有所述四级网格的面积大小,并求面积平均值,当所述四级网格的面积小于平均值时,则所述四级网格的大小判断的位特征值记为0,反之,则所述四级网格的大小判断的位特征值记为1。


6.一种基于模板匹配的O...

【专利技术属性】
技术研发人员:庄国金陈文传陈昊温亦汝杨龙吕晓君郑宇
申请(专利权)人:厦门商集网络科技有限责任公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1