【技术实现步骤摘要】
一种字符串图像识别方法
本专利技术涉及图像识别领域,具体是一种字符串图像识别方法。
技术介绍
在图像识别领域,针对字符的识别,以及从图像中提取其它数据的方法,多采用“光学字符识别(OpticalCharacterRecognition)”技术,简称OCR技术。OCR技术主要通过“单元模式匹配”法和“特征提取法”两种方式进行字符识别。单元模式匹配法(PatternMatching)是将每一个字符与已保存的标准字体、字号的位图文件进行“不严格”的比较,找出最为相似的字符,认定为目标字符。特征提取法(FeatureExtraction)是先将每个字符分解为很多个不同的字符特征,例如水平线、斜线、曲线等,然后将这些特征与已保存的字符特征相比较,选出特征最为接近的字符,认定为目标字符。对于OCR技术的两种方式之一,单元模式匹配法在速度上较快,但这种方式是采用“最为近似”作为选定标准,对于被识别的内容中出现不同字体的情况,会导致“正确的字符反而不是最近似”的情况,进而出现识别错误。OCR技术的另一种方式,特征提取法需要先将被识别字符作“特征识别”,以将字符拆分成不同的特征,因此在拆分难度上较大,以及识别时间上较长。同时,这种方式还存在两个缺点,一是被识别字符拆分出的特征可能会出现顺序不一致的情况,二是在汉字中存在着“多个汉字的特征极为相似甚至基本相同”的情况,这都给特征识别的方式带来了一些不确定因素。另外,OCR技术只利用了字符的形态特征,而未利用图像的色彩特征,因此失去了一些识别速率。申请号CN201210189898.2名称为“基于连通区域和间隙模型的车牌字符分割 ...
【技术保护点】
1.一种字符串图像识别方法,其特征在于:包括以下步骤:(1)图像二值化:将一幅图像转换成只包括黑白两种颜色的图像;(2)字符串边界定位:在图像中计算出字符串的最小图像范围;(3)字符串区域裁剪:将字符串的最小图像范围之外的部分剪裁掉,只保留包含有字符串的最小区域;(4)字符分割:采用一种“递归式”的方法,通过不断尝试画分割线,根据画出的分割线与字符串是否相交决定继续分割还是退回重新画分割线,来判别每个字符的边界范围,将字符串中每个字符所占据的区域计算出来;(5)字符识别:将图像中每个字符区域的像素信息数据化,与字库中数组比较,数组中每个字节都相等则输出这个字符,图像中字符串所有字符识别完成连接起来,形成字符串。
【技术特征摘要】
1.一种字符串图像识别方法,其特征在于:包括以下步骤:(1)图像二值化:将一幅图像转换成只包括黑白两种颜色的图像;(2)字符串边界定位:在图像中计算出字符串的最小图像范围;(3)字符串区域裁剪:将字符串的最小图像范围之外的部分剪裁掉,只保留包含有字符串的最小区域;(4)字符分割:采用一种“递归式”的方法,通过不断尝试画分割线,根据画出的分割线与字符串是否相交决定继续分割还是退回重新画分割线,来判别每个字符的边界范围,将字符串中每个字符所占据的区域计算出来;(5)字符识别:将图像中每个字符区域的像素信息数据化,与字库中数组比较,数组中每个字节都相等则输出这个字符,图像中字符串所有字符识别完成连接起来,形成字符串。2.根据权利要求1所述的一种字符串图像识别方法,其特征在于:所述步骤(1)图像二值化包括以下子步骤:(1.1)色彩转换:遍历图像中的每个像素,针对每个像素分别取出它的“红”、“绿”、“蓝”三个颜色分量,假设分别为Ri、Gi、Bi,然后按照下面公式计算得到灰度值:Di=Ri*Pr+Gi*Pg+Bi*Pb其中,Di是像素转换后的灰度值;Pr、Pg、Pb分别是“红”、“绿”、“蓝”三个颜色分量的乘法系数,表示“红”、“绿”、“蓝”三个颜色分量对于转换后的黑白图像所起的作用程度,取值范围介于0.0~1.0之间,并且它们三者相加的和,应当等于1.0;将Pr、Pg、Pb三者的值都设置为0.333,此时像素转换后的灰度值即为“红”、“绿”、“蓝”三个颜色分量的平均值,也可以用下面公式表示:Di=(Ri+Gi+Bi)/3将整幅图像中每个像素变换完毕之后,即会得到一张只包含有“灰度分量”的灰度图像(1.2)计算阈值:统计出灰度图像中的最大灰度值和最小灰度值,然后将二者的平均值作为阈值;(1.3)像素二值化:使用计算的阈值,遍历灰度图像中的每个像素,将图像中大于阈值的灰度变为白色,将小于阈值的灰度变为黑色;(1.4)颜色反转:首先判断二值化图像是否需要反转,判断的方法是,分别统计白色像素和黑色像素的数量,比较黑白像素数量的多少,如果黑色像素少于白色则需要做反转,否则,如果白色像素少于黑色像素则不需要做反转,当判断的结果是“需要反转”后,则遍历二值化图像中的每个像素,将黑白颜色依次互换即可。3.根据权利要求1所述的一种字符串图像识别方法,其特征在于:所述步骤(2)字符串边界定位包括以下子步骤:(2.1)先依次遍历二值化图像的每一行,统计出每一行中前景色像素的数量;(2.2)在遍历完所有行之后,可以得到一个一维数组,数组中的每一个元素对应图像的每一行,表示每一行中前景色像素的数量;(2.3)在数组中找出“第一个”不为零的元素和“最后一个”不为零的元素,记录下这两个元素在数组中“序号”,这两个“序号”即是字体所在区域外接矩形的上边缘和下边缘。4.根据权利要求1所述的一种字符串图像识别方法,其特征在于:所述步骤(4)字符分割包括以下步骤:(4.1)初始化:在此步骤...
【专利技术属性】
技术研发人员:陈宇,白鸿钧,李冠军,杜延坡,丁洋,刘远锋,
申请(专利权)人:河南思维轨道交通技术研究院有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。