一种图像字符的识别方法及其装置制造方法及图纸

技术编号:15691502 阅读:40 留言:0更新日期:2017-06-24 04:45
本发明专利技术适用于图像处理领域,提供了图像字符的识别方法及装置,方法包括:通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;将字符区域图像进行二值化处理,获得字符区域图像对应的二值化字符区域图像;根据二值化字符区域图像以及预设的字符边界确定算法,确定二值化字符区域图像中各字符的第一边界位置信息;根据每个字符的第一边界位置信息,对二值化字符区域图像进行字符分割操作,得到多个字符子图像;将多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定多个字符子图像各自对应的字符信息。本发明专利技术通过将包含多字符图像分割为单字符图像,再进行字符识别,解决现有字符识别技术,识别准确率低的问题。

Image character recognition method and device thereof

The invention is applicable to the field of image processing, and provides a device, image recognition method of character method includes: by default character region extraction algorithm, get the character image region contains the image data to be identified in the region; character image binarization processing to obtain corresponding character region image binarization character region according to the two value image; determining algorithm of character region image and preset character boundaries, determine the two values of the first boundary location information of the character image in the region; according to the first boundary location information of each character, the binarization image character region character segmentation, multiple character sub image; multi in a word Fu Zi image respectively with the preset character template matching, according to the matching results to determine the multiple character character information corresponding to each sub image. The invention solves the problem of low recognition accuracy by segmenting a multi character image into a single character image, and then performing character recognition.

【技术实现步骤摘要】
一种图像字符的识别方法及其装置
本专利技术属于图像处理
,尤其涉及一种图像字符的识别方法及其装置。
技术介绍
随着图像处理技术的发展,用户经常需要对图像中包含的字符信息进行提取以及识别,例如在纸币真伪识别时,需要提取纸币对应的冠字号信息。然而现有的图像字符的识别方法,当图像数据中包含多个字符时,经常出现错误识别的情况,字符识别效果较差并且准确率低。
技术实现思路
本专利技术实施例的目的在于提供一种图像字符的识别方法及其装置,旨在解决现有的图像字符的识别方法,当图像数据中包含多个字符时,经常出现错误识别的情况,字符识别效果较差并且准确率低的问题。第一方面,本专利技术实施例提供一种图像字符的识别方法,所述图像字符的识别方法包括:通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像;根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息。第二方面,本专利技术实施例提供一种图像字符的识别装置,所述图像字符的识别装置包括:字符区域图像获取单元,用于通过预设的字符区域提取算法,获取图像数据中包含字符图像的字符区域图像;二值化处理单元,用于通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;第一边界位置信息确定单元,用于根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;第一字符分割单元,用于根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;字符识别单元,用于将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息。实施本专利技术实施例提供的一种图像字符的识别方法及其装置具有以下有益效果:本专利技术实施例通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像;根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息,从而可以将包含多字符区域图像分割为多个单字符图像,再利用单字符识别算法识别该单字符图像对应的字符信息。由于在需要识别包含多字符的图像数据时,在识别过程中字符之间容易产生干扰,引入不必要的环境噪声,继而降低识别的准确率。而通过字符分割算法预先对多字符区域图像进行字符分割操作,则可消除在识别过程中字符间干扰的情况,从而提高图像字符的识别效果以及准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种图像字符的识别方法的流程图;图2是本专利技术另一实施例提供的一种图像字符的识别方法的流程图;图3是本专利技术实施例提供的一种图像字符的识别装置的结构框图;图4是本专利技术另一实施例提供的一种图像字符的识别装置的结构框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例将包含的多字符区域图像分割为多个单字符图像,再利用单字符识别算法识别单字符图像对应的字符信息,从而解决现有的图像字符的识别方法,当图像数据中包含多个字符时,经常出现错误识别的情况,字符识别效果较差并且准确率低的问题。在本专利技术实施例中,流程的执行主体为图像字符的识别装置。所述图像字符的识别装置可单独作为一设备进行使用,或将本专利技术实施例提供的装置作为另一设备的功能模块,与该设备的其他功能模块配合使用。具体地,所述图像字符的识别装置可为纸币冠字号字符识别装置,用于识别纸币冠字号区域的字符信息。所述图像为纸币图像,所述字符区域图像为冠字号区域图像,所述字符信息为冠字号信息。图1示出了本专利技术实施例提供的图像字符的识别方法的实现流程图,详述如下:在S101中,通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像。在本实施例中,图像字符的识别装置预先获取了待识别的图像数据,其中所述待识别的图像数据可以为彩色图像、灰度图像以及二值化图像。在本实施例中,图像字符的识别装置包含字符区域提取算法,该字符区域提取算法用于识别该图像数据中包含的字符区域图像,且字符区域图像的数量可以为多个。由于对于一个图像数据,其包含的字符信息并不一定集中于某一个区域,可能分布于该图像数据中的多个位置,因此,通过字符区域提取算法获取的字符区域图像,数量并不一定为一个。可选地,在本实施例中,获取的字符区域图像的面积大小相同,即利用预设的窗口执行字符区域图像的获取操作。为了便于后期对字符区域图像中的字符信息进行识别,可统一字符区域图像的尺寸规格。可选地,在本实施例中,将获取的字符区域图像进行翻转操作,使其面向为正面正方向。由于获取待识别的图像数据时,该图像并非处于正面正方向,因此获取的字符区域图像对应的面向信息也并不一定为正面正方向,为了便于字符识别操作,将会对所有获取的字符区域图像进行翻转操作,使其面向统一。在S102中,将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像。在本实施例中,为了便于图像字符的识别装置进行字符识别,将获取得到的字符区域图像进行二值化处理,其中二值化处理的阈值可为装置默认的阈值或根据用户的实际需求进行设置。在本实施例中,若所述字符区域图像原图像格式即为二值化图像,也将该字符区域图像进行二值化处理,以便于进一步去除环境噪声,继而提高识别的准确率。在S103中,根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息。在本实施例中,第一边界位置信息包括但不限于:上下边界的位置信息以及左右边界的位置信息,通过上述四个边界信息可封闭确定单一字符的位置区域。可选地,在本实施例中,若二值化字符区域图像中的某些字符,由于印刷时纸张偏转或打印机错误等原因,产生一定角度的偏转,因而若直接通过上下左右四个边界对该字符进行定位将产生较大误差。因此可通过对二值化字符区域图像以预设的角度间隔进行旋转,直至该字符正置后,再确定其边界位置信息。在本实施例中,预设的字符边界确定算法用于确定二值化字符区域图像中各字符的边界,举例性地,该字符区域图像为冠字号区域图像,冠字号区域图像中包含由多个字符顺次排列的冠字本文档来自技高网...
一种图像字符的识别方法及其装置

【技术保护点】
一种图像字符的识别方法,其特征在于,所述图像字符的识别方法包括:通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像;根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息。

【技术特征摘要】
1.一种图像字符的识别方法,其特征在于,所述图像字符的识别方法包括:通过预设的字符区域提取算法,获取待识别的图像数据中包含的字符区域图像;将所述字符区域图像进行二值化处理,获得所述字符区域图像对应的二值化字符区域图像;根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息;根据每个所述字符的第一边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像;将所述多个字符子图像分别与预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息。2.根据权利要求1所述的图像字符的识别方法,其特征在于,所述根据每个所述字符的边界位置信息,对所述二值化字符区域图像进行字符分割操作,得到多个字符子图像之后还包括:根据预设的边界连续识别算法以及所述字符子图像,判断所述字符子图像的边界是否连续;若所述字符子图像的边界不连续,则通过预设的二值化优化算法对所述二值化字符区域图像进行处理,获得二次二值化字符区域图像;根据预设的字符位置定位算法确定所述二次二值化字符区域图像中各字符的第二边界位置信息;根据所述第二边界位置信息,对所述二次二值化字符区域图像进行字符分割操作,得到多个优化字符子图像。3.根据权利要求2所述的图像字符的识别方法,其特征在于,所述根据预设的字符位置定位算法确定所述二次二值化字符区域图像各字符的第二边界位置信息具体为:根据所述二次二值化字符区域图像包含的像素点的像素点值,分别计算所述二次二值化字符区域图像各行以及各列包含的像素点的像素点值之和,得到行像素点值数组以及列像素点值数组;通过所述行像素点值数组以及列像素点值数组,确定所述二次二值化字符区域图像各字符的第二边界位置信息。4.根据权利要求1所述的图像字符的识别方法,其特征在于,所述根据所述二值化字符区域图像以及预设的字符边界确定算法,确定所述二值化字符区域图像中各字符的第一边界位置信息具体包括:根据预设的滑动窗口覆盖算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符上下边界对应的行坐标信息;根据预设的列和卷积算法以及所述二值化字符区域图像,确定所述二值化字符区域图像中各字符左右边界对应的列坐标信息;通过所述行坐标信息以及列坐标信息,确定所述二值化字符区域图像中各字符的第一边界位置信息。5.根据权利要求1所述的图像字符的识别方法,其特征在于,所述将所述多个字符子图像与分别预设的字符模板进行匹配,根据匹配结果确定所述多个字符子图像各自对应的字符信息具体为:通过预设的夹角余弦算法分别计算字符子图像与各个预设的字符模板的相似度;当所述相似度大于预设阈值,则将所述相似度对应的字符模板对应的字符信息识别为所述字符子图像对应的字符信息。6.一种图像字符的识别装置,其特...

【专利技术属性】
技术研发人员:曹婧蕾
申请(专利权)人:深圳怡化电脑股份有限公司深圳市怡化时代科技有限公司深圳市怡化金融智能研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1