一种图片内数字粘连识别的方法和装置制造方法及图纸

技术编号:16874608 阅读:43 留言:0更新日期:2017-12-23 12:20
本发明专利技术公开了一种图片内数字粘连识别的方法和装置。该方法包括两轮模板字符识别步骤以及识别字符提取步骤。其中第一轮模板字符识别中,通过逐步扩大目标图片识别区域,对目标图片识别区域与字符模板图片进行模板匹配,得到各个字符的相似度和坐标,然后选取相似度值最大且相似度值超过指定阈值的作为识别出的字符加入至字符识别队列中,并在目标图片中擦除该字符。在第二轮模板字符识别中,对目标图片识别区域与字符模板图片进行模板匹配,然后选取相似度值最大的作为识别出的字符加入至字符识别队列中。识别字符提取步骤根据字符识别队列中的坐标进行排序后得到最终识别结果。

A method and device for recognition of digital adhesions in a picture

The invention discloses a method and device for identification of digital adhesions in a picture. The method includes two - wheel template character recognition step and the recognition character extraction step. The first round of template character recognition, through the gradual expansion of the target image recognition area on the target image recognition area and character template image template matching, similarity and coordinate various characters, and then select the maximal similarity and similarity value queue as a recognized character added to the character recognition exceeds a specified threshold, and erase the character in the target image. In the second round template character recognition, we match the target image recognition area with the character template image template, then select the largest similarity value as the recognized character to join the character recognition queue. The recognition character extraction steps are sorted according to the coordinates in the character recognition queue, and the final recognition results are obtained.

【技术实现步骤摘要】
一种图片内数字粘连识别的方法和装置
本专利技术涉及图片中字符识别。
技术介绍
公告号为CN104200204A的专利文献《一种图片处理装置及方法》公开了一种图片字符的识别方法。该图片字符识别方法首先将字符和目标图片进行二值化处理,然后对目标图片进行逐行逐像素扫描,当扫描到非0像素点时作为识别内容的起始坐标,然后进行基于该起始坐标对字符的像素点逐一匹配,根据匹配数和字符总像素点计算匹配率,并选择匹配率最高的字符作为识别出的字符,识别出字符后在目标图片中异或擦除该字符后继续识别。该方法存在着准确率不高的问题,具体原因如下:首先,起始坐标的确定方式存在问题。该方法逐行逐像素扫描,当扫描到非0像素点时作为识别内容的起始坐标。显而易见地,该起始坐标并不是字符的左上角,而是通常在字符中间,因此该起始坐标不是个稳固的坐标,它可能偏左一些,也可能偏右一些,也可能偏上一些,或者偏下一些。为此,该专利文献中采用上下左右偏移一个像素点解决这个问题。但偏移较大的情况下,特别是存在粘连问题的情形之下,这种方法由于只偏移一个像素点,而无法解决,比如偏移两个点或者左下偏移等情形。其次,选择匹配率最高的字符作为识别本文档来自技高网...
一种图片内数字粘连识别的方法和装置

【技术保护点】
一种图片内字符粘连识别的方法,其特征在于,该方法包括获取模板字符图片集的步骤、获取目标图片的步骤、第一模板字符识别步骤以及识别字符提取步骤;所述模板字符图片集为模板字符图片的集合;所述模板字符图片与字符相对应;所述第一模板字符识别步骤包括:S31:根据模板字符图片集中的模板字符图片的最小宽度确定识别区域宽度;S32:对目标图片内的识别区域采用模板匹配方式匹配模板字符图片集中的模板字符图片,得到各个字符匹配出的相似度值和坐标;所述识别区域根据所述识别区域宽度所确定;S33:判断各个字符匹配出的相似度值中是否存在相似度值超过指定阈值,如果存在相似度值超过指定阈值的,则选择相似度值最大的字符作为识别...

【技术特征摘要】
1.一种图片内字符粘连识别的方法,其特征在于,该方法包括获取模板字符图片集的步骤、获取目标图片的步骤、第一模板字符识别步骤以及识别字符提取步骤;所述模板字符图片集为模板字符图片的集合;所述模板字符图片与字符相对应;所述第一模板字符识别步骤包括:S31:根据模板字符图片集中的模板字符图片的最小宽度确定识别区域宽度;S32:对目标图片内的识别区域采用模板匹配方式匹配模板字符图片集中的模板字符图片,得到各个字符匹配出的相似度值和坐标;所述识别区域根据所述识别区域宽度所确定;S33:判断各个字符匹配出的相似度值中是否存在相似度值超过指定阈值,如果存在相似度值超过指定阈值的,则选择相似度值最大的字符作为识别出的字符,然后将识别出的字符和匹配出的坐标存入字符识别队列中,同时,根据匹配出的坐标所确定的识别出的字符在目标图片中的位置和识别出的字符所对应的模板字符图片所确定的字符形状,在目标图片中擦除识别出的字符;S34:增加识别区域宽度后重复步骤S32和S33直到识别区域宽度大于目标图片的宽度;所述增加识别区域宽度中所增加的宽度为模板字符图片集中的模板字符图片的最小宽度;所述识别字符提取步骤为根据匹配出的坐标的横向值对所述字符识别队列进行排序,然后按顺序从字符识别队列中逐个提取识别出的字符作为最终识别结果。2.如权利要求1所述的图片内字符粘连识别的方法,其特征在于,该方法在第一模板字符识别步骤之后还有第二模板字符识别步骤;所述第二模板字符识别步骤包括:S41:对目标图片采用模板匹配方式匹配模板字符图片集中的模板字符图片,得到各个字符匹配出的相似度值和坐标;S42:选择相似度值最大的字符作为识别出的字符,然后将识别出的字符和匹配出的坐标存入字符识别队列中,同时,根据匹配出的坐标所确定的识别出的字符在目标图片中的位置和识别出的字符所对应的模板字符图片所确定的字符形状,在目标图片中擦除识别出的字符;S43:重复步骤S41和S42直到重复次数超过限值或者字符识别队列中的字符数目达到指定的数目。3.如权利要求2所述的图片内字符粘连识别的方法,其特征在于,该方法之后还包括中间检查步骤;所述中间检查步骤在第一模板字符识别步骤之后判断字符识别队列中的字符数目达到指定的数目,假如未达到指定的数目,则执行第二模板字符识别步骤。4.如权利要求1所述的图片内字符粘连识别的方法,其特征在于,所述获取目标图片的步骤中还包括对所述目标图片进行灰化处理或二值化处理的步骤。5.如权利要求1所述的图片内字符粘连识别的方法,其特征在于,获取模板字符图片集的步骤还包括对模板字符图片集中的模板字符图片进行灰化处理或二值化处理的步骤。6.一种图片内字符粘连识别的装置,其特征在于...

【专利技术属性】
技术研发人员:方宏方达
申请(专利权)人:江苏海事职业技术学院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1