一种图片中字符识别的方法以及装置制造方法及图纸

技术编号:14013352 阅读:92 留言:0更新日期:2016-11-17 15:00
本发明专利技术提供一种图片中字符识别的方法,所述方法包括一模板数据库;将原始图片进行图片预处理;将处理后的图片切分为复数个子图片,并将切分后的每个子图片转化为数组列表;取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;将该识别的子图片的数组列表消除,并进入步骤3直至所有字图片识别完成,本发明专利技术还提供一种图片中字符识别的装置,便于识别图片中的字符,提高识别准确率。

【技术实现步骤摘要】

本专利技术涉及一种图片中字符识别的方法以及装置
技术介绍
现有的图片中字符识别技术主要采用先将图片进行切割,然后对切割后的图片进行识别的方法,采用图片切割的方式进行图片中字符识别的技术,识别字符粘连的图片准确率低,不适合在生产过程中应用。而对于整体识别的技术,如果在识别过程中,没有把已经识别出来的字符在原图上完全消除,这些该消除而实际上又没被消除的字符残留部分,容易形成较大的干扰噪声,影响整体的识别准确率。
技术实现思路
本专利技术要解决的技术问题,在于提供一种图片中字符识别的方法以及装置,便于识别图片中的字符,并保证准确率。本专利技术之一是这样实现的:一种图片中字符识别的方法,所述方法包括一模板数据库;包括如下步骤:步骤1、将原始图片进行图片预处理;步骤2、将处理后的图片切分为复数个子图片,并将切分后的每个子图片转化为数组列表;步骤3、取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;步骤4、将该识别的子图片的数组列表消除,并进入步骤3直至所有字图片识别完成。进一步地,所述步骤1中,图片预处理包括二值化以及除噪处理。进一步地,所述步骤2进一步具体为:按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为复数个不可再切分的子图片,最终将每个子图片转化为由数字0、1组成的数组列表。本专利技术之二是这样实现的:一种图片中字符识别的装置,所述装置包括一模板数据库;包括如下模块:图片预处理模块,用于将原始图片进行图片预处理;图片切分模块,用于将处理后的图片切分为复数个子图片,并将切分后的每个子图片转化为数组列表;字符识别模块,用于取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;字符消除模块,用于将该识别的子图片的数组列表消除,并进入字符识别模块直至所有字图片识别完成。进一步地,所述图片预处理模块中,图片预处理包括二值化以及除噪处理。进一步地,所述图片切分模块进一步具体为:按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为复数个不可再切分的子图片,最终将每个子图片转化为由数字0、1组成的数组列表。本专利技术具有如下优点:本专利技术一种图片中字符识别的方法以及装置,本专利技术中的技术可以很好的识别具有粘连字符特性的图片,识别准确率接近100%;可以很好的解决WEB自动测试工具不能填写验证码的问题;在网络数据抓取、分析的过程中,可以将网络中保存为图片格式的电话号码、电子邮箱地址等信息转换为计算机可以批量处理的数据,从而进行数据挖掘等深入应用。附图说明下面参照附图结合实施例对本专利技术作进一步的说明。图1为本专利技术方法执行流程图。图2为本专利技术装置的原理框图。具体实施方式如图1所示,本专利技术图片中字符识别的方法,所述方法包括一模板数据库;包括如下步骤:步骤1、将原始图片进行图片预处理,图片预处理包括二值化以及除噪处理;步骤2、按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为复数个不可再切分的子图片,最终将每个子图片转化为由数字0、1组成的数组列表;步骤3、取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;步骤4、将该识别的子图片的数组列表消除,并进入步骤3直至所有字图片识别完成。如图2所示,本专利技术图片中字符识别的装置,所述装置包括一模板数据库;包括如下模块:图片预处理模块,用于将原始图片进行图片预处理,图片预处理包括二值化以及除噪处理;图片切分模块,用于按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为复数个不可再切分的子图片,最终将每个子图片转化为由数字0、1组成的数组列表;字符识别模块,用于取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;字符消除模块,用于将该识别的子图片的数组列表消除,并进入字符识别模块直至所有字图片识别完成。本装置由图片预处理、图片切分、字符模版管理、字符识别、字符消除等五个模块组成。图片预处理模块负责对输入的原始图片进行二值化、除噪等处理为图片切分模块提供输入;图片切分模块按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为多个不可再切分的子图片,最终将各自子图片转化为由数字0、1组成的数组列表,为字符识别和字符消除模块提供输入;字符模版管理模块负责从现有的图片数据中分析出单个字符模版,为字符识别和字符消除模块提供输入;字符识别模块从字符模块管理模块中获取所有字符模版,针对切分后的每一个子图片进行如下操作:把字符模版逐一与子图片数据进行匹配、比对,每次匹配的结果会输出一个匹配率,最终将匹配率最高的模版所代表的字符作为单次识别的结果输出;字符消除模块负责从图片数据中消除本次已经识别的内容,以决策下一步动作:a)继续识别;b)图片识别结束,输出图片总体识别结果。虽然以上描述了本专利技术的具体实施方式,但是熟悉本
的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本专利技术的范围的限定,熟悉本领域的技术人员在依照本专利技术的精神所作的等效的修饰以及变化,都应当涵盖在本专利技术的权利要求所保护的范围内。本文档来自技高网
...
一种图片中字符识别的方法以及装置

【技术保护点】
一种图片中字符识别的方法,其特征在于:所述方法包括一模板数据库;包括如下步骤:步骤1、将原始图片进行图片预处理;步骤2、将处理后的图片切分为复数个子图片,并将切分后的每个子图片转化为数组列表;步骤3、取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;步骤4、将该识别的子图片的数组列表消除,并进入步骤3直至所有字图片识别完成。

【技术特征摘要】
1.一种图片中字符识别的方法,其特征在于:所述方法包括一模板数据库;包括如下步骤:步骤1、将原始图片进行图片预处理;步骤2、将处理后的图片切分为复数个子图片,并将切分后的每个子图片转化为数组列表;步骤3、取出一子图片所转化的数组列表与模板数据库中的模板进行对比,获取识别结果;步骤4、将该识别的子图片的数组列表消除,并进入步骤3直至所有字图片识别完成。2.根据权利要求1所述的一种图片中字符识别的方法,其特征在于:所述步骤1中,图片预处理包括二值化以及除噪处理。3.根据权利要求1所述的一种图片中字符识别的方法,其特征在于:所述步骤2进一步具体为:按照像素投影算法,查找预处理后的图片中无字符粘连的位置,并在该位置上执行图片切分动作,把原始输入的图片切分为复数个不可再切分的子图片,最终将每个子图片转化为由数字0、1组成的数组列表。4.一种图片中字符识别的装置,...

【专利技术属性】
技术研发人员:赖祥芳
申请(专利权)人:福建富士通信息软件有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1