一种识别印刷品上字符的方法及装置制造方法及图纸

技术编号:11027333 阅读:73 留言:0更新日期:2015-02-11 14:47
本申请涉及一种识别印刷品上字符的方法及装置。该方法可以包括:对所述印刷品进行拍摄以获取要识别的图像;对所述图像进行复制以得到至少两幅复制图像,并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像;将得到的分层图像进行图层合并,以得到处理后图像;从所述处理后图像中提取每个字符的图像;以及对提取出的每个字符的图像进行字符识别。采用本申请的技术方案,在对例如证件等印刷品进行图像处理时,能够实现对该印刷品上字符的更有效、更精确的识别。

【技术实现步骤摘要】
【专利摘要】本申请涉及一种识别印刷品上字符的方法及装置。该方法可以包括:对所述印刷品进行拍摄以获取要识别的图像;对所述图像进行复制以得到至少两幅复制图像,并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像;将得到的分层图像进行图层合并,以得到处理后图像;从所述处理后图像中提取每个字符的图像;以及对提取出的每个字符的图像进行字符识别。采用本申请的技术方案,在对例如证件等印刷品进行图像处理时,能够实现对该印刷品上字符的更有效、更精确的识别。【专利说明】—种识别印刷品上字符的方法及装置
本申请涉及图像识别
,尤其涉及一种识别印刷品上字符的方法及装置。
技术介绍
在以往的OCR (Optical Character Recognit1n,光学字符识别)识别中,对于一些外部比较光滑,反射较强的印刷品上文字的识别,例如经过表面覆膜处理的印刷品上的文字的识别、或者例如各类证件照或各种卡(尤其是过塑处理的证件(驾驶证、行驶证等))上文字的识别,往往会存在识别率较低或者另外因为表面覆膜反光从而存在识别错误的情况,造成这种问题的本质在于识别的过程中无法进行有效的滤光,导致OCR识别源的字体存在模糊或者对比度过大的问题,同时,由于各种印刷品往往存在多种不同的字体,也会在识别上带来的字符无法匹配或匹配错误的问题。 目前,在OCR的识别技术发展上,面向证照的需求越来越多,而现有的OCR技术的发展方向都趋向于对于完整图像信息的识别与搜寻,针对目前的证照识别来看,现行的几种OCR识别方案中,对于身份证、护照等的识别,现阶段虽然有较为成熟的高识别率引擎与算法,但对于类似驾照、工作证等的识别上,由于这些证件在最终颁发的时候都会对证件进行过塑处理,同时也由于各个地区的类似证件打印并不像身份证一样具备统一的打印标准与字体,从而导致了现行的证照识别中,针对需要识别的证照往往会存在由于曝光过度导致图像模糊以及针对变形字体的识别效率低的问题,从本质而言,在于现行的识别方法中并没有完全考虑这两个方面的需要。
技术实现思路
本申请的主要目的在于提供一种识别印刷品上字符的方法及装置,以解决现有技术存在的对印刷品上字符进行识别中的图像处理问题以及字符识别问题,其中: 根据本申请的一个方面,提供了一种识别印刷品上字符的方法,其特征在于,包括:对所述印刷品进行拍摄以获取要识别的图像;对所述图像进行复制以得到至少两幅复制图像,并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像;将得到的分层图像进行图层合并,以得到处理后图像;从所述处理后图像中提取每个字符的图像;以及对提取出的每个字符的图像进行字符识别。 根据本申请的实施例,在该方法中,对所述印刷品进行拍摄以获取要识别的图像,包括:在进行拍摄时按预定条件进行曝光设置。 根据本申请的实施例,在该方法中,对所述每一幅复制图像分别进行不同的图像处理以得到至少两幅分层图像,包括:对所述复制图像中的一幅进行去除噪点处理以得到第一分层图像;以及对所述复制图像中的另一幅进行对比度增强处理以得到第二分层图像。 根据本申请的实施例,在该方法中,对所述复制图像中的一幅进行去除噪点处理以得到第一分层图像,包括:识别所述复制图像中的噪点;将每个噪点的灰度值与其周围相邻的八个像素点的灰度值相加并取平均值作为每个噪点的去噪灰度值;以及将所述复制图像中每个噪点的灰度值替换为该噪点的去噪灰度值以得到第一分层图像。 根据本申请的实施例,在该方法中,识别所述复制图像中的噪点包括:将所述复制图像中每个像素点的灰度值与其左右两个相邻像素点的灰度值相加并取平均值作为每个像素点的计算灰度值;判断每个像素点的灰度值与其计算灰度值的差值的绝对值是否在预定阈值范围内;以及将灰度值与计算灰度值的差值的绝对值超出预定阈值范围的像素点识别为噪点。 根据本申请的实施例,在该方法中,对所述复制图像中的另一幅进行对比度增强处理以得到第二分层图像,包括:将所述复制图像划分为至少两个子区域;以及对每个子区域分别进行灰度调整,以得到第二分层图像。 根据本申请的实施例,在该方法中,将所述分层图像进行合并,以得到处理后图像,包括:对所述分层图像中相对应像素点的灰度值取中值,得到每个像素点的灰度值中值;以及将每个像素点的灰度值替换为该像素点的灰度值中值,以得到处理后图像。 根据本申请的实施例,在该方法中,提取出所述处理后图像中每个字符的图像,包括:确定所述处理后图像中的文本图像的位置;以及对所述文本图像进行字符分割,提取出所述文本图像中的每个字符的图像。 根据本申请的实施例,在该方法中,获取所述处理后图像中的文本图像的位置,包括:通过边缘检测识别出每行像素中的边缘纹理;对每行像素的边缘纹理做直方图,并根据对所述直方图的分析确定边缘基元的识别阈值;根据所述边缘基元的识别阈值统计每行的边缘基元的数目,并记录每行边缘基元的开始位置和结束位置;识别所述处理后图像中的非空白行;判断当前非空白行是否满足预设条件,如果满足,则进行下一非空白行的检测;以及当连续检测到超过预定数目的非空白行满足所述预设条件时,根据每一非空白行边缘基元的开始位置和结束位置确定文本图像的位置。 根据本申请的实施例,在该方法中,对提取出的每个字符的图像进行字符识别,包括:利用BP神经网络对所述每个字符的图像进行字符识别。 本申请的另一方面,提供了一种识别印刷品上字符的装置,其特征在于,包括:采集模块,用于对所述印刷品进行拍摄以获取要识别的图像;分层处理模块,用于对所述图像进行复制以得到至少两幅复制图像,并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像;图层合并模块,用于将得到的分层图像进行图层合并,以得到处理后图像;提取模块,用于从所述处理后图像中提取每个字符的图像;以及识别模块,用于对提取出的每个字符的图像进行字符识别。 与现有技术相比,根据本申请的技术方案,通过对印刷品进行拍摄并对要识别的图像进行分层图像处理,并通过图层合并进行效果补偿,能够提升图像质量,提高识别的准确率。 【专利附图】【附图说明】 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中: 图1是本申请实施例的一种识别印刷品上字符的方法的流程图; 图2是本申请实施例的图1中的步骤S102中,去除噪点处理的步骤SI的流程图; 图3是本申请实施例的图2中的步骤S201的流程图; 图4是本申请实施例的图1中的步骤S102中,对比度增强处理的步骤S2的流程图; 图5是本申请实施例的图1中的步骤S103的流程图; 图6是本申请实施例的图1中的步骤S104的流程图; 图7是本申请实施例的图6中的步骤S601的流程图;以及 图8是本申请实施例的一种识别印刷品上字符的装置的结构框图。 【具体实施方式】 本申请的主要思想在于,通过对带有文字的印刷品进行拍摄,将得到的图像复制成至少两幅图像分别进行不同的图像处理得到分层图像,并对各分层图像进行图层合并,得到处理后的图像,再对所述处理后的图像进行文本提取和文字识别。 为使本申请的目的、技术方案和本文档来自技高网
...
一种识别印刷品上字符的方法及装置

【技术保护点】
一种识别印刷品上字符的方法,其特征在于,包括:对所述印刷品进行拍摄以获取要识别的图像;对所述图像进行复制以得到至少两幅复制图像,并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像;将得到的分层图像进行图层合并,以得到处理后图像;从所述处理后图像中提取每个字符的图像;以及对提取出的每个字符的图像进行字符识别。

【技术特征摘要】

【专利技术属性】
技术研发人员:侯放
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1