图像中数字的识别方法、装置及设备制造方法及图纸

技术编号:12883105 阅读:34 留言:0更新日期:2016-02-17 15:32
本公开是关于一种图像中数字的识别方法、装置及设备,其方法包括:从所述图像中获取包含数字字符的待处理图像;对所述待处理图像进行二值化处理,得到二值化图像;从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;确定所述数字区域图像中各数字字符所占图像宽度;根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。本公开可以对包含数字字符的图像中的各个数字字符精确的进行分割,提高了对数字字符识别的准确性。

【技术实现步骤摘要】

本公开涉及通信领域,尤其涉及图像中数字的识别方法、装置及设备
技术介绍
随着科学技术的快速发展,图像识别的应用也越来越广泛,而且深度卷积神经网 络的进一步发展和广泛应用,使得图像识别的准确率有了非常大的提升。 相关技术中,对图像中的数字进行识别时,可以通过以下步骤进行:步骤A:视频 图像文字区域粗定位:通过计算视频图像的高斯金字塔多尺度图像,采用阈值分割方法分 割出图像文字区域,然后利用数学形态学中膨胀、腐蚀技术合并文字区域,最后通过连通域 分析、文字行分割和剔除规则分析定位候选文字区域;步骤B:视频图像文字区域定位验 证:采用harr特征训练adaboost分类器,利用adaboost分类器检测候选文字区域内是否 有文字,剔除未检测文字的候选文字区域。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种图像中数字的识别方法、装置及 设备。 根据本公开实施例的第一方面,提供一种图像中数字的识别方法,包括: 从所述图像中获取包含数字字符的待处理图像; 对所述待处理图像进行二值化处理,得到二值化图像; 从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域 图像; 确定所述数字区域图像中各数字字符所占图像宽度; 根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。 由于在对包含数字字符的待处理图像进行相关处理之后,获得各数字字符所占图 像宽度,以此对数字区域图像进行分割,从而可以对包含数字字符的图像中的各个数字字 符精确的进行分割,提高了对数字字符识别的准确性。 结合第一方面,在第一方面的第一种可能的实现方式中,所述二值化图像为N行Q 列像素的图像;所述从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得 到数字区域图像,包括: 从二值化图像的第1行开始进行正序逐行像素扫描,并对所扫描行的像素值中为 前景像素值的个数进行统计,若第η行的个数小于预设阈值且第n+1行的个数不小于预设 阈值,则停止扫描并从所述二值化图像中去除第1行~第η行的像素;其中,η为小于或等 于Ν的整数; 从二值化图像的第Ν行开始进行倒序逐行像素扫描,并对所扫描行的像素值中为 前景像素值的个数进行统计,若第m行的个数小于预设阈值且第m+1行的个数不小于预设 阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N行的像素;其中,m为小于或 等于N的整数; 从二值化图像的第1列开始进行正序逐列像素扫描,并对所扫描列的像素值中为 前景像素值的个数进行统计,若第P列的个数小于预设阈值且第P+1列的个数不小于预设 阈值,则停止扫描并从所述二值化图像中去除第1列~第P行列的像素;其中,P为小于或 等于Q的整数; 从二值化图像的第Q列开始进行倒序逐列像素扫描,并对所扫描列的像素值中为 前景像素值的个数进行统计,若第q列的个数小于预设阈值且第q+Ι列的个数不小于预设 阈值,则停止扫描并从所述二值化图像中去除第q+Ι列~第Q列的像素;其中,q为小于或 等于Q的整数。 通过去除数字字符所在像素区域周围的像素区域,使获得的数字区域图像更准 确,从而可以提高数字字符识别的精确度。 结合第一方面,在第一方面的第二种可能的实现方式中,所述从所述二值化图像 中去除数字字符所在像素区域周围的像素区域,得到数字区域图像之后,还包括: 根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置; 根据所述重心位置,对所述数字区域图像进行裁剪,以使所述重心位置位于所述 数字区域图像的前景像素的中心。 结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式 中,所述根据所述数字区域图像中的前景像素,计算所述前景像素的重心位置,包括: 根据公式^^ 计算所述前景像素的重心的横坐标; N , 根据公式计算所述前景像素的重心的纵坐标; 其中,(Wx,Wy)为所述前景像素的重心的坐标,Ν为所述数字区域图像中前景像素 的总数,Iay)表示坐标(x,y)处的像素; 相应的,根据所述重心位置,对所述数字区域图像进行裁剪,包括: 以距离所述重心位置较近的边为基准,根据较近边距离重心的长度对距离较远的 边进行裁剪,使重心位于所述数字区域图像的中心位置。 利用前景像素的重心位置对数字区域图像的边界进行优化,使获得的数字区域图 像更准确,从而可以提高数字字符识别的精确度。 结合第一方面、第一方面的第一种或第一方面的第三种任一种可能的实现方式, 在第一方面的第四种可能的实现方式中,所述确定所述数字区域图像中各数字字符所占图 像宽度,包括: 对所述数字区域图像的上半部分图像按列进行像素扫描,并对所扫描列中的前景 像素的个数进行统计; 确定各列像素中所述个数连续低于预设阈值的k列像素; 计算所述k列像素所占的图像宽度,将所述k列像素所占的图像宽度确定为所述 各数字字符所占的图像宽度; 其中,k为正整数。 通过获取小数点所占的图像宽度,从而获知各个数字字符所占的图像宽度,使得 确定数字区域图像中各数字字符所占图像宽度的方式较简单,从而提高了对数字字符识别 的效率。 结合第一方面、第一方面的第一种或第一方面的第三种任一种可能的实现方式, 在第一方面的第五种可能的实现方式中,所述确定所述数字区域图像中各数字字符所占图 像宽度,包括: 对所述数字区域图像的上半部分图像按列进行像素扫描,并对所述数字区域图像 中的前景像素的个数进行统计; 确定各列像素中所述个数连续低于预设阈值的k列像素; 计算所述k列像素所占的宽度; 确定所述数字区域图像中所述k列像素所占的宽度右侧的图像宽度; 根据预知的小数点后的数字字符个数以及所述右侧的图像宽度,确定各数字字符 所占的图像宽度; 其中,k为正整数。 通过数字区域图像的整体宽度及全部数字字符的个数确定每个数字字符所占的 图像宽度,可以提高每个数字字符图像宽度确定的准确度。 根据本公开实施例的第二方面,提供一种图像中数字的识别装置,包括: 获取模块,被配置为从所述图像中获取包含数字字符的待处理图像; 处理模块,被配置为对所述待处理图像进行二值化处理,得到二值化图像; 去除模块,被配置为从所述二值化图像中去除数字字符所在像素区域周围的像素 区域,得到数字区域图像; 确定模块,被配置为确定所述数字区域图像中各数字字符所占图像宽度; 分割模块,被配置为根据所述图像宽度对所述数字区域图像进行分割,得到单个 数字字符的图像。 结合第二方面,在第二方面的第一种可能的实现方式中,所述二值化图像为N行Q 列像素的图像;所述去除模块包括: 第一扫描子模块,被配置为从二值化图像的第1行开始进行正序逐行像素扫描, 并对所扫描行的像素值中为前景像素值的个数进行统计,若第η行的个数小于预设阈值且 第η+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第1行~第η行 的像素;其中,η为小于或等于Ν的整数; 第二扫描子模块,被配置为从二值化图像的第Ν行开始进行倒序逐行像素扫描, 并对所扫描行的像素值中为前景像素值的个数进行统计,若第m行的个数小于预设阈值且 第m+1行的个数不小于预设阈值,则停止扫描并从所述二值化图像中去除第m+1行~第N 行的像素;其中,m为小于或等于N的整数; 第三扫描子模块,被配本文档来自技高网...

【技术保护点】
一种图像中数字的识别方法,其特征在于,包括:从所述图像中获取包含数字字符的待处理图像;对所述待处理图像进行二值化处理,得到二值化图像;从所述二值化图像中去除数字字符所在像素区域周围的像素区域,得到数字区域图像;确定所述数字区域图像中各数字字符所占图像宽度;根据所述图像宽度对所述数字区域图像进行分割,得到单个数字字符的图像。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨松王百超汪平仄
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1