字符识别方法及装置制造方法及图纸

技术编号:13674552 阅读:69 留言:0更新日期:2016-09-07 23:52
本发明专利技术公开了一种字符识别方法,包括:采集带有字符的数字图像并对该数字图像进行图像预处理;从所述数字图像中分割出字符图像并进行归一化处理;提取所述字符图像的字符特征信息并进行识别,以确定所述字符图像的字符内容,得到字符识别结果。本发明专利技术还公开了一种字符识别装置。通过本发明专利技术可实现对通过拍摄或扫描方式所生成的图像上的字符识别,并提升字符识别的精度。

【技术实现步骤摘要】

本专利技术涉及图像处理
,尤其涉及字符识别方法及装置
技术介绍
数字图像通常包含有多种多样的信息,例如文字、图像信息等,具体比如名片上的姓名、电话等信息,通过字符识别的方式从而能够直接督促其中的文字信息,现有技术中通常采用OCR(Optical Character Recognition,光学字符识别)进行文字识别。而现有OCR技术中,对于拍摄场景、拍摄角度等变化所引起的字符变化的应变能力低,进而导致识别的正确率不高,识别效率也较低。
技术实现思路
本专利技术的主要目的在于提供一种字符识别方法及装置,旨在解决现有字符识别技术中,识别的正确率不高且识别效率较低的技术问题。为实现上述目的,本专利技术提供一种字符识别方法,所述字符识别方法包括:采集带有字符的数字图像并对该数字图像进行图像预处理;从所述数字图像中分割出字符图像并进行归一化处理;提取所述字符图像的字符特征信息并进行识别,以确定所述字符图像的字符内容,得到字符识别结果。优选地,所述从所述数字图像中分割出字符图像并进行归一化处理包括:采用垂直投影法从所述数字图像中分割出所述字符图像;采用双线性插值法对所述字符图像进行归一化处理。优选地,所述提取所述字符图像的字符特征信息并进行识别,以确定所述字符图像的字符内容,得到字符识别结果包括:从所述字符图像中统计并提取字符的笔画斜率特征、拐点幅度特征、轮廓深度特征以及跳跃点特征;根据预先训练得到的字符分类器,分析提取到的字符特征,得到所述字
符图像所对应的字符识别结果。优选地,所述图像预处理至少包括色彩校正、图像滤波、灰度化、二值化处理。进一步地,为实现上述目的,本专利技术还提供一种字符识别装置,所述字符识别装置包括:采集模块,用于采集带有字符的数字图像并对该数字图像进行图像预处理;分割模块,用于从所述数字图像中分割出字符图像并进行归一化处理;识别模块,用于提取所述字符图像的字符特征信息并进行识别,以确定所述字符图像的字符内容,得到字符识别结果。优选地,所述从所述分割模块包括:分割单元,用于采用垂直投影法从所述数字图像中分割出所述字符图像;归一处理单元,用于采用双线性插值法对所述字符图像进行归一化处理。优选地,所述识别模块包括:特征统计单元,用于从所述字符图像中统计并提取字符的笔画斜率特征、拐点幅度特征、轮廓深度特征以及跳跃点特征;字符识别单元,用于根据预先训练得到的字符分类器,分析提取到的字符特征,得到所述字符图像所对应的字符识别结果。优选地,所述图像预处理至少包括色彩校正、图像滤波、灰度化、二值化处理。本专利技术通过预先对采集的数字图像(拍摄或扫描的图像)进行图像预处理以降低外部环境影响,提升字符识别处理的精确度。此外,本专利技术在分割出字符图像后统一进行归一化处理,以便于提升字符的识别精度,最后提取字符图像的字符特征信息并进行识别,从而确定字符图像的字符内容并得到字符识别的最终结果。附图说明图1为本专利技术字符识别方法一实施例的流程示意图;图2为图1中步骤S20的细化流程示意图;图3为图1中步骤S30的细化流程示意图;图4为本专利技术字符识别装置一实施例的功能模块示意图;图5为图4中分割模块的细化功能模块示意图;图6为图4中识别模块的细化功能模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。参照图1,图1为本专利技术字符识别方法一实施例的流程示意图。本实施例中,所述字符识别方法包括:步骤S10,采集带有字符的数字图像并对该数字图像进行图像预处理;本实施例中,对于数字图像的采集方式不限,例如通过各种视觉传感器(如CCD、CMOS成像设备等)采集得到数字图像并转换为易于计算机处理的格式,例如BMP格式。可选的,所述图像预处理至少包括色彩校正、图像滤波、灰度化、二值化处理。本实施例中,通过对采集的数字图像进行预处理,以便于为后续处理创造条件,提升处理效率及识别的准确度。由于图像是在各种不同的环境中或不同拍摄设备或拍摄角度下采集的,因而外界影响变化很大,进而导致识别能力下降,因而需要预先进行图像的预处理,以降低外界因素的影响,比如消除采集的数字图像中的噪声。步骤S20,从所述数字图像中分割出字符图像并进行归一化处理;一般数字图形中的字符为规则的印刷字体且其字符串的长宽比、字符之间的间隙、字符的长宽比及笔画宽度都是严格地按照一定的标准来生成的,虽然数字图像数据化后会对它上面的字符进行提取和校正时会代入一定的噪声,但字符串中原有的表示各个字符之间关系的各个参数之间的相互关系不会发生太大的变化。因此,为准确地识别数字图像上的汉字、英文字母和数字,必须把单个字符从数字图像中提取分离出来。本实施例中可根据数字图像中字符的上述相关特征,从数字图像中分割
出字符图像,例如先确定字符的上下左右边界,也即确定字符的边界线;然后再根据各字符之间的固定间隙,将字符一一分割出来。此外,为便于后续进行字符的准确识别,本实施例中进一步对分割出的多个字符图像进行归一化处理,以统一各字符图像的大小。步骤S30,提取所述字符图像的字符特征信息并进行识别,以确定所述字符图像的字符内容,得到字符识别结果。本实施例中,为提升字符识别精度,因此优选针对不同的字符类型设置对应的字符识别算法,具体将提取的字符图像的字符特征信息作为识别依据,结合预设的字符识别算法实现对字符内容的识别与确定。本实施例中优选采用基于统计方法进行识别。本实施例中通过预先对采集的数字图像(拍摄或扫描的图像)进行图像预处理以降低外部环境影响,提升字符识别处理的精确度。此外,本实施例在分割出字符图像后统一进行归一化处理,以便于提升字符的识别精度,最后提取字符图像的字符特征信息并进行识别,从而确定字符图像的字符内容并得到字符识别的最终结果。参照图2,图2为图1中步骤S20的细化流程示意图。基于上述实施例,本实施例中,上述步骤S20包括:步骤S201,采用垂直投影法从所述数字图像中分割出所述字符图像;分割数字图像中字符的方式很多,本实施例中优选采用运算较为简便且计算精度满足一定要求的垂直投影法从数字图像中分割出字符图像。由于字符在垂直方向上的投影必然在字符间或字符内的间隙处取得局部最小值的附近,并且这个位置应满足字符书写格式、字符、尺寸限制和一些其他条件,因此利用垂直投影法对复杂环境下的数字图像中的字符分割有较好的效果。进一步可选的,由于字符中经常存在空洞(比如字符6、9、A、B),从而导致字符的垂直投影具有多处波谷,进而在进行分割时难以依据波谷来确定字符的分界点。因此,在采用垂直投影法的基础上可进一步结合上下边缘投影法进行字符分割的综合判断与分析。其中,上下边缘投影是指字符上边缘与下边缘间的距离,“字符上边缘”指以像素为单位沿图像某列自上而下搜索直至遇到字符区域的第一个点,
“字符下边缘”是指以像素为单位沿图像某列自下而上搜索直至遇到字符区域的第一个点,则上下边缘投影即为字符上边缘与下边缘两者之间距离之差。由于字符内部空洞的存在,导致垂直投影中大部分都存在一个波谷,因而很难避免将单个字符分割为两个部分。而上下边缘投影具有较好的单波峰特性,对投影曲线使用分裂算法可以本文档来自技高网
...

【技术保护点】
一种字符识别方法,其特征在于,所述字符识别方法包括:采集带有字符的数字图像并对该数字图像进行图像预处理;从所述数字图像中分割出字符图像并进行归一化处理;提取所述字符图像的字符特征信息并进行识别,以确定所述字符图像的字符内容,得到字符识别结果。

【技术特征摘要】
1.一种字符识别方法,其特征在于,所述字符识别方法包括:采集带有字符的数字图像并对该数字图像进行图像预处理;从所述数字图像中分割出字符图像并进行归一化处理;提取所述字符图像的字符特征信息并进行识别,以确定所述字符图像的字符内容,得到字符识别结果。2.如权利要求1所述的字符识别方法,其特征在于,所述从所述数字图像中分割出字符图像并进行归一化处理包括:采用垂直投影法从所述数字图像中分割出所述字符图像;采用双线性插值法对所述字符图像进行归一化处理。3.如权利要求1或2所述的字符识别方法,其特征在于,所述提取所述字符图像的字符特征信息并进行识别,以确定所述字符图像的字符内容,得到字符识别结果包括:从所述字符图像中统计并提取字符的笔画斜率特征、拐点幅度特征、轮廓深度特征以及跳跃点特征;根据预先训练得到的字符分类器,分析提取到的字符特征,得到所述字符图像所对应的字符识别结果。4.如权利要求1所述的字符识别方法,其特征在于,所述图像预处理至少包括色彩校正、图像滤波、灰度化、二值化处理...

【专利技术属性】
技术研发人员:张锐
申请(专利权)人:深圳市永兴元科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1