当前位置: 首页 > 专利查询>李阳专利>正文

一种字符识别方法及系统技术方案

技术编号:20364300 阅读:53 留言:0更新日期:2019-02-16 17:09
公开了一种字符识别方法及系统。所述方法及系统包括:1)输入字符图像;2)对所述图像进行预处理;3)利用OCR框架进行字符处理;4)识别字符;5)输出字符识别结果。本发明专利技术通过对图像进行预处理,获得降噪后的图像,利用模板匹配算法进行字符识别,实现了识别率的大幅提升。

【技术实现步骤摘要】
一种字符识别方法及系统
本专利技术涉及字符识别领域,更具体地,涉及一种字符识别方法及系统。
技术介绍
字符是人类文明发展历史的产物,是人类沟通的工具。字符识别是一个模板识别领域的大多数主题都可以满足最基本的问题。字符识别是一个利用计算机和图像处理技术在各个领域起着重要的作用。工业使用字符识别是非常重要的,它的发展水平已经吸引到了图像界的关注,原因在于:一方面,字符识别技术的发展是非常困难的,难度不仅在于字符图像识别系统,在于实际应用的复杂性和应用部门成本承受能力;另一方面,图像识别发展的效益非常显著,其实际应用系统将产生巨大的经济效益和社会效益。例如,车牌号码识别、手写字符识别,字符识别技术已广泛应用于电脑、手机。在国外,车牌识别作为字符识别的应用领域,技术成熟,但在我国,车牌识别技术的研究主要集中在各种各样的车牌定位、字符分割和识别算法进行了研究。为促进图片的识别率的提升,在框架中已经提供好了相应的字符识别算法,但是识别率比较低,因为框架只是提供的基础服务,它需要面对不同的大众,所以不能进行很完美很精确的识别,需要针对不同的应用场景进行不同的图像处理,然后再调用基础框架来进行字符识别。因此,有必要开发一种字符识别方法及系统。公开于本专利技术
技术介绍
部分的信息仅仅旨在加深对本专利技术的一般
技术介绍
的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
技术实现思路
本专利技术提出了一种字符识别方法及系统,其能够通过对图像进行预处理,获得降噪后的图像,利用模板匹配算法进行字符识别,实现了识别率的大幅提升。根据本专利技术的一方面,提出了一种字符识别方法。所述方法可以包括:1)输入字符图像;2)对所述图像进行预处理;3)利用OCR框架进行字符处理;4)识别字符;5)输出字符识别结果。优选地,所述预处理包括图像二值化处理。优选地,所述预处理包括图像锐化处理。优选地,所述预处理包括图像中值滤波处理。优选地,所述预处理包括线性灰度变换。优选地,所述预处理还包括黑白图转换。优选地,所述OCR框架处理包括:3-1)输入待处理的字符图像;3-2)提取字符图像特征;3-3)将所述字符图像特征与样本库特征进行匹配;3-4)基于特征匹配识别字符。优选地,通过以下方式进行特征提取:3-2-1)搜索字符区域,找出字符区域的上、下、左、右边界;3-2-2)将字符区域平均分成n*n的小区域;3-2-3)计算每个区域中像素的所占比例,获得特征结果。根据本专利技术的另一方面,提出了一种字符识别系统,其上存储有计算机程序,其中,所述程序被处理器执行时实现以下步骤:步骤1:输入字符图像;步骤2:对所述图像进行预处理;步骤3:利用OCR框架进行字符处理;步骤4:识别字符;步骤5:输出字符识别结果。优选地,所述OCR框架处理包括:步骤3-1:输入待处理的字符图像;步骤3-2:提取字符图像特征;步骤3-3:将所述字符图像特征与样本库特征进行匹配;步骤3-4:基于特征匹配识别字符。本专利技术的有益效果在于,通过对图像的预处理,获得噪声极低的识别图像,利用模板匹配识别字符,大幅度提升了字符识别的速度。本专利技术具有其它的特性和优点,这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的,或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述,这些附图和具体实施方式共同用于解释本专利技术的特定原理。附图说明通过结合附图对本专利技术示例性实施例进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显,其中,在本专利技术示例性实施例中,相同的参考标号通常代表相同部件。图1示出了根据本专利技术的字符识别方法的步骤的流程图;图2示出了中值滤波算法原理示意图;图3示出了特征提取的实验图;图4示出了根据本专利技术的字符识别系统的应用界面示意图。具体实施方式下面将参照附图更详细地描述本专利技术。虽然附图中显示了本专利技术的优选实施例,然而应该理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本专利技术更加透彻和完整,并且能够将本专利技术的范围完整地传达给本领域的技术人员。图1示出了根据本专利技术的字符识别方法的步骤的流程图。在该实施例中,根据本专利技术的字符识别方法可以包括:S1,字符图像输入;S2,图像预处理;在一个示例中,所述图像预处理包括图像二值化处理。具体地,图像二值化处理的图像灰度设置为0或255,或整个图像黑白效果明显。大约256个亮度等级的灰度图像通过适当的阈值选择和可以反映整体形象和地方特色的二进制图像。为了得到理想的二进制图像,一般不使用封闭的边界和连接定义重叠区域。所有灰度等于或大于阈值的像素被归类为属于一个特定的对象,灰度值是255,否则,说这些像素被排除在区域灰度值是0,表示背景或异常对象区域。在一个示例中,所述图像预处理包括图像锐化处理。具体地,图像的平滑往往是在图像的模糊边界,为了减少这种负面影响的影响,这需要使用图像锐化技术,使图像的边缘是明确的。图像锐化处理,使图像的边缘、轮廓和细节的目的是图像的清晰,平滑的图像模糊的根本原因是图像收到平均或积分操作,因此在逆操作(如微分操作)可以使图像清晰。图像频域考虑,因为高频分量的衰减的本质是模糊,因此高通滤波器可以使图像清晰。在一个示例中,所述图像预处理还包括图像中值滤波处理。具体地,值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术,中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近的真实值,从而消除孤立的噪声点。方法是用某种结构的二维滑动模板,将板内像素按照像素值的大小进行排序,生成单调上升(或下降)的为二维数据序列。二维中值滤波输出为g(x,y)=med{f(x-k,y-l),(k,l∈W)},其中,f(x,y),g(x,y)分别为原始图像和处理后图像。W为二维模板,通常为3*3,5*5区域,也可以是不同的的形状,如线状,圆形,十字形,圆环形等。本专利技术采用的中值滤波算法原理如图2所示,通过从图像中的某个采样窗口取出奇数个数据进行排序,用排序后的中值取代所有要进行处理的数据。在一个示例中,所述图像预处理包括线性灰度变换处理。具体地,灰度的线性变换就是将图像中所有的点按照线性灰度变换函数进行变换。该线性灰度变换函数f(x)是一个一维线性函数:f(x)=fA*x+fB灰度变换方程为:D2=f(D1)=fA*D+fB式中参数fA为线性函数的斜率,fB为线性函数的在y轴上的截距,D1为输入图像的灰度,D2为输出的图像灰度。当fA>1时,输出的图像的对比度增大;当fA<1时,输出图像的对比度将减小;当fA=1且fB!=0时,操作仅仅使所有像素的灰度值上移或下移,其效果是使整个图像更亮或更暗;特殊情况下,如果fA=1,fB=0时,输出图像和输入图像相同;当fA=-1,fB=255时,输出图像的灰度正好反转。在一个示例中,所述图像预处理还包括黑白图转换。具体地,所述黑白图转换采用java已经封装好的算法进行转换,所述算法函数为grayFilter()。S3,OCR框架处理;在一个示例中,所述OCR框架处理包括:3-1)输入待处理的字符图像;3-2)提取字符图像特征;3-3本文档来自技高网...

【技术保护点】
1.一种字符识别方法,其特征在于,包括:1)输入字符图像;2)对所述图像进行预处理;3)利用OCR框架进行字符处理;4)识别字符;5)输出字符识别结果。

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:1)输入字符图像;2)对所述图像进行预处理;3)利用OCR框架进行字符处理;4)识别字符;5)输出字符识别结果。2.根据权利要求1所述的字符识别方法,其特征在于,在步骤2)中,所述预处理包括图像二值化处理。3.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤2)中,所述预处理包括图像锐化处理。4.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤2)中,所述预处理包括图像中值滤波处理。5.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤2)中,所述预处理包括线性灰度变换。6.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤2)中,所述预处理还包括黑白图转换。7.根据权利要求1所述的所述的字符识别方法,其特征在于,在步骤3)中,所述OCR框架处理包括:3-1)输入待处理的字符图像;3-2)提取字符图像特征;3-...

【专利技术属性】
技术研发人员:李阳
申请(专利权)人:李阳
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1