图像识别方法及系统技术方案

技术编号:12476713 阅读:116 留言:0更新日期:2015-12-10 12:45
本发明专利技术公开了一种图像识别方法及系统,其中,该图像识别方法包括:S1、从待识别的图片中获取该图片包含的图像;S2、将该图像切分成若干切片,每个切片包含一个字符;S3、根据每一切片的像素点,分别计算每一切片对应的形状上下文;S4、根据形状上下文的特征值进行搜索,找到与切片所包含的字符最接近的样本作为识别结果。本发明专利技术能够弥补现有技术中对变形字或手写体字符等特殊字符的识别不准确的不足,对具有缩放、旋转、重叠和扭曲的特殊字符进行准确地识别,减少所需的样本文件,减少识别所需的时间,提高识别效率。

【技术实现步骤摘要】

本专利技术涉及图像识别领域,尤其涉及一种图像识别方法及系统
技术介绍
目前,计算机软件在进行字符识别时通常是使用标准OCR(光学字符识别)或者模 板进行匹配,这些方案都只能处理标准字符,而且需要提供大量的样本库文件,无法对具有 缩放、旋转、重叠和扭曲的字符进行识别,这使得现有技术对变形字或手写体字符等特殊字 符的识别存在很大难度,并且缺少准确性。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中对变形字或手写体字符等特殊 字符的识别不准确的缺陷,提供一种图像识别方法及系统。 本专利技术是通过以下技术方案解决上述技术问题的: 本专利技术提供一种图像识别方法,其特点是,该图像识别方法包括: S1、从待识别的图片中获取该图片包含的图像; S2、将该图像切分成若干切片,每个切片包含一个字符; S3、根据每一切片的像素点,分别计算每一切片对应的形状上下文; S4、根据形状上下文的特征值进行搜索,找到与切片所包含的字符最接近的样本 作为识别结果。 本技术方案基于形状上下文自动识别图片中的字符,具有很高的识别准确性,同 时,本技术方案还不需要预存大量的样本文件,能够减少的样本文本的存储量,提高识别效 率。 较佳地,步骤S1包括: Sn、将待识别的图片进行灰度处理; S12、将灰度处理后的图片进行二值化处理; S13、对二值化处理后的图片包含的图像进行描边处理; S14、去除该图像中孤立的像素点; S15、补齐该图像的边缘。 本技术方案对待识别的图片进行了预处理,预处理主要是为了方便后续的切分和 减少后续识别中的干扰因素,其中,步骤S 15能够去除干扰因素,提高识别的准确率。 较佳地,S2包括: S21、根据联通分量将该图像切分成X个切片,X为正整数; S22、若X等于该图像包含的字符数,则执行S3,若X小于该图像包含的字符数,则根 据横向投影将该X个切片切分成若干个切片。 本技术方案可以更准确的切分,保证待识别的字符完整性,提高重叠字符识别的 准确率。 较佳地,S3包括对每一切片分别执行以下步骤: S31、将切片中每一像素点分别转换成对数极坐标; S32、将每一对数极坐标分别转换为一维矩阵; S33、将所有的一维矩阵合并成一 m*n的二维矩阵,m为切片的像素点数,η为一维 矩阵的长度,该m*n的二维矩阵为切片对应的形状上下文。 其中,极坐标的使用可以忽略字符的旋转对识别字符造成的影响,提高识别的准 确性。 较佳地,S31包括: S311、将待转换为对数极坐标的像素点作为极坐标的圆心,半径为切片中像素点之 间的最大距离,并对半径进行归一化处理。 其中,对极坐标进行归一化处理可以将转换成极坐标的集合等比例压缩在半径为 1的极坐标集合中,忽略字符的缩放对识别字符造成的影响,提高识别的准确性。 较佳地,S32通过以下步骤将对数极坐标转换为一维矩阵: S321、将极坐标圆的半径和角度进行等量划分; S322、根据划分后每个区域内的像素点数得出二维矩阵; S323、将S322得到的二维矩阵转化成一维矩阵; S324、将一维矩阵进行一维傅里叶变换。 其中,S324可以忽略字符的扭曲变形对识别字符造成的影响,提高识别的准确性。 较佳地,S4包括: S41、根据形状上下文的特征值在样本库中进行搜索,利用匈牙利算法进行二分图 匹配,找到距离最近的样本作为识别结果。 传统的匹配算法是简单的根据每个点的比较去进行匹配,存在一对多的匹配,而 且无法区分具有包含关系的字符,如:6和9, 3和8等。而本技术方案使用的匈牙利算法保 证只存在一对一匹配,而且通过极坐标的半径和角度的奇数划分可以轻松的区分具有包含 关系的字符,提尚字符识别的准确率。在本技术方案中,匈牙利算法既可以提尚准确率,还 可以减少识别的时间(时间复杂度为O(VE)),提高效率。 本专利技术还提供一种图像识别系统,其特点是,该图像识别系统包括: -获取单元,用于从待识别的图片中获取该图片包含的图像; -切分单元,用于将该图像切分成若干切片,每个切片包含一个字符; -计算单元,用于根据每一切片的像素点,分别计算每一切片对应的形状上下 文; -识别单元,用于根据形状上下文的特征值进行搜索,找到与切片所包含的字符 最接近的样本作为识别结果。 较佳地,该获取单元包括: -灰度处理模块,用于将待识别的图片进行灰度处理; -二值化处理模块,用于将灰度处理后的图片进行二值化处理; 一描边模块,用于对二值化处理后的图片包含的图像进行描边处理; -去除模块,用于去除该图像中孤立的像素点; -图像生长模块,用于补齐该图像的边缘。 较佳地,该切分单元包括: -切片模块,用于根据联通分量将该图像切分成X个切片,X为正整数; -比较模块,用于在X等于该图像包含的字符数时调用该计算单元,以及在X小于 该图像包含的字符数时根据横向投影将该X个切片切分成若干个切片。 较佳地,该计算单元用于对每一切片分别调用以下模块: 一坐标转换模块,用于将切片中每一像素点分别转换成对数极坐标; -矩阵转换模块,用于将每一对数极坐标分别转换为一维矩阵; -矩阵合并模块,用于将所有的一维矩阵合并成一 m*n的二维矩阵,m为切片的像 素点数,η为一维矩阵的长度,该m*n的二维矩阵为切片对应的形状上下文。 较佳地,该坐标转换模块还用于将待转换为对数极坐标的像素点作为极坐标的圆 心,半径为切片中像素点之间的最大距离,并对半径进行归一化处理。 较佳地,该矩阵转换模块包括: -划分模块,用于将极坐标圆的半径和角度进行等量划分; -二维矩阵生成模块,用于根据划分后每个区域内的像素点数得出二维矩阵; --维矩阵生成模块,用于将该二维矩阵生成模块得到的二维矩阵转化成一维矩 阵; -傅里叶变换模块,用于将一维矩阵进行一维傅里叶变换。 较佳地,该识别单元包括: -匹配模块,用于根据形状上下文的特征值在样本库中进行搜索,利用匈牙利算 法进行二分图匹配,找到距离最近的样本作为识别结果。 在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本专利技术各较佳实 例。 本专利技术的积极进步效果在于:对具有缩放、旋转、重叠和扭曲的手写体字符或变形 字符等特殊字符进行准确地识别,减少所需的样本文件,减少识别所需的时间,提高识别效 率。【附图说明】 图1为本专利技术的实施例的图像识别方法的流程图。当前第1页1 2 3 本文档来自技高网...

【技术保护点】
一种图像识别方法,其特征在于,该图像识别方法包括:S1、从待识别的图片中获取该图片包含的图像;S2、将该图像切分成若干切片,每个切片包含一个字符;S3、根据每一切片的像素点,分别计算每一切片对应的形状上下文;S4、根据形状上下文的特征值进行搜索,找到与切片所包含的字符最接近的样本作为识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:何晓力张勇李可玮
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1