一种字符识别方法及系统技术方案

技术编号:22239132 阅读:28 留言:0更新日期:2019-10-09 18:53
本申请公开了一种字符识别方法及系统,包括:获取待识别图片;提取待识别图片的图片特征,利用待识别图片的图片特征,对待识别图片的图片类型进行识别,从待识别图片中筛选出与预设图片类型对应的待识别图片,作为基准图片;确定基准图片中的待识别字符文本框在基准图片中的位置;依据位置,在基准图片中定位到待识别字符文本框,并对待识别字符文本框中的字符内容进行识别,得到字符内容识别结果;确定与字符内容识别结果对应的字符内容属性信息;将待识别字符文本框在所述基准图片中的位置、待识别字符文本框对应的字符内容识别结果以及字符内容属性信息进行匹配输出。提高字符识别效率。

A Character Recognition Method and System

【技术实现步骤摘要】
一种字符识别方法及系统
本专利技术涉及图像处理
,具体涉及一种字符识别方法及系统。
技术介绍
目前为了满足业务处理需求,需要对图片中的内容进行字符识别,来获取图片中的内容信息,例如对身份证信息识别、银行卡信息识别、车牌信息识别、印刷体文稿信息识别、手写体信息识别等。但在一些业务场景下,图片数据量较大、图片的类型也较多,有些图片之间毫无关系,单张图片中图像复杂,内容多,如图片中有多种证件信息,图片中还通常会存在覆盖有签字、盖章、水印等干扰信息,图片质量差异大,图片部分不完整等问题。以上问题增加了对图片进行字符识别的难度,仅仅依靠现有技术中的人工识别方法,识别效率低,基于此,如何提高字符识别效率,成为目前需要解决的技术问题。
技术实现思路
有鉴于此,本专利技术实施例提供一种字符识别方法及系统,能够提高字符识别效率。一种字符识别方法,包括:获取待识别图片;提取所述待识别图片的图片特征,利用所述待识别图片的图片特征,对所述待识别图片的图片类型进行识别,从所述待识别图片中筛选出与预设图片类型对应的待识别图片,作为基准图片;确定所述基准图片中的待识别字符文本框在所述基准图片中的位置;依据所述位置,在所述基准图片中定位到所述待识别字符文本框,并对所述待识别字符文本框中的字符内容进行识别,得到字符内容识别结果;确定与所述字符内容识别结果对应的字符内容属性信息;将所述待识别字符文本框在所述基准图片中的位置、所述待识别字符文本框对应的字符内容识别结果以及字符内容属性信息进行匹配输出。优选的,在确定所述基准图片中的待识别字符文本框在所述基准图片中的位置之前,还包括:将所述基准图片映射到二维坐标系中;在X轴方向上,统计所述基准图片中每列像素点中像素值大于预设像素值的像素点的个数,将每列像素点中像素值大于预设像素值的像素点的个数作为X轴方向上一维点集的元素坐标值;沿着X轴从原点到远端的方向,将X轴方向上一维点集的元素坐标值小于预设元素坐标值的相邻元素坐标值划分到一组中,得到第一元素组,将X轴方向上一维点集的元素坐标值大于或等于预设元素坐标值的相邻元素坐标值划分到另一组中,得到第二元素组;将任一第一元素组在X轴方向上的起始坐标值与终止坐标值作为所述基准图片在X轴方向上的分割点;在Y轴方向上,统计所述基准图片中每行像素点中像素值大于预设像素值的像素点的个数,将每行像素点中像素值大于预设像素值的像素点的个数作为Y轴方向上一维点集的元素坐标值;沿着Y轴从原点到远端的方向,将Y轴方向上一维点集的元素坐标值小于预设元素坐标值的相邻元素坐标值划分到一组中,得到第三元素组,将Y轴方向上一维点集的元素坐标值大于或等于预设元素坐标值的相邻元素坐标值划分到另一组中,得到第四元素组;将任一第三元素组在Y轴方向上的起始坐标值与终止坐标值作为所述基准图片在Y轴方向上的分割点;利用所述基准图片在X轴方向上的分割点,得到所述基准图片在X轴方向上的分割线,利用所述基准图片在Y轴方向上的分割点,得到所述基准图片在Y轴方向上的分割线;利用所述基准图片在X轴方向上的分割线以及所述基准图片在Y轴方向上的分割线,对所述基准图片进行切分,得到所述基准图片对应的切分图片。优选的,在将所述基准图片映射到二维坐标系中之前,还包括:对所述基准图片进行灰化处理,得到灰化处理后的基准图片;将灰化处理后的基准图片的像素值进行二值化处理,得到二值化处理后的基准图片;对所述二值化处理后的基准图片进行图形特征处理,得到图形特征处理后的基准图片。优选的,在得到所述基准图片对应的切分图片之后,还包括:对所述切分图片进行预设角度的旋转,使得所述切分图片中的文字方向处于预设方向。优选的,所述确定所述基准图片中的待识别字符文本框在所述基准图片中的位置的过程包括:将所述基准图片投影到二维坐标平面中;确定所述基准图片中的待识别字符文本框的四个顶点在所述基准图片中的二维坐标值。一种字符识别系统,包括:待识别图片获取模块,用于获取待识别图片;基准图片筛选模块,用于提取所述待识别图片的图片特征,利用所述待识别图片的图片特征,对所述待识别图片的图片类型进行识别,从所述待识别图片中筛选出与预设图片类型对应的待识别图片,作为基准图片;位置确定模块,用于确定所述基准图片中的待识别字符文本框在所述基准图片中的位置;字符内容识别模块,用于依据所述位置,在所述基准图片中定位到所述待识别字符文本框,并对所述待识别字符文本框中的字符内容进行识别,得到字符内容识别结果;字符内容属性信息确定模块,用于确定与所述字符内容识别结果对应的字符内容属性信息;输出模块,用于将所述待识别字符文本框在所述基准图片中的位置、所述待识别字符文本框对应的字符内容识别结果以及字符内容属性信息进行匹配输出。优选的,还包括:切分模块,所述切分模块具体用于:将所述基准图片映射到二维坐标系中;在X轴方向上,统计所述基准图片中每列像素点中像素值大于预设像素值的像素点的个数,将每列像素点中像素值大于预设像素值的像素点的个数作为X轴方向上一维点集的元素坐标值;沿着X轴从原点到远端的方向,将X轴方向上一维点集的元素坐标值小于预设元素坐标值的相邻元素坐标值划分到一组中,得到第一元素组,将X轴方向上一维点集的元素坐标值大于或等于预设元素坐标值的相邻元素坐标值划分到另一组中,得到第二元素组;将任一第一元素组在X轴方向上的起始坐标值与终止坐标值作为所述基准图片在X轴方向上的分割点;在Y轴方向上,统计所述基准图片中每行像素点中像素值大于预设像素值的像素点的个数,将每行像素点中像素值大于预设像素值的像素点的个数作为Y轴方向上一维点集的元素坐标值;沿着Y轴从原点到远端的方向,将Y轴方向上一维点集的元素坐标值小于预设元素坐标值的相邻元素坐标值划分到一组中,得到第三元素组,将Y轴方向上一维点集的元素坐标值大于或等于预设元素坐标值的相邻元素坐标值划分到另一组中,得到第四元素组;将任一第三元素组在Y轴方向上的起始坐标值与终止坐标值作为所述基准图片在Y轴方向上的分割点;利用所述基准图片在X轴方向上的分割点,得到所述基准图片在X轴方向上的分割线,利用所述基准图片在Y轴方向上的分割点,得到所述基准图片在Y轴方向上的分割线;利用所述基准图片在X轴方向上的分割线以及所述基准图片在Y轴方向上的分割线,对所述基准图片进行切分,得到所述基准图片对应的切分图片。优选的,还包括:灰化处理模块,用于对所述基准图片进行灰化处理,得到灰化处理后的基准图片;二值化处理模块,用于将灰化处理后的基准图片的像素值进行二值化处理,得到二值化处理后的基准图片;图形特征处理模块,用于对所述二值化处理后的基准图片进行图形特征处理,得到图形特征处理后的基准图片。优选的,还包括:旋转模块,用于对所述切分图片进行预设角度的旋转,使得所述切分图片中的文字方向处于预设方向。优选的,所述位置确定模块包括:位置确定子模块,所述位置确定子模块具体用于:将所述基准图片投影到二维坐标平面中;确定所述基准图片中的待识别字符文本框的四个顶点在所述基准图片中的二维坐标值。基于上述技术方案,本专利技术实施例公开了一种字符识别方法及系统,包括:获取待识别图片;提取所述待识别图片的图片特征,利用所述待识别图片的图片特征,对所述待识别图片的图片类型进行识别,从所本文档来自技高网...

【技术保护点】
1.一种字符识别方法,其特征在于,包括:获取待识别图片;提取所述待识别图片的图片特征,利用所述待识别图片的图片特征,对所述待识别图片的图片类型进行识别,从所述待识别图片中筛选出与预设图片类型对应的待识别图片,作为基准图片;确定所述基准图片中的待识别字符文本框在所述基准图片中的位置;依据所述位置,在所述基准图片中定位到所述待识别字符文本框,并对所述待识别字符文本框中的字符内容进行识别,得到字符内容识别结果;确定与所述字符内容识别结果对应的字符内容属性信息;将所述待识别字符文本框在所述基准图片中的位置、所述待识别字符文本框对应的字符内容识别结果以及字符内容属性信息进行匹配输出。

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:获取待识别图片;提取所述待识别图片的图片特征,利用所述待识别图片的图片特征,对所述待识别图片的图片类型进行识别,从所述待识别图片中筛选出与预设图片类型对应的待识别图片,作为基准图片;确定所述基准图片中的待识别字符文本框在所述基准图片中的位置;依据所述位置,在所述基准图片中定位到所述待识别字符文本框,并对所述待识别字符文本框中的字符内容进行识别,得到字符内容识别结果;确定与所述字符内容识别结果对应的字符内容属性信息;将所述待识别字符文本框在所述基准图片中的位置、所述待识别字符文本框对应的字符内容识别结果以及字符内容属性信息进行匹配输出。2.根据权利要求1所述的方法,其特征在于,在确定所述基准图片中的待识别字符文本框在所述基准图片中的位置之前,还包括:将所述基准图片映射到二维坐标系中;在X轴方向上,统计所述基准图片中每列像素点中像素值大于预设像素值的像素点的个数,将每列像素点中像素值大于预设像素值的像素点的个数作为X轴方向上一维点集的元素坐标值;沿着X轴从原点到远端的方向,将X轴方向上一维点集的元素坐标值小于预设元素坐标值的相邻元素坐标值划分到一组中,得到第一元素组,将X轴方向上一维点集的元素坐标值大于或等于预设元素坐标值的相邻元素坐标值划分到另一组中,得到第二元素组;将任一第一元素组在X轴方向上的起始坐标值与终止坐标值作为所述基准图片在X轴方向上的分割点;在Y轴方向上,统计所述基准图片中每行像素点中像素值大于预设像素值的像素点的个数,将每行像素点中像素值大于预设像素值的像素点的个数作为Y轴方向上一维点集的元素坐标值;沿着Y轴从原点到远端的方向,将Y轴方向上一维点集的元素坐标值小于预设元素坐标值的相邻元素坐标值划分到一组中,得到第三元素组,将Y轴方向上一维点集的元素坐标值大于或等于预设元素坐标值的相邻元素坐标值划分到另一组中,得到第四元素组;将任一第三元素组在Y轴方向上的起始坐标值与终止坐标值作为所述基准图片在Y轴方向上的分割点;利用所述基准图片在X轴方向上的分割点,得到所述基准图片在X轴方向上的分割线,利用所述基准图片在Y轴方向上的分割点,得到所述基准图片在Y轴方向上的分割线;利用所述基准图片在X轴方向上的分割线以及所述基准图片在Y轴方向上的分割线,对所述基准图片进行切分,得到所述基准图片对应的切分图片。3.根据权利要求2所述的方法,其特征在于,在将所述基准图片映射到二维坐标系中之前,还包括:对所述基准图片进行灰化处理,得到灰化处理后的基准图片;将灰化处理后的基准图片的像素值进行二值化处理,得到二值化处理后的基准图片;对所述二值化处理后的基准图片进行图形特征处理,得到图形特征处理后的基准图片。4.根据权利要求2所述的方法,其特征在于,在得到所述基准图片对应的切分图片之后,还包括:对所述切分图片进行预设角度的旋转,使得所述切分图片中的文字方向处于预设方向。5.根据权利要求1所述的方法,其特征在于,所述确定所述基准图片中的待识别字符文本框在所述基准图片中的位置的过程包括:将所述基准图片投影到二维坐标平面中;确定所述基准图片中的待识别字符文本框的四个顶点在所述基准图片中的二维坐标值。6.一种字符识别系统,其特征在于,包括:待...

【专利技术属性】
技术研发人员:李红波张然赵存超杜俊
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1