一种基于特征匹配的安卓手机身份证字符识别方法技术

技术编号:16129573 阅读:44 留言:0更新日期:2017-09-01 21:14
本发明专利技术公开了一种基于特征匹配的安卓手机身份证字符识别方法,特别是结合欧式距离提取汉字外围特征进行一级区分、提取汉字笔划穿越次数特征进行二级区分、提取汉字网格特征进行最终识别的方法,属于图像处理与字符识别的技术领域。本发明专利技术先对采集图像进行预处理,在此基础上使用Hough变换找直线和透视变换分割出目标身份证图像。在分割出的身份证图像上,利用固定的比例坐标,分割出姓名、性别、身份证号的区域图像,对这三个图像分别进行二值化,使用投影法进行字符分割,得到待识别汉字的图像集合。最后对二值化和归一化后的标准字库和待识别汉字图像提取特征,利用特征匹配的方法,完成字符识别。

【技术实现步骤摘要】
一种基于特征匹配的安卓手机身份证字符识别方法
本专利技术公开了一种基于特征匹配的安卓手机身份证字符识别方法,特别是结合欧式距离提取汉字外围特征进行一级区分、提取汉字笔划穿越次数特征进行二级区分、提取汉字网格特征进行最终识别的方法,属于图像处理与字符识别的

技术介绍
目前身份证的信息大多需要人工录入,效率十分低下,而且长时间的识别过程也会使人眼疲劳。所以该方法已经不适应于当今计算机等领域飞速发展的现状。现如今安卓手机在人群中应用广泛,研究安卓手机如何自动读取身份证信息是十分必要的,可以有效地克服人工识别的局限性,且具有识别效率高、识别准确度高的优点。身份证姓名汉字识别属于印刷体汉字识别的范围。印刷体汉字的识别最早追溯到20世纪60年代。经过这么多年发展,现有的印刷体汉字识别方法有结构模式识别方法、统计模式识别方法、结构模式识别和统计模式识别相结合的方法、人工神经网络方法、仿人视觉的识别方法等。其中,常用的统计模式识别方法有模板匹配、利用变换特征的方法、利用笔画方向特征的方法、利用外围特征的方法、利用特征点特征的方法。基于特征匹配的安卓手机身份证字符识别是通过对采集的含有身份证的图像进行识别来获取姓名、性别、身份证号等信息。安卓手机身份证字符识别技术主要涉及身份证图像采集,采集图像处理,身份证分割,字符分割,特征提取,特征匹配等步骤。
技术实现思路
专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种基于特征匹配的安卓手机身份证字符识别方法,解决现有的身份证字符识别方法较为复杂的问题。技术方案:一种基于特征匹配的安卓手机身份证字符识别方法,包括步骤:步骤1:通过安卓手机摄像头采集身份证图像;步骤2:对步骤1采集的身份证图像进行预处理;然后利用Hough变换检测直线;通过直线找交点,透视变换分割出宽和高的比例在1.49至1.69区间的无背景身份证图像;步骤3:根据姓名、性别、身份证号三个信息区域在身份证上位置固定,利用比例坐标,分割出以上三个区域图像;步骤4:对步骤3分割出的三个区域图像分别进行二值化,使用投影法进行字符分割,然后对分割后的字符进行归一化处理;步骤5:在步骤4的基础上提取待识别姓名汉字图像的特征向量,依次提取汉字外围特征、提取笔划穿越次数特征及提取汉字网格特征,分别提取性别和身份证号两部分图像的网格特征;步骤6:对标准字库中的汉字、0至9的10个数字和英文字母x的二值图像使用投影法进行字符分割,然后对各字符归一化,进而提取出各字符的特征向量,构成标准字库;步骤7:根据步骤5提取的待识别图像的特征向量与标准字库中个字符的特征向量的差距大小进行特征匹配,完成字符识别。所述步骤2中对采集的身份证图像进行预处理,具体为:首先将输入图像按公式GrayValue=(306*R+601*G+117*B)>>10计算各像素的灰度值,然后将灰度图像缩放成像素341*256的图像,再对缩放后的灰度图像进行中值滤波,最后对图像进行自适应Canny边缘检测。所述步骤2通过直线找交点,透视变换分割出宽和高的比例在1.49至1.69区间的无背景身份证图像具体为:步骤21:对于Hough变换得到的直线集合,分别对位置在图像上1/5处、下1/5处、左1/5处、右1/5处的直线进行同一条直线的连接处理;具体为:(1)当一条直线L1在图像右1/5处时,若一条直线L2满足:a.L2倾斜角度与L1夹角在5度以内;b.两条直线列间距在3个像素点以内;c.两条直线行间距在30个像素点以内;d.两条直线的长度均大于7个像素点,则将两条直线连在一起;(2)当一条直线L3在图像左1/5处时,若一条直线L4满足:a.L4倾斜角度与L3夹角在5度以内;b.两条直线列间距在3个像素点以内;c.两条直线行间距在30个像素点以内;d.两条直线的长度均大于7个像素点,则将两条直线连在一起;(3)当一条直线L5在图像上1/5处时,若一条直线L6满足:a.L5倾斜角度与L6夹角在5度以内;b.两条直线行间距在3个像素点以内;c.两条直线列间距在30个像素点以内;d.两条直线的长度均大于7个像素点,则将两条直线连在一起;(4)当一条直线L7在图像下1/5处时,若一条直线L8满足:a.L7倾斜角度与L8夹角在5度以内;b.两条直线行间距在3个像素点以内;c.两条直线列间距在30个像素点以内;d.两条直线的长度均大于7个像素点,则将两条直线连在一起;步骤22:在连接后的直线集合中,需要找到身份证外围的四条直线;最后由找到的四条直线求出在预处理后图像中身份证的四个顶点坐标,由缩放比例可得在采集图像中身份证四个顶点的坐标,过程如下:(1)分别在在预处理后图像的上1/5和下1/5内,找到与水平的夹角在0度至20度区间的最长线;(2)分别在预处理后图像的左1/5和右1/5内,找到与竖直线相交角度在0度到20度区间的最长线;步骤23:由透视变换,在采集图像中分割出宽和高比例在1.49至1.69区间的无背景身份证图像,并且解决图像因采集而产生的图像畸变问题。所述投影法字符分割具体过程如下:(1)先从上到下统计每行像素值为0的像素点个数,找到个数为0的行,如果此时出现连续个数为0的行,则找出连续行的行号的中间值,由此得到分割行的行号其中,行号表示这一行为图像中的第几行;(2)在姓名区域彩色图像上进行行分割;(3)对行分割后的二值图,从左到右统计每列像素值为0的像素点个数,找到个数为0的列,如果此时出现连续个数为0的列的列号,则找出连续列的列号的中间值,由此得到分割列的列号;其中,列号表示这一列为图像中的第几列;(4)在行分割后的姓名区域彩色图像上进行列分割。所述归一化处理为:(1)先从上到下统计每行像素值为0的像素点个数,在其中,找出第一个不为0的行号和最后一个不为0的行号;(2)从左到右统计每列像素值为0的像素点个数,在其中,找出第一个不为0的列号和最后一个不为0的列号;(3)由(1)(2),在单个字符二值图像中,分割出满足要求的图像:第一行、最后一行,第一列,最后一列像素值为0的像素点个数均不等于0。提取汉字外围特征具体过程如下:(1)计算每一行从图像左边缘至第一次遇到黑像素的长度P1i,i=1,2,3...,50;(2)计算每一行从图像左边缘第一次遇到黑像素结束至第二次遇到黑像素的长度P2i(i=1,2,3...,50);(3)仿照上述两步,提取其它三个边缘的特征;(4)根据上述方法可以提取出一个50*2*4=400维的外围特征。提取笔划穿越次数特征具体提取过程如下:(1)分别从图像的1/4和3/4处进行水平和垂直穿越,得到一组特征值Ai=(a1,a2,a3,a4),其中,a1,a2分别代表水平方向1/4处和3/4处的穿越次数,a3,a4分别代表垂直方向1/4处和3/4处的穿越次数;(2)对图像进行水平半穿越,把h上左处到v中上处的笔划穿越次数h1,v中上处到h上右处的笔划穿越次数h2,h下左处到v中下处的笔划穿越次数h3,v中下处到h下右处的笔划穿越次数h4作为一组特征值,A2=(h1,h2,h3,h4);(3)同理,得到垂直方向上的特征值,即A3=(v1,v2,v3,v4)。其中,v1代表v左上处到h中左处的笔划穿越次数,v2代表h中左本文档来自技高网...
一种基于特征匹配的安卓手机身份证字符识别方法

【技术保护点】
一种基于特征匹配的安卓手机身份证字符识别方法,其特征在于:包括步骤:步骤1:通过安卓手机摄像头采集身份证图像;步骤2:对步骤1采集的身份证图像进行预处理;然后利用Hough变换检测直线;通过直线找交点,透视变换分割出宽和高的比例在1.49至1.69区间的无背景身份证图像;步骤3:根据姓名、性别、身份证号三个信息区域在身份证上位置固定,利用比例坐标,分割出以上三个区域图像;步骤4:对步骤3分割出的三个区域图像分别进行二值化,使用投影法进行字符分割,然后对分割后的字符进行归一化处理;步骤5:在步骤4的基础上提取待识别姓名汉字图像的特征向量,依次提取汉字外围特征、提取笔划穿越次数特征及提取汉字网格特征,分别提取性别和身份证号两部分图像的网格特征;步骤6:对标准字库中的汉字、0至9的10个数字和英文字母x的二值图像使用投影法进行字符分割,然后对各字符归一化,进而提取出各字符的特征向量,构成标准字库;步骤7:根据步骤5提取的待识别图像的特征向量与标准字库中个字符的特征向量的差距大小进行特征匹配,完成字符识别。

【技术特征摘要】
1.一种基于特征匹配的安卓手机身份证字符识别方法,其特征在于:包括步骤:步骤1:通过安卓手机摄像头采集身份证图像;步骤2:对步骤1采集的身份证图像进行预处理;然后利用Hough变换检测直线;通过直线找交点,透视变换分割出宽和高的比例在1.49至1.69区间的无背景身份证图像;步骤3:根据姓名、性别、身份证号三个信息区域在身份证上位置固定,利用比例坐标,分割出以上三个区域图像;步骤4:对步骤3分割出的三个区域图像分别进行二值化,使用投影法进行字符分割,然后对分割后的字符进行归一化处理;步骤5:在步骤4的基础上提取待识别姓名汉字图像的特征向量,依次提取汉字外围特征、提取笔划穿越次数特征及提取汉字网格特征,分别提取性别和身份证号两部分图像的网格特征;步骤6:对标准字库中的汉字、0至9的10个数字和英文字母x的二值图像使用投影法进行字符分割,然后对各字符归一化,进而提取出各字符的特征向量,构成标准字库;步骤7:根据步骤5提取的待识别图像的特征向量与标准字库中个字符的特征向量的差距大小进行特征匹配,完成字符识别。2.根据权利要求1所述的安卓手机身份证字符识别方法,其特征在于:所述步骤2中对采集的身份证图像进行预处理,具体为:首先将输入图像按公式GrayValue=(306*R+601*G+117*B)>>10计算各像素的灰度值,然后将灰度图像缩放成像素341*256的图像,再对缩放后的灰度图像进行中值滤波,最后对图像进行自适应Canny边缘检测。3.根据权利要求1所述的安卓手机身份证字符识别方法,其特征在于:所述步骤2通过直线找交点,透视变换分割出宽和高的比例在1.49至1.69区间的无背景身份证图像具体为:步骤21:对于Hough变换得到的直线集合,分别对位置在图像上1/5处、下1/5处、左1/5处、右1/5处的直线进行同一条直线的连接处理;具体为:(1)当一条直线L1在图像右1/5处时,若一条直线L2满足:a.L2倾斜角度与L1夹角在5度以内;b.两条直线列间距在3个像素点以内;c.两条直线行间距在30个像素点以内;d.两条直线的长度均大于7个像素点,则将两条直线连在一起;(2)当一条直线L3在图像左1/5处时,若一条直线L4满足:a.L4倾斜角度与L3夹角在5度以内;b.两条直线列间距在3个像素点以内;c.两条直线行间距在30个像素点以内;d.两条直线的长度均大于7个像素点,则将两条直线连在一起;(3)当一条直线L5在图像上1/5处时,若一条直线L6满足:a.L5倾斜角度与L6夹角在5度以内;b.两条直线行间距在3个像素点以内;c.两条直线列间距在30个像素点以内;d.两条直线的长度均大于7个像素点,则将两条直线连在一起;(4)当一条直线L7在图像下1/5处时,若一条直线L8满足:a.L7倾斜角度与L8夹角在5度以内;b.两条直线行间距在3个像素点以内;c.两条直线列间距在30个像素点以内;d.两条直线的长度均大于7个像素点,则将两条直线连在一起;步骤22:在连接后的直线集合中,需要找到身份证外围的四条直线;最后由找到的四条直线求出在预处理后图像中身份证的四个顶点坐标,由缩放比例可得在采集图像中身份证四个顶点的坐标,过程如下:(1)分别在在预处理后图像的上1/5和下1/5内,找到与水平的夹角在0度至20度区间的最长线;(2)分别在预处理后图像的左1/5和右1/5内,找到与竖直线相交角度在0度到20度区间的最长线;步骤23:由透视变换,在采集图像中分割出宽和高比例在1.49至1.69区间的无背景身份证图像,并且解决图像因采集而产生的图像畸变问...

【专利技术属性】
技术研发人员:刘宁钟李志杰袁鹏泰
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1