本发明专利技术公开了基于深度学习的卡号识别方法及系统,本发明专利技术的方法包括:步骤S1,对原始数据集进行数据增强以得到扩充数据集;步骤S2,对扩充数据集中的数据通过合成的方式拟合,形成训练数据集;步骤S3,对步骤S2获得的训练数据集进行标签化处理,得到训练样本集;步骤S4,采用步骤S3获得的训练样本集对深度学习模型进行训练,得到卡号识别模型;步骤S5,利用卡号识别模型对待识别图片进行卡号识别。本发明专利技术的方法采用深度学习技术,不但省去了传统方法中繁杂的预处理和后处理工作,而且受外界环境的影响程度大大降低,不仅能够识别“清晰、端正的图片”,也能识别“倾斜、相对模糊的图片”,极大地提高了卡号的识别效果。
【技术实现步骤摘要】
基于深度学习的卡号识别方法及系统
本专利技术涉及人工智能、计算机图像处理等
,具体的,涉及基于深度学习的卡号识别方法及系统。
技术介绍
近几年来我国互联网金融飞速发展,网上资金交易逐渐成为日常生活中的主要消费方式。随着移动互联的发展,商业移动应用越来越多,移动支付成为最主流的支付方式之一,这些商业移动应用很多涉及到个人银行卡账户的绑定,如手机支付绑定银行卡、银行进行业务前,都需要提供银行卡,扫描银行卡,进行卡号认证操作等,而实际测试中手动输入16-19位银行卡号码,速度慢,易出错,用户体验非常差。目前银行卡识别主要采用的技术为传统OCR识别技术。OCR即光学字符识别(OpticalCharacterRecognition),是将印刷体字符识别为电子文本的一项技术。目前主流的OCR识别技术,先要对图像进行清晰度判断、版面分析、直方图均衡、灰度化、二值化、倾斜校正、字符切割等预处理,得到端正、清晰的单个字符图像;再用字符模板;最后通过后模板匹配等方式,输出文本结果。由于这种方法过于依赖图像处理算法以便在不同场景下对图像进行适应性调整和处理,对纸张的摆放位置、拍照的光线环境、扫描仪的精度等外界环境有较高要求,很大程度上限制了文字识别正确率的提升。
技术实现思路
为了解决现有的卡号识别技术受到外界环境影响,导致识别效果和识别速率受限制的技术问题,本专利技术提出了一种基于深度学习的卡号识别方法,本专利技术采用深度学习技术,使卡号识别正确率及效率均有了很大提升。本专利技术通过下述技术方案实现:基于深度学习的卡号识别方法,该方法包括以下步骤:步骤S1,对原始数据集进行数据增强以得到扩充数据集;步骤S2,对扩充数据集中的数据通过合成的方式拟合,形成训练数据集;步骤S3,对步骤S2获得的训练数据集进行标签化处理,得到训练样本集;步骤S4,采用步骤S3获得的训练样本集对深度学习模型进行训练,得到卡号识别模型;步骤S5,利用卡号识别模型对待识别图片进行卡号识别。优选的,本专利技术的步骤S1具体包括以下步骤:步骤S11,采用数据增强工具对原始数据集进行随机旋转、平移、填充和颜色变化处理,以扩充原始数据集;步骤S12,对扩充后的原始数据集中的图像数据添加椒盐噪声和高斯模糊处理,得到扩充数据集。优选的,本专利技术的步骤S2具体包括以下步骤:步骤S21,在扩充数据集中顺序取出1张图片与随机选取的4张图片横向拼接在一起,将拼接之后的图片进行放大或缩小处理,之后将其合成进一张800*100的背景图片中;步骤S22,重复步骤S21,直到顺序取出所有图片进行拼接拟合,生成训练数据集。优选的,本专利技术的步骤S5具体包括以下步骤:步骤S51,对输入的原始图片中的卡号进行定位提取,得到待识别图片:步骤S52,利用卡号识别模型对待识别图片进行识别。优选的,本专利技术的步骤S51具体包括以下步骤:步骤S511,输入待识别的原始图片,并提取图片中的兴趣区域,将提取的兴趣区域进行灰度化处理;步骤S512,对灰度化处理之后的图片进行形态学顶帽操作,凸显卡号行;步骤S513,在X方向上计算Sobel值,凸出卡号边缘;步骤S514,在凸出卡号边缘之后进行形态学闭操作,使得卡号区域粘连;步骤S515,在形态学闭操作之后进行循环二值化处理,直到白色像素点占比在0.2~0.6之间;步骤S516,对二值化处理之后的图像进行均值滤波,去除孤立的像素块,之后进行第二次形态学闭操作;步骤S517,在第二次形态学闭操作之后,计算横向投影,根据横向的平均像素值的1.5倍对行进行去噪处理;之后查找卡号行区域上下两端坐标y1和y2;步骤S518,在行去躁处理之后,去除卡号行上下两侧无用像素和干扰像素;计算纵向投影,清除独立的小像素块;之后查找卡号列区域左右两端的坐标x1和x2步骤S519,由x1、x2、y1、y2构成初始卡号区域,对初始卡号区域进行微调得到卡号区域;对卡号区域进行裁剪与合成待识别图片。优选的,本专利技术的步骤S4中采用的深度学习模型为darknet-yolov3模型。优选的,本专利技术的步骤S3具体包括以下步骤:步骤S31,将训练数据集中的图片数据生成一一对应的标签数据;步骤S32,将步骤S31生成的标签数据的格式转换成yolo标签数据格式;步骤S33,训练数据集中的图片数据以及对应的yolo标签数据格式的标签数据构成训练样本集。优选的,本专利技术的步骤S32中的yolo标签数据格式为:<object-class><x_center><y_center><width><height>;其中,object-class表示标注的物体类型,x_center和<y_center>表示标注框归一化后的中心坐标,<width>和<height>表示标注框归一化后的宽和高。另一方面,本专利技术还提出了基于深度学习的卡号识别系统,该识别系统包括服务器,所述服务器用于接收采集到的带有卡号的图片,并采用上述基于深度学习的卡号识别方法对图片上的卡号进行识别及输出。优选的,本专利技术的卡号识别系统还包括至少一个客户端,所述至少一个客户端用于采集图片数据并将其发送给服务器,所述至少一个客户端还用于接收服务器反馈的识别结果。本专利技术与现有技术相比,具有如下的优点和有益效果:相较于传统的OCR识别技术,本专利技术的方法采用深度学习技术,不但省去了传统方法中繁杂的预处理和后处理工作,将模型训练时间从几天降到几个小时。而且受外界环境的影响程度大大降低,不仅能够识别“清晰、端正的图片”,也能识别“倾斜、相对模糊的图片”,极大地提高了卡号的识别效果。本专利技术的方法能够应用于银行卡卡号的识别,同时也能够应用于车牌识别、证件号码识别、票据单号识别等应用领域。另外本专利技术通过采用深度学习技术,在单个识别请求的响应时间平均在100ms左右,在已有的验证集上识别精度平均达到99%,同时本专利技术还可通过搭载后台结构API(Http方式)服务,可供移动端、PC端任何程序接入,以更高、更快、更全的服务效率为社会提供服务。附图说明此处所说明的附图用来提供对本专利技术实施例的进一步理解,构成本申请的一部分,并不构成对本专利技术实施例的限定。在附图中:图1为本专利技术的方法流程示意图。图2为本专利技术的待识别银行卡图片兴趣区域的灰度图像。图3为对图2的灰度图像进行卡号行凸显的图像。图4为对图3的图像进行卡号边缘凸出的图像。图5为对图4的图像进行第一次形态学闭操作结果。图6为对图5进行第一次二值化处理结果。图7为对图6循环二值化处理结果。图8为对图7进行均值滤波之后的图像。图9为对图8进行第二次形态学闭操作结果。图10为本文档来自技高网...
【技术保护点】
1.基于深度学习的卡号识别方法,其特征在于,该方法包括以下步骤:/n步骤S1,对原始数据集进行数据增强以得到扩充数据集;/n步骤S2,对扩充数据集中的数据通过合成的方式拟合,形成训练数据集;/n步骤S3,对步骤S2获得的训练数据集进行标签化处理,得到训练样本集;/n步骤S4,采用步骤S3获得的训练样本集对深度学习模型进行训练,得到卡号识别模型;/n步骤S5,利用卡号识别模型对待识别图片进行卡号识别。/n
【技术特征摘要】
1.基于深度学习的卡号识别方法,其特征在于,该方法包括以下步骤:
步骤S1,对原始数据集进行数据增强以得到扩充数据集;
步骤S2,对扩充数据集中的数据通过合成的方式拟合,形成训练数据集;
步骤S3,对步骤S2获得的训练数据集进行标签化处理,得到训练样本集;
步骤S4,采用步骤S3获得的训练样本集对深度学习模型进行训练,得到卡号识别模型;
步骤S5,利用卡号识别模型对待识别图片进行卡号识别。
2.根据权利要求1所述的基于深度学习的卡号识别方法,其特征在于,所述步骤S1具体包括以下步骤:
步骤S11,采用数据增强工具对原始数据集进行随机旋转、平移、填充和颜色变化处理,以扩充原始数据集;
步骤S12,对扩充后的原始数据集中的图像数据添加椒盐噪声和高斯模糊处理,得到扩充数据集。
3.根据权利要求1所述的基于深度学习的卡号识别方法,其特征在于,所述步骤S2具体包括以下步骤:
步骤S21,在扩充数据集中顺序取出1张图片与随机选取的4张图片横向拼接在一起,将拼接之后的图片进行放大或缩小处理,之后将其合成进一张800*100的背景图片中;
步骤S22,重复步骤S21,直到顺序取出所有图片进行拼接拟合,生成训练数据集。
4.根据权利要求1所述的基于深度学习的卡号识别方法,其特征在于,所述步骤S5具体包括以下步骤:
步骤S51,对输入的原始图片中的卡号进行定位提取,得到待识别图片:
步骤S52,利用卡号识别模型对待识别图片进行识别。
5.根据权利要求4所述的基于深度学习的卡号识别方法,其特征在于,所述步骤S51具体包括以下步骤:
步骤S511,输入待识别的原始图片,并提取图片中的兴趣区域,将提取的兴趣区域进行灰度化处理;
步骤S512,对灰度化处理之后的图片进行形态学顶帽操作,凸显卡号行;
步骤S513,在X方向上计算Sobel值,凸出卡号边缘;
步骤S514,在凸出卡号边缘之后进行形态学闭操作,使得卡号区域粘连;
步骤S515,在形态学闭操作之后进行循环二值化处理,直到白色像素点占比在0.2~0.6之间;
步骤S516,对二值化处理之后的图像进行均值滤波,去除孤立...
【专利技术属性】
技术研发人员:陈敏,眭灵建,王媛丽,张竞超,张常武,
申请(专利权)人:湖南信息学院,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。