The present invention relates to a fast and robust bank card location and classification method in natural scenes, including the following steps: acquiring bank card data sets and labeling the acquired bank card data sets to prepare for training bank card location and classification model; 2: training bank card location and classification model by using the collected bank card data sets; and 3. In the trained bank card location and classification model, the trained bank card location and classification model is used to locate and recognize the detected bank card image. The invention can effectively locate and classify bank cards in the detected image.
【技术实现步骤摘要】
一种自然场景下快速、鲁棒的银行卡定位与分类方法
本专利技术涉及深度学习与计算机视觉领域,特别是一种自然场景下快速、鲁棒的银行卡定位与分类方法。
技术介绍
自然场景中出现的文本是我们一个重要的信息来源。例如广告牌、交通标识、各类证件上的文字等,这些文本包含着明确的语义信息,为人们提供必要的指示和提醒。如果能够实现对这些文本的检测和识别就可以实现对这些场景内容的理解和分析。伴随着人类科技进步,使用机器检测并理解场景中的文本成为了一个必然的趋势。随着带有摄像头的移动设备的广泛使用以及移动支付的不断发展,人们已经开始习惯使用手机应用进行支付,如支付宝、微信支付等。银行卡卡号检测和识别技术能帮助这些支付平台的用户自动输入卡号。与人工录入卡号相比,银行卡自动检测与识别技术速度更快,精度更高,体验更好。传统方法处理自然场景下的银行卡检测依然面临一些问题,例如:无法从银行卡图像背景中将银行卡卡面分离;自然场景下的图片和视频中背景可能会非常复杂,其中很多背景元素如有着密集文字字符的书籍、与卡面颜色相似的桌面等,这些拍摄背景都可能和真实的银行卡卡面在视觉上产生混淆,导致错误的产生。拍摄的银行卡卡面倾斜变形,使用传统矩形检测方法无法确保银行卡卡面定位的准确性。现有的银行卡识别应用大都对银行卡图像的输入有比较严格的要求,如必须对准应用中固定大小的检测框进行拍摄,必须在光照条件良好的环境下进行拍摄,以便得到易于处理的卡面图像。自然场景下的银行卡定位与识别在生产生活中扮演着重要的角色,但其研究进展缓慢,其原因可以归结为三点:属于隐私数据的银行卡数据集难以收集、银行卡类别繁多和银行卡拍 ...
【技术保护点】
1.一种自然场景下快速、鲁棒的银行卡定位与分类方法,其特征在于:包括以下步骤:步骤S1:获取银行卡数据集,并对获取的银行卡数据集进行标注,为训练银行卡定位与分类模型做好准备;步骤S2:使用收集到的银行卡数据集训练银行卡定位与分类模型;步骤S3:将待检测的银行卡图像输入训练好的银行卡定位与分类模型中,利用训练好的银行卡定位与分类模型对待检测的银行卡图像进行定位与识别。
【技术特征摘要】
1.一种自然场景下快速、鲁棒的银行卡定位与分类方法,其特征在于:包括以下步骤:步骤S1:获取银行卡数据集,并对获取的银行卡数据集进行标注,为训练银行卡定位与分类模型做好准备;步骤S2:使用收集到的银行卡数据集训练银行卡定位与分类模型;步骤S3:将待检测的银行卡图像输入训练好的银行卡定位与分类模型中,利用训练好的银行卡定位与分类模型对待检测的银行卡图像进行定位与识别。2.根据权利要求1所述的一种自然场景下快速、鲁棒的银行卡定位与分类方法,其特征在于:步骤S1中具体包括以下步骤:步骤S11:采用爬虫技术获取银行卡图片并得到其所属银行卡类别;步骤S12:将采集到的银行卡图片进行分类得到类别信息,并对银行卡卡面不完整的图片进行剔除;步骤S13:对步骤S12处理后的图片进行标注;其中,所述标注具体为:对输入图片中银行卡的位置进行标定,得到位置信息,图片的位置信息和类别信息一同构成该图片的标注信息。3.根据权利要求1所述的一种自然场景下快速、鲁棒的银行卡定位与分类方法,其特征在于:步骤S2具体包括以下步骤:步骤S21:所述银行卡定位与分类模型由两部分构成,前半部分为特征提取网络,用于银行卡特征提取,后半部分为多尺度特征检测网络,用于在3个不同的尺度上进行银行卡定位检测;步骤S22:训练银行卡定位与分类模型只涉及特征提取网络,通过训练特征提取网络调整特征提取网络的参数θ;根据批次输入的图片标注信息,计算损失函数Loss,Loss的计算方式如下:式中,coordinateError为坐标误差、confidenceLoss为置信度损失、classError为分类误差;i为格子的序号,j为边框的序号,S2为格子的总数,B为边界框的总数,为边界框中心坐标的预测值,为边界框宽高的预测值,为格子i的置信度预测值,为格子i的类别是c的预测值;(xi,yi)为边界框中心坐标的训练标记值,(wi,hi)为边界框宽高的训练标记值,Ci为格子i的置信度训练标记值,pi(c)为格子i的类别是c的训练标记值。表示格子i的第j个边界框内有银行卡,表示格子i的第j个边界框内没有银行卡;对于坐标误差,给它们赋予更大的损失权重,记作λcoord;对于没有物体的置信度损失,赋予...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。