基于K-means++聚类和残差网络分类的银行卡卡号检测与识别方法技术

技术编号：20161155 阅读：16 留言：0更新日期：2019-01-19 00:13

本发明专利技术涉及一种基于K‑means++聚类和残差网络分类的银行卡卡号检测与识别方法,包括以下步骤：步骤S1:采集银行卡数据集和银行卡卡号数据集，并对采集的银行卡数据集进行标注，对采集的银行卡卡号数据集进行分类；步骤S2:构建银行卡卡号定位模型，并根据得到的银行卡数据集训练银行卡卡号定位模型；步骤S3:构建银行卡卡号分类模型，并根据得到的银行卡卡号数据集训练银行卡卡号分类模型步骤S4:将待检测的银行卡图像输入训练好的银行卡卡号定位模型中，定位卡号位置，并保存卡号图像；将卡号图像输入训练好的银行卡卡号分类模型中，得到卡号识别结果。本发明专利技术能够有效地对待检测图像中的银行卡卡号进行检测与识别。

全部详细技术资料下载

【技术实现步骤摘要】
基于K-means++聚类和残差网络分类的银行卡卡号检测与识别方法
本专利技术涉及深度学习与计算机视觉领域，具体一种基于K-means++聚类和残差网络分类的银行卡卡号检测与识别方法。
技术介绍
自然场景中出现的文本是我们一个重要的信息来源。例如广告牌、交通标识、各类证件上的文字等，这些文本包含着明确的语义信息，为人们提供必要的指示和提醒。如果能够实现对这些文本的检测和识别就可以实现对这些场景内容的理解和分析。伴随着人类科技进步，使用机器检测并理解场景中的文本成为了一个必然的趋势。随着带有摄像头的移动设备的广泛使用以及移动支付的不断发展，人们已经开始习惯使用手机应用进行支付，如支付宝、微信支付等。银行卡卡号检测和识别技术能帮助这些支付平台的用户自动输入卡号。与人工录入卡号相比，银行卡自动检测与识别技术速度更快，精度更高，体验更好。使用传统方法检测与识别自然场景下银行卡卡号行面临一些问题。例如：(1)卡号与卡面背景无法分离，使用传统字符分割方法和字符识别方法的准确率不高。(2)由于银行卡卡号的个数与组织形式不尽相同，所以采用固定的模板对银行卡卡号进行分割会导致分割错误。(3)使用传统模板匹配算法进行卡号识别，卡号与背景粘连无法保证正确率。(4)如果银行卡卡面矫正失败，使用传统字符定位方法定位非标准银行卡的卡号困难。自然场景下的银行卡卡号检测与识别在生产生活中扮演着重要的角色，但其研究进展缓慢，其原因可以归结为三点：属于隐私数据的银行卡数据集难以收集、银行卡类别繁多和银行卡拍摄场景复杂。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种基于K-means++聚...

【技术保护点】
1.一种基于K‑means++聚类和残差网络分类的银行卡卡号检测与识别方法,其特征在于，包括以下步骤：步骤S1:采集银行卡数据集和银行卡卡号数据集，并对采集的银行卡数据集进行标注，对采集的银行卡卡号数据集进行分类；步骤S2:构建银行卡卡号定位模型，并根据得到的银行卡数据集训练银行卡卡号定位模型,得到训练好的银行卡卡号定位模型；步骤S3:构建银行卡卡号分类模型，并根据得到的银行卡卡号数据集训练银行卡卡号分类模型，得到训练好的银行卡卡号分类模型；步骤S4:将待检测的银行卡图像输入训练好的银行卡卡号定位模型中，定位卡号位置，并保存卡号图像；将卡号图像输入训练好的银行卡卡号分类模型中，得到卡号识别结果。

【技术特征摘要】
1.一种基于K-means++聚类和残差网络分类的银行卡卡号检测与识别方法,其特征在于，包括以下步骤：步骤S1:采集银行卡数据集和银行卡卡号数据集，并对采集的银行卡数据集进行标注，对采集的银行卡卡号数据集进行分类；步骤S2:构建银行卡卡号定位模型，并根据得到的银行卡数据集训练银行卡卡号定位模型,得到训练好的银行卡卡号定位模型；步骤S3:构建银行卡卡号分类模型，并根据得到的银行卡卡号数据集训练银行卡卡号分类模型，得到训练好的银行卡卡号分类模型；步骤S4:将待检测的银行卡图像输入训练好的银行卡卡号定位模型中，定位卡号位置，并保存卡号图像；将卡号图像输入训练好的银行卡卡号分类模型中，得到卡号识别结果。2.根据权利要求1所述的基于K-means++聚类和残差网络分类的银行卡卡号检测与识别方法,其特征在于：所述步骤S1具体为：步骤S11：采用爬虫技术抓取或摄像头采集的方式收集银行卡图片，并对卡号不清晰的图片进行剔除；步骤S12：对采集到的银行卡图片信息进行标注，标注信息为卡号的位置信息，得到银行卡数据集；步骤S13：对采集到的银行卡图片中的卡号图像进行截取、归一化，并对其进行分类，得到银行卡卡号数据集。3.根据权利要求1所述的基于K-means++聚类和残差网络分类的银行卡卡号检测与识别方法,其特征在于：所述步骤S2具体为：步骤S21：构建银行卡卡号定位模型，所述银行卡卡号定位模型由两部分构成，前半部分为特征提取网络，用于提取银行卡卡号特征，后半部分为多尺度特征检测网络，在3个不同尺度上进行银行卡卡号定位检测；根据批次输入图片所标注的位置信息，计算损失函数Loss，模型训练的目的就是尽可能降低损失函数的大小，Loss的计算方式如下：其中，将图像划分为相等大小的格子，i为格子的序号，j为边框的序号，S2为格子的总数，B为边界框的总数，为边界框中心坐标的预测值，为边界框宽高的预测值，(xi,yi)为边界框中心坐标的训练标记值，(wi,hi)为边界框宽高的训练标记值，表示格子i的第j个边界框内存在卡号；步骤S22：为了提高卡号定位的IoU，IoU表示卡号预测框和真实标记框的重合程度，在训练集上运行K-means++聚类方法找到更好的先验边界框；并从数据集中随机选择一个样本作为初始聚类的类中心c1；计算每个样本box与当前已有聚类中心centroid之间的最短距离，用D(box,centroid)表示，计算公式为：D(box,centroid)＝1-IoU(box,centroid)接着计算每个样本被选为下一个聚类中心的概率为：其中b为边界框元素，B为所有边界框的集合；最后按照轮盘法选出下一个聚类中心；步骤S2...

【专利技术属性】
技术研发人员：柯逍，刘诗勤，牛玉贞，
申请(专利权)人：福州大学，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人