The invention discloses a method, a device and a calculating device for recognizing Chinese characters in card certificates. Recognition methods include: acquiring card image, which includes at least one category of text sequence; using the first target detection model, acquiring various types of text sequence images from the card image, and obtaining at least one first text sequence image; dividing each first text sequence image into blocks and binarizing it to obtain the corresponding second text sequence image. For each word image acquired from the second word sequence image, the text information of the word image is recognized.
【技术实现步骤摘要】
一种卡证中文字的识别方法、装置以及计算设备
本专利技术涉及图像处理
,尤其是一种卡证中文字的识别方法、装置以及计算设备。
技术介绍
随着互联网技术的发展,不论是在汽车金融、二手车交易等业务中,还是在以网上支付为主导的电子商务平台上,都涉及大量银行卡或证件文字信息录入工作。而卡证信息的自动读取,能够代替大量繁琐的人工录入,可以有效提高信息录入效率,节省管理成本。同时,高精度的卡证中文字信息识别,能够将用户信息准确的读取到计算机系统中,提高互联网业务的服务质量,为客户带来良好的用户体验,因此有着重要的研究意义。卡证中结构化信息的提取一般包括文字区域检测和文字识别两个步骤,先通过文字区域检测提取卡证中各种信息类别(例如行驶证中的号牌号码、车辆类型、所有人等)对应的文字区域,再对提取的各文字区域进行文字识别。在现有的卡证中文字信息识别方案中,证件的文字区域检测主要包括:先采用基于边缘、纹理的方法提取出所有文字区域,再通过版面分析的方法确定各个信息类别所分别对应的文字区域。确定出各个信息类别分别对应的文字区域后,采用垂直投影法将一行文字进行单字分割,再将分割好的单字进行识别,识别一般采用基于模版匹配或神经网络的方法。卡证图像一般是通过扫描或者拍照得到,所得到的卡证图像清晰度、规整度未必能够满足识别要求,例如在拍照情形下,由于拍照角度、光照不均匀、拍照模糊、字符遮挡等复杂背景的影响,会使对卡证图像中文字信息的识别精度大大降低。
技术实现思路
为此,本专利技术提供了一种卡证中文字的识别方法及装置,以力图解决或至少缓解上面存在的至少一个问题。根据本专利技术的一个方面,提 ...
【技术保护点】
1.一种卡证中文字的识别方法,在计算设备中执行,并包括如下步骤:获取卡证图像,所述卡证图像中包括至少一个类别的文字序列;利用第一目标检测模型,从所述卡证图像中获取各类别的文字序列图像,得到至少一个第一文字序列图像;对每个第一文字序列图像进行分块二值化处理,得到对应的第二文字序列图像;利用第二目标检测模型,从第二文字序列图像中获取单字图像;以及对于从第二文字序列图像获取的每个单字图像,识别该单字图像中的文字信息。
【技术特征摘要】
1.一种卡证中文字的识别方法,在计算设备中执行,并包括如下步骤:获取卡证图像,所述卡证图像中包括至少一个类别的文字序列;利用第一目标检测模型,从所述卡证图像中获取各类别的文字序列图像,得到至少一个第一文字序列图像;对每个第一文字序列图像进行分块二值化处理,得到对应的第二文字序列图像;利用第二目标检测模型,从第二文字序列图像中获取单字图像;以及对于从第二文字序列图像获取的每个单字图像,识别该单字图像中的文字信息。2.如权利要求1所述的方法,其中,所述进行分块二值化处理的步骤包括:将第一文字序列图像划分为多个图像分块,并计算各图像分块的二值化阈值;对于每个图像分块,根据对应的二值化阈值对该图像分块进行二值化处理。3.如权利要求2所述的方法,其中,所述将第一文字序列图像划分为多个图像分块的步骤包括:获取第一文字序列图像的宽度w和高度h;根据所述宽度w和高度h,将第一文字序列图像的宽度方向分为份,高度方向分为2份,得到个图像分块。4.如权利要求1或2所述的方法,其中,所述识别该单字图像中的文字信息的步骤包括:根据所述单字图像在所述第二文字序列图像中的位置,从所述第一文字序列图像的相同位置处获取原始单字图像...
【专利技术属性】
技术研发人员:黄萧,刘荣,徐丞申,喻杰,李林,
申请(专利权)人:天津车之家数据信息技术有限公司,
类型:发明
国别省市:天津,12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。