【技术实现步骤摘要】
信息承载介质的识别方法、识别装置、计算机设备和介质
本专利技术涉及图像处理
,特别是涉及一种信息承载介质的识别方法、识别装置、计算机可读存储介质和计算机设备。
技术介绍
随着图像处理技术的发展,目前OCR技术识别信息承载介质的应用已经较为普遍,市面上的OCR识别应用程序主要形式是以手机调用程序,然后对信息承载介质照相后上传返回识别结果,这类产品存在以下问题:1.每个种类的信息承载介质识别对应一个单独的应用程序(运单识别、名片识别、身份证识别等),如果想识别不同的对象需要切换不同的应用程序。2.克服识别大角度旋转的信息承载介质能力不足甚至小角度旋转也不能自动校正;3.背景含有其他文字时会被误认为是信息承载介质的内容;4.拍摄信息承载介质时如果入射角和信息承载介质呈现一定角度时,拍摄出的信息承载介质会存在梯形畸变导致文字识别失败。
技术实现思路
为了解决上述问题至少之一,本专利技术第一方面提供一种信息承载介质的识别方法,包括:获取信息承载介质的第一图像;对 ...
【技术保护点】
1.一种信息承载介质的识别方法,其特征在于,包括:/n获取信息承载介质的第一图像;/n对所述第一图像进行文字识别以获取所述信息承载介质的文本内容;/n对所述信息承载介质进行分类以获取所述信息承载介质的类型;/n根据所述类型对所述文本内容进行文字归档。/n
【技术特征摘要】
1.一种信息承载介质的识别方法,其特征在于,包括:
获取信息承载介质的第一图像;
对所述第一图像进行文字识别以获取所述信息承载介质的文本内容;
对所述信息承载介质进行分类以获取所述信息承载介质的类型;
根据所述类型对所述文本内容进行文字归档。
2.根据权利要求1所述的识别方法,其特征在于,所述对所述信息承载介质进行分类以获取所述信息承载介质的类型包括:
根据所述第一图像的长宽比对所述信息承载介质进行粗分类;
对经过粗分类的信息承载介质使用预置的对应的图像分类器基于所述第一图像进行细分类以获取所述信息承载介质的类型。
3.根据权利要求1所述的识别方法,其特征在于,所述对所述信息承载介质进行分类以获取所述信息承载介质的类型包括:
根据所述第一图像的长宽比对所述信息承载介质进行粗分类;
对经过粗分类的信息承载介质使用预置的对应的文本分类器基于所述文本内容进行细分类以获取所述信息承载介质的类型。
4.根据权利要求1所述的识别方法,其特征在于,所述获取信息承载介质的第一图像包括:
基于获取的图像对图像内的信息承载介质进行目标检测并校正以获取所述第一图像;
判断所述第一图像是否满足预设要求,若否
对所述第一图像进行文本方向检测并旋转以校正所述第一图像。
5.根据权利要求4所述的识别方法,其特征在于,所述基于获取的图像对图像内的信息承载介质进行目标检测并校正以获取所述第一图像包括:
基于获取的图像进行图像二值化;
进行边缘检测以获取所述图像内的最大矩形的轮廓;
通过透视变换从所述图像内分割出所述第一图像。
6.根据权利要求4所述的识别方法,其特征在于,所述基于获取的图像对图像内的信息承载介质进行目标检测并校正以获取所述第一图像包括:
基于获取的图像进行图像二值化;
进行直线检测以获取水平直线集和竖直直线集分组、合并近似平行线以确定所述信息承载介质的最优边界和顶点;
通过透视变换从所述图像内分割出所述第一图像。
7.根据权利要求4所述的识别方法,其特征在于,所述对所述第一图像进行文本方向检测并旋转以校正所述第一图像包括:
使用预置的全角度文本检测分类模型对所述第一图像进行文本方向检测并输出旋转角度;
将所述第一图像旋转所述旋转角度。
8.根据权利要求1所述的识别方法,其特征在于,所述对所述第一图像进行文字识别以获取所述信息承载介质的文本内容...
【专利技术属性】
技术研发人员:黄光伟,薛瑞彬,石炳川,李月,赵骥伯,
申请(专利权)人:京东方科技集团股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。