【技术实现步骤摘要】
一种低像素密度文本的识别方法
本专利技术属于图像识别
,具体涉及一种低像素密度文本的识别方法。
技术介绍
目前,在交易、贸易和企业间业务往来中会产生大量的纸质单据,如信用证、汇票、发票、合同、运输单据等。这些纸质单据往往需要录入到相应的业务系统中,这需要大量的人工和重复劳动,且效率低下容易出错。OCR(OpticalCharacterRecognition)技术是一种通过图像识别将图像中的文字转换成文本的技术。因此在处理各类单证票据场景下,OCR技术可以有效解决人工录入带来的问题。常见的单证票据中,存在大量的特殊符号,诸如单选框、复选框、下划线以及条款约束脚注等,而目前市场上存在的OCR识别系统无法有效的处理和识别。由于这些区域像素密度比价低,常用的深度学习检测方法召回率比较低,易出现漏检现象;由于特殊符号出现的频率较低,且与汉字结构相似,通过扩充训练数据集进行迁移学习也很难达到较好的识别效果。
技术实现思路
本专利技术公开了一种低像素密度文本的识别方法,以解决现有技术的上述以及其他 ...
【技术保护点】
1.一种低像素密度文本的识别方法,其特征在于,该方法具体包括以下步骤:/nS1)对待识别的低像素密度文本进行图像信息采集,并将采集的图像信息输入;/nS2)对输入的图像信息进行预处理,并利用SIFT方法处理图像信息区域进行初步定位;/nS3)根据S2)得到初步定位的结果再次进行精确定位;/nS4)对S3)得到精确定位结果进行图像信息区域识别,并对识别后的结果进行分类,得到普通文本区域和特殊符号区域;/nS5)将S4)得到普通文本区域和特殊符号区域分别输入特殊符号识别模型和普通文本识别模型进行识别;/nS6)对识别后结果进行汇总和结构化输出。/n
【技术特征摘要】
1.一种低像素密度文本的识别方法,其特征在于,该方法具体包括以下步骤:
S1)对待识别的低像素密度文本进行图像信息采集,并将采集的图像信息输入;
S2)对输入的图像信息进行预处理,并利用SIFT方法处理图像信息区域进行初步定位;
S3)根据S2)得到初步定位的结果再次进行精确定位;
S4)对S3)得到精确定位结果进行图像信息区域识别,并对识别后的结果进行分类,得到普通文本区域和特殊符号区域;
S5)将S4)得到普通文本区域和特殊符号区域分别输入特殊符号识别模型和普通文本识别模型进行识别;
S6)对识别后结果进行汇总和结构化输出。
2.根据权利要求1所述的方法,其特征在于,所述S5)中还包括校正步骤:通过纠错校正机制,对识别的结果进行后期校正。
3.根据权利要求1或2所述的方法,其特征在于,所述S2的具体步骤为:
S2.1)采用特征点匹配算法将输入的图像信息转化为矩阵,
S2.2)通过构建尺度空间和高斯空间差分金字塔,计算极值点和相应的坐标,
S2.3)根据S2.2)得到所有的极值点判别和定位特殊符号在图像信息中的大致坐标并提取对应的图像区域,完成初步定位。
4.根据权利要求3所述的方法,其特征在于,所述S3)的具体步骤为:
S3.1)将经过S2.3)初步定位的结果输入CRAFT深度学习检测模型,
S3.2)利用CRAFT深度学习检测模型计算得到图像信息中包含普通文本区域和特殊符号区域的区域坐标,提取所述区域坐标内的图像信息并提取对应图像的方向梯度直方图特征,
S3.3)根据S3.2)得到梯度直方图特征利用SVM向量机对梯度直方图进行二分类,分为普通文本区域和特殊符号区域。
5.根据权利要求4所述的方法,其...
【专利技术属性】
技术研发人员:李振,鲁宾宾,刘挺,陈伟强,陈远琴,孟天祥,翟昶,
申请(专利权)人:民生科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。