一种基于深度学习的票据OCR识别方法技术

技术编号:30822969 阅读:32 留言:0更新日期:2021-11-18 12:10
本发明专利技术提供了光学字符识别技术领域的一种基于深度学习的票据OCR识别方法,包括:步骤S10、采集大量的不同类型的票据图像;步骤S20、对各所述票据图像进行标注以及扩充,得到训练数据集;步骤S30、基于深度学习创建一票据分类模型、一文字检测模型、一文字方向分类模型以及一文字识别模型;步骤S40、利用所述训练数据集分别对票据分类模型、文字检测模型、文字方向分类模型以及文字识别模型进行训练;步骤S50、利用训练后的所述票据分类模型、文字检测模型、文字方向分类模型以及文字识别模型对待识别票据进行智能识别。本发明专利技术的优点在于:极大的提升了票据文字识别的精度以及效率。大的提升了票据文字识别的精度以及效率。大的提升了票据文字识别的精度以及效率。

【技术实现步骤摘要】
一种基于深度学习的票据OCR识别方法


[0001]本专利技术涉及光学字符识别
,特别指一种基于深度学习的票据OCR识别方法。

技术介绍

[0002]传统上,将文字输入到电子设备主要采用人工目视并录入的方法,但是该方法无法满足海量的文字输入,不仅效率低下,且人工成本高。随着信息化的日渐发展和普及,OCR(Optical Character Recognition,光学字符识别)技术应运而生,OCR技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测不同文字的纹理特征差异确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,而OCR技术主要包括OCR检测技术和OCR识别技术。
[0003]OCR检测技术主要利用图像中文字与背景区域的差异,确定图像中文字或文本行的位置。基于文字的OCR检测算法是先通过检测单个文字的区域,然后通过文字之间的位置关系将单个文字区域合并为文本行区域,例如经典的CTPN检测算法,但由于很多文字与文字之间的间隔较小,很难精确的检测出文字的边界,且文字之间需要根据上下文进行组合,流程复杂。基于本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的票据OCR识别方法,其特征在于:包括:步骤S10、采集大量的不同类型的票据图像;步骤S20、对各所述票据图像进行标注以及扩充,得到训练数据集;步骤S30、基于深度学习创建一票据分类模型、若干个文字检测模型、一文字方向分类模型以及一文字识别模型;步骤S40、利用所述训练数据集分别对票据分类模型、文字检测模型、文字方向分类模型以及文字识别模型进行训练;步骤S50、利用训练后的所述票据分类模型、文字检测模型、文字方向分类模型以及文字识别模型对待识别票据进行智能识别。2.如权利要求1所述的一种基于深度学习的票据OCR识别方法,其特征在于:所述步骤S10具体为:在不同光照强度以及背景颜色的环境下,采集大量的不同类型的票据图像。3.如权利要求1所述的一种基于深度学习的票据OCR识别方法,其特征在于:所述步骤S20具体为:通过图像检测标注工具对采集的各所述票据图像进行票据类型、文字区域、文字方向以及文字内容的标注,对标注后的各所述票据图像进行随机偏转、平移或者缩放的样本扩充操作,得到训练数据集。4.如权利要求1所述的一种基于深度学习的票据OCR识别方法,其特征在于:所述步骤S30中,所述票据分类模型用于对票据进行分类,采用VGG16网络作为主干特征提取网络,采用交叉熵函数作为损失函数;所述文字检测模型用于检测文本区域并进行截取,为DBNet网络,采用ResNet网络作为主干特征提取网络,采用可变性卷积提取特征,使卷积和的视野大小随特征变化;所述文字方向分类模型用于识别文字的排列方向,采用RCNN网络作为主干特征提取网络,采用二分类交叉熵函数作为损失函数;所述文字识别模...

【专利技术属性】
技术研发人员:金根炎林诚汉陈立峰林俊德
申请(专利权)人:福建新大陆软件工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1