一种基于深度学习的印刷体与手写体分开文字识别方法技术

技术编号：31810034 阅读：23 留言：0更新日期：2022-01-08 11:12

一种基于深度学习的印刷体与手写体分开文字识别方法。本发明专利技术方法包括：对于同时含有印刷体和手写体的文档图片，经过预处理之后，先用深度学习模型对印刷体和手写体分类识别，再根据分类识别的结果可以分别得到印刷体图片、手写体图片，最后对印刷体和手写体图片分别进行文字识别。该方法对于同时含有印刷体和手写体的文档图片可以实现印刷体和手写体分开文字识别，完全是自动的、智能的、自适应的，不需要人为设置参数。不需要人为设置参数。不需要人为设置参数。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的印刷体与手写体分开文字识别方法

[0001]本专利技术涉及一种基于深度学习的印刷体与手写体分开文字识别方法，属于人工智能视觉领域。

技术介绍

[0002]对文档图片进行文字识别已经是比较成熟的技术，但是当文档图片里同时含有印刷体和手写体时，现有的文字识别技术是把二者放在一起识别，不能把印刷体和手写体分离。对同时含有印刷体和手写体的文档图片分别进行文字识别有很多重要的应用，比如银行票据的文字识别、学生试卷自动批改、诉讼文件转为电子卷宗等。要实现对印刷体与手写体分别进行文字识别，其中的一个关键技术问题是印刷体与手写体分类识别。印刷体与手写体分类问题可以定义为：对于同时含有印刷体、手写体的图片，希望对图片里的印刷体、手写体和背景实现像素级分类。传统的机器视觉方法很难对印刷体和手写体实现像素级分类识别，尤其是印刷体与手写体有交叉重叠的时候。深度学习方法中的语义分割技术可以实现像素级分类识别，可以很好的解决这个问题。语义分割技术中流行的算法包括全卷积神经网络FCN和带空洞卷积的FCN。

技术实现思路

[0003]本专利技术为实现印刷体与手写体分开文字识别目的采用如下技术方案：一种基于深度学习的印刷体与手写体分开文字识别方法，步骤如下。
[0004]步骤（1）制作训练样本数据集，包括如下步骤：（1.1）准备一张纸，要求纸上的印刷字体是黑色，纸的空白处是白色；（1.2）在纸上用红笔写字；（1.3）对写好字的纸张拍照得到的图片记为图a。这一步也可以用扫描仪扫描；（1.4）通过算法程序对图a进...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的印刷体与手写体分开文字识别方法，其特征在于：包括如下步骤：（1）训练样本制作，制作包含手写字体、印刷字体的训练样本数据集；（2）建立深度学习模型；（3）模型训练；（4）获取含有印刷体和手写体图片；（5）对图片预处理；（6）图片输入模型检测得到像素级分类结果图；（7）根据分类识别的结果可以分别得到印刷体图片、手写体图片；（8）对印刷体和手写体图片分别进行文字识别。2.根据权利要求1所述的一种基于深度学习的印刷体与手写体分开文字识别方法，其特征在于：步骤（1）制作训练样本数据集，包括如下步骤：（1.1）准备一张纸，要求纸上的印刷字体是黑色，纸的空白处是白色；（1.2）在纸上用红笔写字；（1.3）对写好字的纸张拍照得到的图片记为图a，这一步也可以用扫描仪扫描；（1.4）通过算法程序对图a进行预处理，包括边框裁剪、二值化为黑白图，得到的结果图记为图b，图b为训练模型的输入样本，图b的印刷体和手写体为黑色，背景变为白色；（1.5）通过算法程序对图a中的印刷体、手写体和背景进行像素级分类，得到的结果记为图c；算法程序的分类原理是基于不同颜色对应的像素值大小不同，红色的手写体容易与黑色印刷体和白色背景区分开；图c为训练模型的输出样本；这里把背景的像素用0表示，印刷字体的像素用1表示，手写字体的像素用2表示；从而实现手写字体、印刷字体、背景的像素级标注。3.根据权利要求1所述的一种基于深度学习的印刷体与手写体分开文字识别方法，其特征在于：步骤（2）建立深度学习模型，主要是图像语义分割领域的人工智能模型，该人工智能模型可以是全卷积神经网络（Fully Convolutional Networks，FCN），空洞卷积（dilated convolutions），带空洞卷积的FCN模型，SegNet网络，或者U
‑
Net网络等。4.根据权利要求1所述的一种基于深度学习的印刷体与手写体分开文字识别方法，其特征在于：步骤（3）模型...

【专利技术属性】
技术研发人员：方海泉，
申请(专利权)人：浙江星算科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人