基于深度学习的文字识别方法、系统、装置和存储介质制造方法及图纸

技术编号：34448268 阅读：21 留言：0更新日期：2022-08-06 16:45

本发明专利技术公开了一种基于深度学习的文字识别方法、系统、装置和存储介质，方法包括构建字符特征提取网络模型；获取文字图像数据集，基于文字图像数据集，对字符特征提取网络模型进行训练，得到目标文字识别模型；获取待识别文字图像，根据目标文字识别模型，对待识别文字图像进行识别，得到目标识别结果。本发明专利技术实现了待识别文字图像的识别，得到其对应的目标识别结果，待识别文字图像的识别准确率较高，有效解决了传统文字识别技术中英文通用字符识别困难、部分字符存在长尾效应而导致文字识别准确率较低的问题。准确率较低的问题。准确率较低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的文字识别方法、系统、装置和存储介质

[0001]本专利技术涉及人工智能和机器视觉
，具体涉及一种基于深度学习的文字识别方法、系统、装置和存储介质。

技术介绍

[0002]随着人工智能和计算机视觉领域的不断发展，文字识别技术(OCR，Optical Character Recognition)被广泛应用于文档识别、车牌十倍、票据识别、证件识别等诸多场景中。
[0003]一般而言，传统的文字识别技术主要包括数据预处理、特征提取和分类识别三部分。然而由于文字文本的多样性和复杂性，例如文字文本呈现的多种语言、颜色、字体、文字大小、文字旋转方向和文字横纵比，再例如文字文本背景(如树叶、栅栏和交通标志)的干扰，再例如文字文本图像成像质量不佳(如分辨率低、图像扭曲、图像模糊和光线差)
……
都会导致传统的文字识别技术存在着不足，包括中英文通用字符识别困难、部分字符存在长尾效应，从而导致文字识别准确率较低。

技术实现思路

[0004]有鉴于此，本专利技术提供了一种基于深度学习的文字...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的文字识别方法，其特征在于，包括：构建字符特征提取网络模型；获取文字图像数据集，基于所述文字图像数据集，对所述字符特征提取网络模型进行训练，得到目标文字识别模型；获取待识别文字图像，根据所述目标文字识别模型，对所述待识别文字图像进行识别，得到目标识别结果。2.根据权利要求1所述的基于深度学习的文字识别方法，其特征在于，所述构建字符特征提取网络模型，包括：搭建卷积层；所述卷积层用于利用深度卷积神经网络，对输入图像进行深层特征提取，生成深层特征字符向量；搭建循环层；所述循环层用于利用双向循环神经网络，对所述深层特征字符向量进行上下文语义特征计算，生成所述输入图像的目标深层特征向量；搭建转录层；所述转录层用于利用激活函数，对所述目标深层特征向量进行映射，并利用损失函数，对映射后的所述目标深层特征向量进行转换，得到所述输入图像对应的分类向量；形成所述字符特征提取网络模型。3.根据权利要求2所述的基于深度学习的文字识别方法，其特征在于，所述搭建转录层，包括：设计所述激活函数；设计所述损失函数；其中，所述损失函数包括类别平衡损失函数和时序分类损失函数；所述类别平衡损失函数，用于将映射后的所述目标深层特征向量转换成平衡类别字向量；所述时序分类损失函数，用于将所述平衡类别字向转换成所述分类向量。4.根据权利要求2所述的基于深度学习的文字识别方法，其特征在于，所述基于所述文字图像数据集，对所述字符特征提取网络模型进行训练，得到目标文字识别模型，包括：对所述文字图像数据集进行处理，得到输入图像数据集；从所述输入图像数据集中获取训练集；将所述训练集输入到所述字符特征提取网络模型中，进行反向传播迭代训练，当反向传播迭代训练满足迭代终止条件时，训练结束，得到所述目标文字识别模型。5.根据权利要求4...

【专利技术属性】
技术研发人员：任怡然，
申请(专利权)人：虎妞科技杭州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人