基于深度学习的文字识别方法、系统、装置和存储介质制造方法及图纸

技术编号:34448268 阅读:21 留言:0更新日期:2022-08-06 16:45
本发明专利技术公开了一种基于深度学习的文字识别方法、系统、装置和存储介质,方法包括构建字符特征提取网络模型;获取文字图像数据集,基于文字图像数据集,对字符特征提取网络模型进行训练,得到目标文字识别模型;获取待识别文字图像,根据目标文字识别模型,对待识别文字图像进行识别,得到目标识别结果。本发明专利技术实现了待识别文字图像的识别,得到其对应的目标识别结果,待识别文字图像的识别准确率较高,有效解决了传统文字识别技术中英文通用字符识别困难、部分字符存在长尾效应而导致文字识别准确率较低的问题。准确率较低的问题。准确率较低的问题。

【技术实现步骤摘要】
基于深度学习的文字识别方法、系统、装置和存储介质


[0001]本专利技术涉及人工智能和机器视觉
,具体涉及一种基于深度学习的文字识别方法、系统、装置和存储介质。

技术介绍

[0002]随着人工智能和计算机视觉领域的不断发展,文字识别技术(OCR,Optical Character Recognition)被广泛应用于文档识别、车牌十倍、票据识别、证件识别等诸多场景中。
[0003]一般而言,传统的文字识别技术主要包括数据预处理、特征提取和分类识别三部分。然而由于文字文本的多样性和复杂性,例如文字文本呈现的多种语言、颜色、字体、文字大小、文字旋转方向和文字横纵比,再例如文字文本背景(如树叶、栅栏和交通标志)的干扰,再例如文字文本图像成像质量不佳(如分辨率低、图像扭曲、图像模糊和光线差)
……
都会导致传统的文字识别技术存在着不足,包括中英文通用字符识别困难、部分字符存在长尾效应,从而导致文字识别准确率较低。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种基于深度学习的文字识别方法、系统、装置本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的文字识别方法,其特征在于,包括:构建字符特征提取网络模型;获取文字图像数据集,基于所述文字图像数据集,对所述字符特征提取网络模型进行训练,得到目标文字识别模型;获取待识别文字图像,根据所述目标文字识别模型,对所述待识别文字图像进行识别,得到目标识别结果。2.根据权利要求1所述的基于深度学习的文字识别方法,其特征在于,所述构建字符特征提取网络模型,包括:搭建卷积层;所述卷积层用于利用深度卷积神经网络,对输入图像进行深层特征提取,生成深层特征字符向量;搭建循环层;所述循环层用于利用双向循环神经网络,对所述深层特征字符向量进行上下文语义特征计算,生成所述输入图像的目标深层特征向量;搭建转录层;所述转录层用于利用激活函数,对所述目标深层特征向量进行映射,并利用损失函数,对映射后的所述目标深层特征向量进行转换,得到所述输入图像对应的分类向量;形成所述字符特征提取网络模型。3.根据权利要求2所述的基于深度学习的文字识别方法,其特征在于,所述搭建转录层,包括:设计所述激活函数;设计所述损失函数;其中,所述损失函数包括类别平衡损失函数和时序分类损失函数;所述类别平衡损失函数,用于将映射后的所述目标深层特征向量转换成平衡类别字向量;所述时序分类损失函数,用于将所述平衡类别字向转换成所述分类向量。4.根据权利要求2所述的基于深度学习的文字识别方法,其特征在于,所述基于所述文字图像数据集,对所述字符特征提取网络模型进行训练,得到目标文字识别模型,包括:对所述文字图像数据集进行处理,得到输入图像数据集;从所述输入图像数据集中获取训练集;将所述训练集输入到所述字符特征提取网络模型中,进行反向传播迭代训练,当反向传播迭代训练满足迭代终止条件时,训练结束,得到所述目标文字识别模型。5.根据权利要求4...

【专利技术属性】
技术研发人员:任怡然
申请(专利权)人:虎妞科技杭州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1