【技术实现步骤摘要】
基于深度学习的文字识别方法、系统、装置和存储介质
[0001]本专利技术涉及人工智能和机器视觉
,具体涉及一种基于深度学习的文字识别方法、系统、装置和存储介质。
技术介绍
[0002]随着人工智能和计算机视觉领域的不断发展,文字识别技术(OCR,Optical Character Recognition)被广泛应用于文档识别、车牌十倍、票据识别、证件识别等诸多场景中。
[0003]一般而言,传统的文字识别技术主要包括数据预处理、特征提取和分类识别三部分。然而由于文字文本的多样性和复杂性,例如文字文本呈现的多种语言、颜色、字体、文字大小、文字旋转方向和文字横纵比,再例如文字文本背景(如树叶、栅栏和交通标志)的干扰,再例如文字文本图像成像质量不佳(如分辨率低、图像扭曲、图像模糊和光线差)
……
都会导致传统的文字识别技术存在着不足,包括中英文通用字符识别困难、部分字符存在长尾效应,从而导致文字识别准确率较低。
技术实现思路
[0004]有鉴于此,本专利技术提供了一种基于深度学习的文字 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的文字识别方法,其特征在于,包括:构建字符特征提取网络模型;获取文字图像数据集,基于所述文字图像数据集,对所述字符特征提取网络模型进行训练,得到目标文字识别模型;获取待识别文字图像,根据所述目标文字识别模型,对所述待识别文字图像进行识别,得到目标识别结果。2.根据权利要求1所述的基于深度学习的文字识别方法,其特征在于,所述构建字符特征提取网络模型,包括:搭建卷积层;所述卷积层用于利用深度卷积神经网络,对输入图像进行深层特征提取,生成深层特征字符向量;搭建循环层;所述循环层用于利用双向循环神经网络,对所述深层特征字符向量进行上下文语义特征计算,生成所述输入图像的目标深层特征向量;搭建转录层;所述转录层用于利用激活函数,对所述目标深层特征向量进行映射,并利用损失函数,对映射后的所述目标深层特征向量进行转换,得到所述输入图像对应的分类向量;形成所述字符特征提取网络模型。3.根据权利要求2所述的基于深度学习的文字识别方法,其特征在于,所述搭建转录层,包括:设计所述激活函数;设计所述损失函数;其中,所述损失函数包括类别平衡损失函数和时序分类损失函数;所述类别平衡损失函数,用于将映射后的所述目标深层特征向量转换成平衡类别字向量;所述时序分类损失函数,用于将所述平衡类别字向转换成所述分类向量。4.根据权利要求2所述的基于深度学习的文字识别方法,其特征在于,所述基于所述文字图像数据集,对所述字符特征提取网络模型进行训练,得到目标文字识别模型,包括:对所述文字图像数据集进行处理,得到输入图像数据集;从所述输入图像数据集中获取训练集;将所述训练集输入到所述字符特征提取网络模型中,进行反向传播迭代训练,当反向传播迭代训练满足迭代终止条件时,训练结束,得到所述目标文字识别模型。5.根据权利要求4...
【专利技术属性】
技术研发人员:任怡然,
申请(专利权)人:虎妞科技杭州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。